Home » Cloud Big Data » Cloud Big Data Concepts

Cloud Big Data Concepts

Cyber System untuk Pengolahan Data Besar

Penulis : Dr. Mardhani Riasetiawan

 

Data yang melibatkan kebencanaan, transportasi, kesehatan atau isu pada SDGs memiliki potensi mengumpulkan, mengelola dan memproses data dengan skala yang besar. Data dapat memiliki karakteristik dengan pola kecil tapi berjumlah sangat banyak, sehingga secara jumlah akan berjumlah sangat besar. Hal ini lazim ditemui pada data yang dihasilkan oleh perangkat IoT. Data juga dapat berupa sedikit dalam jumlah tetapi secara volume sangat besar. Karakteristik ini yang kemudian disebut sebagai Volume.

Data dapat berupa berbagai jenis tipe dan variasi file, dapat berupa text, file, image, pdf, sql dan bentuk lain. Data tersebut bervariasi dengan tipenya dikarenakan aplikasi atau tools yang digunakan untuk menghasilkan data tersebut. Perbedaan jenis dan tipe ini menyebabkan data tidak dapat langsung diproses dengan sendirinya, akan tetapi membutuhkan penanganan tertentu dan perubahan format yang dapat diolah secara bersama. Karakteristik ini yang kemudian disebut sebagai Variety.

Data yang dikelola dalam pengolahan data besar datang dengan dua cara yaitu stream atau real time dan batch atau berkelompok. Data stream/real time datang dengan urutan yang kerap dan biasanya dengan pola yang teratur berurutan. Meski bersifat real time, data yang terkirim tetap mendapatkan delay waktu karena proses transmisi datanya. Sedangkan data batch dikirimkan dengan melakukan pengumpulan data dengan sekuen yang diatur dahulu kemudian dikirimkan secara teratur. Karakteristik ini disebut sebagai Velocity.

Veracity Data juga memiliki sifat tertentu dari sumber datanya, bisa bersifat terpercaya (valid) atau tidak terpercaya. Hal ini disebabkan karena Data memiliki signature yang memastikan dirinya memiliki veracity yang cukup. Hal ini menyebabkan data perlu dikonfirmasikan sebelum dilakukan pemrosesan lebih lanjut, dan menghindari terjadinya Garbage In Garbage Out (GIGO).

Data dapat diolah menjadi informasi yang berguna untuk kepentingan pengambilan keputusan dan masa depan. Informasi yang dikembangkan dan dikombinasikan dapat menjadi pengetahuan untuk membantu menyelesaikan permasalahan. Data menjadi berharga ketika diolah dan menghasilkan informasi yang berguna, yang kemudian disebut sebagai Value.

Karakteristik Big Data yang berupa Volume, Variety, Veracity, Velocity dan Value (5V) memiliki konsekuensi format data yang tidak terstruktur, yang menyebabkan proses pengolahan data tidak bisa dilakukan dengan cara biasa (Input → Proses → Output). Terlebih jika yang dibutuhkan adalah pengolahan data yang bersifat cepat dan akurat. Teknologi Big Data sebagai pengolahan data besar memiliki potensi untuk menyelesaikan permasalahan ini dan dapat dikembangkan dengan lebih terbuka dan luas.


Leave a comment