Istilah-Istilah yang Terdapat Pada Big Data

Bagi orang yang memiliki latar belakang IT tentunya sudah tidak asing dengan istilah Big Data. Namun, bagi orang yang tidak memiliki latar IT, bisa saja Big Data ini ada dalam kehidupan sehari-hari namun tidak disadari. Big Data merupakan istilah yang muncul pada tahun 2000-an yang dikenalkan oleh seorang ahli analis industri bernama  Doug Laney. Big Data adalah kumpulan data dalam jumlah yang besar, campuran data yang kompleks, yang ditangani, dianalisis, diekstrak informasinya secara sistematis dengan menggunakan software aplikasi pemrosesan data tradisional.

Kehadiran Big Data memiliki manfaat untuk mempermudah pekerjaan. Big Data bisa bermanfaat di hampir semua bidang diantaranya adalah dalam dunia bisnis, pemerintahan dan kesehatan. Big Data memiliki peran penting untuk automatisasi dan pengembangan Artificial Inteligence. Di dalam Big Data terdapat beberapa istilah yang akan ditemukan diantaranya adalah

Big Data Analytic

Big Data Analytic adalah penggunaan teknik analitik tingkat lanjut terhadap kumpulan data yang besar dan beragam yang mencakup data terstruktur, data semi terstruktur dan data tidak terstruktur yang diambil dari berbagai sumber dan berbagai ukuran dari terabyte hingga zettabyte.

Algoritma

Dalam dunia ilmu komputer, algoritma adalah prosedur perhitungan atau formula matematika atau statistical yang digunakan untuk pemrosesan analisis data.

Data Lake, Data Warehouse, Data Mining

Data lake adalah sistem atau tempat penyimpanan data yang disimpan dalam formula aslinya atau format mentah yang biasanya berupa gumpalan objek atau file. Data lake biasanya merupakan penyimpanan tunggal data termasuk salinan mentah dari data sistem sumber, data sensor, data sosial, dll.  Data lake dapat mencakup data terstruktur dari database relasional (baris dan kolom), data semi-terstruktur (CSV, log, XML, JSON), data tidak terstruktur (email, dokumen, PDF) dan data biner (gambar, audio, video). Sedangkan, Data Warehouse adalah gudang data (DW atau DWH), juga dikenal sebagai gudang data perusahaan (EDW), adalah sistem yang digunakan untuk pelaporan dan analisis data, dan dianggap sebagai komponen inti dari intelijen bisnis. Lalu, Data Mining adalah adalah proses menemukan anomali, pola, dan korelasi dalam kumpulan data besar untuk memprediksi hasil dengan proses yang melibatkan metode di persimpangan pembelajaran mesin, statistik, dan sistem basis data. Data mining adalah subbidang interdisipliner ilmu komputer dan statistik dengan tujuan keseluruhan untuk mengekstrak informasi (dengan metode cerdas) dari kumpulan data dan mengubah informasi menjadi struktur yang dapat dipahami untuk digunakan lebih lanjut. Anda dapat menggunakan informasi ini untuk meningkatkan pendapatan, memotong biaya, meningkatkan hubungan pelanggan, mengurangi risiko, dan banyak lagi.

Data Scientist

Data scientist adalah sebutan untuk orang yang mengatur data besar, mengumpulkan dan menganalisis kumpulan besar data terstruktur dan tidak terstruktur. Peran data scientist menggabungkan ilmu komputer, statistik, dan matematika. Mereka menganalisis, memproses, dan memodelkan data kemudian menafsirkan hasilnya untuk membuat rencana yang dapat ditindaklanjuti untuk perusahaan dan organisasi lain.

Machine Learning

Machine learning adalah adalah konsep bahwa program komputer dapat belajar dan beradaptasi dengan data baru tanpa campur tangan manusia. Machine learning ini merupakan bidang kecerdasan buatan (Artificial Intelligence) yang membuat algoritme internal komputer tetap mutakhir terlepas dari perubahan ekonomi dunia. Machine learning digunakan di mesin pencari internet, filter email untuk memilah spam, situs web untuk membuat rekomendasi yang dipersonalisasi, perangkat lunak perbankan untuk mendeteksi transaksi yang tidak biasa, dan banyak aplikasi di ponsel kita seperti pengenalan suara (voice recognition).

In-Memory Computing

In-Memory Computing adalah menggunakan jenis perangkat lunak middleware yang memungkinkan seseorang untuk menyimpan data dalam RAM, di sekumpulan komputer, dan memprosesnya secara paralel. Pertimbangkan set data operasional yang biasanya disimpan dalam database terpusat yang sekarang dapat Anda simpan dalam RAM “terhubung” di banyak komputer.

Penggunaan Big Data sudah banyak digunakan untuk perkembangan teknologi saat ini. Big Data sangatlah penting karena memiliki banyak manfaat. Sebagaimana sudah disebutkan di atas, Big Data dapat membantu beberapa bidang pekerjaan yang hasilnya bisa menjadi bahan evaluasi sebuah pekerjaan atau produk. Dari Big Data akan didapatkan penyebab suatu masalah secara real time juga dapat mengurangi waktu, biaya dan meningkatkan performa suatu pekerjaan maupun produk aplikasi.  

Credit gambar: https://www.trainingperbankan.com/training-perbankan/training-big-data/training-big-data-analytic/

Leave a Reply

Your email address will not be published. Required fields are marked *