Artificial Intelligence (AI)
Pertama, yang paling mudah dibedakan. AI atau kecerdasan buatan adalah bidang keilmuan yang mempelajari seputar pembuatan “Intelligent Agent” dalam komputer. Secara singkat, ilmu ini mencari tahu bagaimana membuat komputer yang dapat berperilaku seperti makhluk dengan kecerdasan. Hal tersebut erat kaitannya dengan simulasi proses pengambilan keputusan.
Tentunya perkembangan AI masih sangat jauh dari capaian tersebut. Dengan kemampuan komputasi dan algoritma AI kekinian, hal yang tercapai adalah pembuatan “Rational Agent”, yaitu komputer dengan kemampuan pertimbangan rasional sehingga dapat mengambil keputusan paling optimal dalam satu kasus tertentu. Misal kompor yang dapat menentukan kapan Mi Instan sudah cukup lama diseduh berdasarkan lama waktu dan suhu pemasakan (bakal berguna banget untuk anak kos nih :v). Jadi jangan berharap Jarvis, Ultron, dan Terminator akan muncul dalam waktu dekat. But who knows when :3 (Masyarakat geek internasional sudah mulai mewaspadai hal tersebut)
Perlu digarisbawahi bahwa bidang tersebut sangatlah luas. Mesin apapun yang tidak melakukan sebuah pekerjaan dengan “bodoh” termasuk dalam kategori “Intelligent Agent” dan termasuk dalam bidang keilmuan AI.
Machine Learning (ML)
ML adalah bidang keilmuan yang mempelajari bagaimana membuat program yang dapat menghasilkan pengetahuan baru dari pengetahuan yang sudah ada (disebut experience, atau data) di luar pengetahuan yang “diprogram” secara langsung pada program. Istilah lebih umumnya adalah bagaimana membuat komputer yang dapat belajar dari lingkungan sekitar sehingga memiliki “pengetahuan” yang berkembang. Contoh paling gampang mungkin adalah prediksi kata yang ada di HP kita atau pengenalan wajah pada facebook. Hal tersebut mungkin dilakukan karena program di belakang kedua hal tersebut telah menyusun pengetahuan dari data yang ada, biasanya dalam bentuk sebuah model matematis.
Hal tersebut banyak berhubungan dengan algoritma yang dapat mengekstraksi informasi dari berbagai macam data serta mengenali pola dalam data (pattern recognition), sehingga bidang tersebut sangat erat kaitannya dengan statistika. Namun secara garis besar, segala sesuatu yang melibatkan proses induksi pengetahuan dari data termasuk dalam bidang keilmuan ML.
ML ini merupakan bidang keilmuan computer science yang paling sering salah dimengerti. Selain konotasi negatif dalam Indonesia dengan istilah “ML”, namun ML tersebut juga merupakan bidang dengan ranah aplikatif yang sangat luas dalam banyak sekali bidang keilmuan. Hampir seluruh bidang yang berhubungan dengan “komputasi cerdas” membutuhkan adanya pengetahuan dalam sebuah program, dan dalam tahap ini ML sangat berperan. Jika AI fokus pada membuat komputer yang cerdas, maka untuk mencapai kecerdasan tersebut digunakan ML. Bahkan sebagian besar ilmu yang dipelajari dalam AI maupun DM adalah ML itu sendiri. Hal tersebut yang banyak menimbulkan ambiguitas bidang antara ketiga hal tersebut.
Data Mining (DM)
DM adalah sebuah bidang yang banyak berkembang dari ML, namun berbeda secara tujuan. Jika ML fokus pada membuat program yang dapat belajar, DM fokus pada memanfaatkan program untuk membantu manusia belajar dari data. DM dilakukan oleh seseorang, dalam kasus tertentu, pada dataset tertentu, dengan sebuah tujuan tertentu. Jika kedua bidang sebelumnya fokus pada programnya, DM adalah ilmu praktis yang fokus pada manusianya.
Pada sebagian besar kasus, DM digunakan untuk menghasilkan “insights” dari data yang ada, sehingga dapat mendatangkan pengetahuan baru. Hal tersebut lebih banyak digunakan dalam kasus praktis seperti dalam proses pengambilan keputusan sebuah perusahaan. Sebagai contoh, dengan DM, sebuah perusahaan dapat mengetahui informasi detil terkait segmen konsumen yang banyak membeli produk mereka. Hal tersebut kemudian akan digunakan dalam menentukan strategi perusahaan kedepannya.
Istilah DM sendiri sebenarnya adalah sebuah salah kaprah. DM sendiri hanyalah satu langkah dalam proses yang lebih besar yang dikenal sebagai Knowledge Discovery from Database (KDD) atau sekarang lebih banyak dikenal dengan istilah Data Science (DS). Dengan berkembangnya kemampuan komputasi komputer dan bertambahnya jumlah data di dunia secara eksponensial, sekarang Data Scientist menjadi salah satu pekerjaan paling dicari di dunia karena permintaan yang sangat banyak, namun persediaan tenaga ahli yang sedikit. Dari fenomena tersebut pula muncul dua bidang khusus baru, yaitu Big Data yang berasal dari DM, dan Deep Learning yang berasal dari ML.
Data Scientist
Seorang data scientist bertanggung jawab membersihkan, memproses, dan mengolah data besar yang sudah dikumpulkan oleh data engineer di suatu perusahaan. Data scientist juga tak jarang harus melakukan eksperimen untuk membuktikan dan memberikan saran yang paling tepat untuk perkembangan sebuah organisasi, perusahaan, dan badan usaha.
Dalam pekerjaan sehari-hari, data scientist akan sering berhadapan dengan pertanyaan seperti “berapa banyak jenis pengguna yang dimiliki oleh perusahaan?” dan “bisakah menciptakan model yang bisa memprediksi suatu produk yang akan laris jika dijual untuk target pasar tertentu?”
Pada intinya, pekerjaan sebagai data scientist adalah bagaimana kamu bisa menghasilkan suatu kesimpulan yang dapat dicerna dan diterima oleh semuanya, berdasar dari kumpulan data besar yang sudah ada. Setiap hari, data scientist berhadapan dengan program olah data seperti SQL dan Phyton. Setidaknya, kamu harus menguasai bidang pemrogaman data, komunikasi, matematika, statistik, dan eknomi.
Data Analyst
Profesi data analyst mengharuskanmu berhadapan dengan banyak data untuk dibersihkan, dianalisis, dan dibuatkan visualisasinya. Tugas seorang data analyst adalah mencari insight untuk memajukan bisnis dari berbagai aspek, lalu kemudian diberikan pada data engineer. Data analyst juga bertanggungjawab untuk mengolah bahan yang diberikan untuk membuat eksperimen dan menentukan strategi bisnis lanjutan. Hari-harimu mungkin akan dihabiskan dengan visualisasi data yang menjadi penghubung tim pemasaran, tim penjualan, tim teknis, dan strategi bisnis.
Data analyst juga bertanggung jawab menyelesaikan pertanyaan seperti “bagaimana cara kami menjelaskan kepada manajemen bahwa kenaikan biaya memengaruhi jumlah konsumen?” dan “apa yang mendorong pertumbuhan bisnis?” Untuk menyelesaikan pekerjaan sehari-hari, data analyst akan bekerja dengan program Excel, Tableau, dan SQL. Kamu harus menguasai istilah bisnis dan tools yang digunakan untuk membuat grafik/infografik.
Data engineer
Data engineer bertugas untuk mengembangkan dan membuat desain arsitektur manajemen data dan memonitor infrastrukturnya di dalam sebuah perusahaan. Kamu akan mengelola jalur data untuk perusahaan yang menangani data dalam jumlah besar. Kamu juga harus memastikan bahwa data bisa dikumpulkan dan diambil secara efisien dari sumber ketika dibutuhkan, dibersihkan dan diproses. Tujuannya adalah untuk membangun dan mengoptimalkan sistem perusahaan yang memungkinkan bagi data analyst dan data scientist menyelesaikan pekerjaan mereka. Kamu harus memiliki keahlian di bidang programming, big data, dan matematika.
Sebagai seorang data engineer, kamu akan menggunakan program seperti NoSQL, Hadoop, dan Phyton. Kamu juga harus menguasai Databases, SQL, ETL Tools, Pipeline, shell script, dan basic programming. Data engineer juga harus mempunyai keahlian khusus di bidang programming, matematika, dan big data.
Baik itu data scientist, data analyst, ataupun data engineer, ketiga pekerjaan tersebut masih berhubungan dan saling terkait. Data analyst dan data scientist tidak akan bisa bekerja tanpa data engineer. Sedangkan data engineer juga tidak akan maksimal kerjanya tanpa data analyst dan data scientist.
Business Intelligence
Business Intelligence (BI) disebut juga Intelijensi Bisnis adalah istilah yang mengacu pada sistem, aplikasi dan teknologi yang digunakan untuk mengumpulkan data dari berbagai sumber, diolah dan ditampilkan dalam bentuk informasi yang biasanya berupa summary yang mudah dibaca, komprehensif dan akurat yang digunakan untuk mengukur dan menganalisa juga untuk memonitor operasional dalam instansi atau perusahaan dengan tujuan membantu para pengambil keputusan (manajemen) agar dapat mengambil keputusan yang lebih efektif.
BI dapat membantu manajemen dalam melakukan monitor terhadap kondisi perusahaannya, dengan memberikan informasi tentang data baik historikal maupun data saat ini baru kemudian data ini digunakan untuk analisa masalah dan perencanaan ke depannya.
Data adalah elemen terpenting dalam BI, Data bisa disimpan diberbagai tempat dengan berbagai format, bisa berupa text file, csv, xml, doc, excel di PC atau Laptop maupun Database di Server. Karena BI bersumber pada segala jenis data, di level perusahaan BI biasanya bersumber pada Database yang dapat menampung data yang sangat besar atau biasa disebut juga Datawarehouse( kumpulan data historis yang tersimpan dalam tempat penyimpanan elektronik atau database biasanya diakses hanya untuk dibaca (read-only) dan dapat menampung data yang sangat besar).
Sekian pembahasan kali ini tentang istilah-istilah dalam dunia Pengolahan Data, semoga membantu.
Tidak ada komentar:
Posting Komentar