Salah satu dampak dari revolusi teknologi yang terjadi di awal abad ke 21 adalah melimpahnya jumlah data. Berbeda dengan era sebelumnya; dimana memperoleh data itu sendiri membutuhkan usaha dan biaya yang tidak murah; kini data begitu melimpah di sekitar kita yang membuat kita menjadi “kewalahan”. Isu saat ini adalah dari begitu banyak data; insight apa yang dapat diperoleh yang relevan dan bernilai tinggi bagi bisnis.

Dahulu, kita harus melakukan survey-studi secara khusus untuk memperoleh data yang akan memeberikan gambaran komprehensif mengenai minat dan tentunya kemampuan membeli produk. Saat ini, gambaran tersebut “sebenarnya” telah tersedia dengan menganalisa pola perilaku di internet. Semakin banyak orang yang melakukan berbagai aktivitas di internet baik yang bersifat pribadi maupun bisnis-profesional. Platform sosial seperti Instagram, Face Book, Twitter yang memuat posting ekpresi individu dengan jelas menunjukkan kepribadian baik yang bersifat personal maupun social. Platform search engine seperti google memiliki fitur google trend yang menunjukkan topik apa yang sedang menjadi perhatian; banyak dicari saat ini.

Platform ecommerce seperti Bukalapak, GoTo dan Shopee memberikan gambaran karakter serta preferensi komersial individu. Komisi Big Data AS (2015) memperkirakan 50% data yang ada saat ini telah bersifat digital dan berada di internet; sekitar 80% dari data tersebut meemiliki karakater tidak terstruktur seperti gambar, email, searching terms, video dan activity log. Dapat dibayangkan; nilai seperti apa yang dapat diperoleh ketika data-data dari ketiga platform ini digabungkan. Kita akan memperoleh gambaran yang lengkap mengenai pasar dan konsumen individual; yang tentu memiliki nilai tinggi jika dapat diolah dengan “tepat”.

Kata “tepat” memiliki makna tepat olah dan waktu yang tepat. Tepat oleh berarti menggunakan peralatan analisa yang sesuai; sedangkan tepat waktu berarti insight tersedia pada waktu yang diperlukan. Perangkat analisa bisa bersifat sederhana-deskriptif tapi dapat juga bersifat kompleks seperti model prediksi. Kebutuhan dapat bersifat mendesak; dapat juga memiliki waktu yang memadai. Dimasa lalu ini sulit dilakukan karena terbatasnya “computing power”.

Dalam satu hari saja; akan ada jutaaan posting di platform media social yang perlu dikombinasikan dengan transaksi di platform ecommerce yang juga dapat mencapai jutaan dalam satu hari. Ini adalah suatu contoh Big Data; suatu istilah teknis populer merujuk kepada suatu database yang memiliki ukuran luar biasa besarnya.

Situs Tech.Jury.net memperkirakan pada tahun 2020 terdapat 4.7 Milyar pengguna aktif internet di dunia yang menghasilkan 18 quintillion; juta triliun (18 x 1018) byte data per hari. Perkembangan teknologi dibidang pengolahan data juga tidak kalah mencengangkan; biaya penyimpanan 1 Terabyte data saat ini telah turun kurang dari 0.1 USD; tidak sampai 1/500 biaya awal tahun 2000 an yang lebih dari USD 50 per Terabyte (Reinsel, Gantz and Rydning ,2017). Computing power berkembang mengikuti hukum Moore (1965): kemampuan komputasi berlipat dua setiap tahun; sehingga dapat dikatakan computer saat ini juga memiliki kemampuan sekitar 1 juta kali dibandingkan awal tahun 2000.

Hal Ini belum memperhitungkan keberadaan Cloud Computing; dimana kita bisa menyewa gudang data (storage) dan kemampuan proses komputasi milik pihak lain. Para Ilmuan dan praktisi ilmu computer saat ini terus mengeksplorasi apa yang dapat dilakukan oleh kemampuan komputasi se “fantastis” ini.

Eksplorasi tersebut telah melahirkan Data Science. Data Science adalah suatu ilmu multidisiplin yang mempelajari dan mengembangkan berbagai aspek mengenai data seperti akuisisi, rekonsiliasi, penyimpanan , analisa, pelaporan dan komunikasi (Bell, Hey dan Szalay, 2009). Disiplin ilmu ini lahir untuk menangani era “banjir bandang” data (data deluge) yang telah tiba. Disiplin ilmu ini memadukan prinsip yang relevan dari ilmu yang sudah established seperti matematika, statistika, system informasi, data base, Teknik computer dan tentu saja ilmu bisnis.

Aplikasi data science telah dilakukan secara masif tidak hanya oleh korporasi tetapi juga pemerintahan diberbagai penjuru dunia terutama untuk aspek governance dan risk management seperti credit scoring dan surveillance (Buchanan, 20219).

Suatu ilustrasi yang menarik mengenai aplikasi Big Data pada pasar modal diberikan oleh Arratia et al (2021). Mereka melakukan studi sentiment pelaku pasar dengan melakukan analisa terhadap banyak jenis informasi yang beredar di internet seperti term searching, text analysis laporan analis pasar, posting di sosial media (komentar dan image), respon manajemen dan serta transaksi-transaksi komersial. Mereka menemukan berbagai item tersebut dapat digunakan untuk mengukur sentimen pasar serta memiliki daya prediksi terhadap imbal hasil (return) saham.

Uraian diatas menunjukkan bahwa akuisisi, Pengolahan, analisa dan komunikasi data mungkin tidak lagi menjadi isu dari aspek teknis-komersial. Praktisi bisnis telah menjadikan data science sebagai suatu default skill. Yang masih menjadi isu utama dan perdebatan hangat mengenai data science adalah privacy, ethics dan keamanan.

Dinegara-negara maju yang menjunjung tinggi nilai-nilai individualisme dan kebebasan; berbagai reaksi keresahan, keberatan bahkan penolakan telah timbul akibat penggunaan data-data yang “dimaksudkan” bersifat pribadi untuk keperntingan komersial. Kelleher dan Tierney (2018) menjelaskan kelahiran Big Data dan Data Science telah menimbulkan kompleksitas yang timbul dari ambiguitas data.

Sebagai contoh ketika kita menguplod gambar-foto suatu aktivitas pada media sosial apakah hal tersebut merupakan suatu data public sehingga bebas dimanfaatkan oleh semua orang? Selanjutnya apakah menggunakan informasi-informasi tersebut untuk tujuan komersial (misalnya promosi) apakah memerlukan persetujuan (consent) dari pemilik data; yang juga merupakan target promosi. Selanjutnya promosi tersebut dikirimkan ke alamat email atau messenger apps; yang tentu saja merupakan domain pribadi. Tidak semua orang senang memperoleh personalized ad pada email pribadinya.

Lembaga think tank Cybersource (2019) melaporkan adanya tendensi peningkatan aktivitas fraud dalam transaksi ecommerce. Terdapat banyak modus fraud dalam ecommerce seperti pembajakan akun, reshipping dan friendly fraud. Masih banyak modus fraud lainnya; dan diperkirakan akan muncul varian baru. Tingginya intensitas fraud di ecommerce ini tidak terlepas dari masih cukup longgarnya prosedur dan manajemen risiko. Kemudahan membuat akun ecommerce; ironis nya justru membuka ruang bagi terjadinya fraud.

Tingginyac aktivitas hacker yang mencoba untuk membobol system platform juga mengindikasikan perlunya perhatian lebih pada aspek cybersecurity. Hal ini perlu menjadi perhatian Bersama terlebih mengingat mobile payment telah mencapai 64% dari transaksi ecommerce.

Era ekonomi baru telah membuka pintu bagi Data Science untuk berperan dominan dalam kehidupan bisnis. Nilai ekonomi yang dihasilkan sangat besar dengan tren kedepan yang solid. Namun demikian aplikasi dan pengembangan harus tetap mengedepankan dimensi etika, privacy dan keamanan.

Tulisan ini telah dipublish pada Opini CNBC Indonesia (https://www.cnbcindonesia.com/opini/20211027154020-14-286970/data-science-dan-dunia-bisnis)