Liputan6.com, Jakarta - Startup teknologi asal Indonesia Pacmann telah merilis laporan mengenai percakapan warganet soal isu macet di media sosial Twitter. Diketahui dari laporan tersebut, ada nyaris setengah juta tweets yang memuat kata kunci macet di Twitter.
Twitter sendiri dikenal sebagai salah satu media sosial populer di dunia. Menurut laporan keuangan investor perusahaan, ada sekitar 238 juta pengguna Twitter per Juli 2022
Baca Juga
Di antara ratusan juta pengguna itu, mayoritas (94 persen) menyatakan tertarik dengan kejadian teraktual. Lalu, 85 persen memakai layanan Twitter untuk menonton, membaca, atau mendengarkan berita setidaknya sekali dalam sehari.
Advertisement
Oleh sebab itu, Twitter kerap menjadi medium penyampaian aksi, kampanye, atau inisiatif tertentu untuk menggalang massa atau dukungan. Namun, platform ini juga kerap menjadi alat untuk keperluan individu, termasuk berkeluh kesah.
Untuk menganalisis tweet di Twitter, Pacmann menggunakan machine learning model Named Entity Recognition untuk mendeteksi daerah mana saja yang banyak dikeluhkan warganet soal macet, mulai dari 1 Januari hingga 21 Oktober 2022.
"Model kami berhasil mendeteksi lebih dari 6.000 daerah di Indonesia mulai dari tingkat desa/kelurahan hingga provinsi," tutur CEO dan Chief of Data Scientist Adityo Sanjaya dalam siaran pers yang diterima, Sabtu (5/11/2022).
Hasilnya, berdasarkan laporan ini, Jakarta menjadi daerah yang paling banyak dikeluhkan warganet soal macet dengan mention lebih dari 30.000 kali dari total lebih dari 110.000 tweets yang terdeteksi memuat nama daerah.
"Fakta ini sebetulnya tidak mengagetkan, mengingat Jakarta sebagai pusat pemerintah dan pusat ekonomi memang menjadi magnet tersendiri bagi para perantau dari berbagai kota di Indonesia," tutur pria yang akrab disapa Adit tersebut.
Kemudian, di tempat kedua dan ketiga, ada Bandung dan Yogyakarta dengan frekuensi mention masing-masing sekitar 8.000 dan 4.000. Melengkapi lima besar, ada Bogor dan Bekasi yang masing-masing berjumlah 3.500-an.
Selain 9 daerah di atas, daerah administrasi di tingkat lebih rendah yang juga terdeteksi di tweets tentang macet adalah Ciputat, Cikarang, Manggarai, dan Cileungsi.
Alasan Jakarta jadi Wilayah Paling Macet
Namun terlepas dari urutannya, hasil analisis model Named-Entity Recognition ini relatif selaras dengan laporan The 2021 Global Traffic Scorecard dari INRIX. Dari laporan itu, lima besar kota paling macet di Indonesia adalah Surabaya, Jakarta, Denpasar, Malang, dan Bogor.
Lantas, mengapa hasil analisis Pacmann menempatkan Jakarta di posisi pertama? Menurut Adit, hal ini tidak lepas dari tingkat penetrasi internet di Jakarta, berdasarkan survei Asosiasi Penyelenggara Jasa Internet Indonesia 2022, menjadi yang tertinggi; 83,4 persen.
"Jadi, kami pikir wajar apabila Jakarta berada di posisi pertama di analisis kami, karena memang pengguna di media sosial di Jakarta sangat banyak," tutur Adit.
Selain memakai machine learning model Named-Entity Recognition, Pacmann juga menganalisis kata-kata apa saja yang paling berdekatan dengan melalui representasi semua kata di dalam data menjadi vektor.
Advertisement
Deteksi Asosiasi Kata dengan Word2Vec
Secara sederhana, metode ini menerapkan model jaringan saraf (neural network) yang dirancang untuk memperhitungkan asosiasi kata di dalam data tekstual, seperti tweets.
Diketahui, kata-kata yang paling berdekatan di dalam data yang Pacmann analisis antara lain jam, banjir, jalan, tol, pulang, hujan, mudik, pagi, capek, kerja, arus, mobil, dan berangkat.
"Kalau diperhatikan, ada sekelompok kata-kata yang bertentangga dengan kata macet yang berkaitan erat secara semantik dalam konteks jam berangkat dan pulang kerja," tutur pengajar di Pacmann sekaligus Data Scientist di Valiance, Ghifari Adam.
Ia juga mengungkapkan ada sekelompok kata lain yang berasosiasi dengan situasi kondisional tertentu, seperti banjir, hujan, dan mudik.
Program Pacmann
Sebagai informasi, Named-Entity Recognition dan Word2Vec pada dasarnya adalah penerapan dari Natural Languange Processing (NLP) yang merupakan cabang Artificial Intelligence.
Dengan NLP, kita dapat menganalisis data tekstual yang merupakan data tak terstruktur (unstructured data). Untuk diketahui, di sebagian besar perguruan tinggi di Indonesia, bidang keilmuan tersebut saat ini masih sebatas peminatan atau konsentrasi.
Oleh karena itu, Pacmann mulai menggelar kelas machine learning melalui Pacmann sejak 2017 dan terus berkembang hingga sekarang.
"Untuk mendukung antusiasme teman-teman terhadap kemampuan maupun pemahaman ilmu data modelling yang baik, kami bersama praktisi dan akademisi merancang program-program untuk upskilling dan reskilling di bidang data maupun bidang bisnis dengan kurikulum end-to-end, mendalam, up-to-date, dan sesuai kebutuhan industri saat ini," tutur Ghifari.
Program yang ditawarkan Pacmman pun kini berkembang, tidak hanya fokus pada data saja, melainkan juga bisnis.
Terkini, ada program Skill Upgrader dan Career Upgrader yang Pacmann tawarkan dengan kurikulum AI ML Engineering, Analytics Data Science, Statistics, Product Management dan Business Strategy, serta Business Intelligence dan Growth Hacking.
Selain program pendidikan, Pacmman juga menawarkan jasa konsultan untuk solusi machine learning melalui Valiance. Beberapa portofolio solusi machine learning yang pernah dikerjan Valiance adalah Customer Analytics, Anomaly & Fraud Detection, Natural Language Processing, dan Computer Vision.
(Dam/Ysl)
Advertisement