Liputan6.com, Jakarta - Sebuah investigasi terbaru dari Proof News mengungkap skandal besar dalam industri teknologi. Beberapa perusahaan raksasa teknologi diduga menggunakan data tanpa izin untuk melatih model kecerdasan buatan (AI) mereka.
Dataset yang menjadi sorotan berisi transkrip sekitar 173.000 video YouTube yang diambil dari 48.000 saluran.
Baca Juga
Data ini dikumpulkan oleh organisasi nirlaba bernama EleutherAI dan digunakan oleh perusahaan-perusahaan terkemuka seperti Apple, NVIDIA, dan Anthropic.
Advertisement
Temuan ini membuka sisi gelap AI, di mana teknologi canggih tersebut dibangun di atas fondasi data yang dicuri dari para kreator tanpa izin atau kompensasi.
Meskipun dataset itu tidak mencakup video atau gambar, namun berisi transkrip dari sejumlah besar konten, termasuk milik kreator populer seperti Marques Brownlee dan MrBeast, serta media-media besar seperti The New York Times, BBC, dan ABC News. Bahkan, Engadget juga menjadi korban dalam kasus ini.
Diwartakan Engadget, Rabu (17/7/2024), Marques Brownlee mengungkapkan kemarahannya melalui platform X.
Ia menyebut salah satu perusahaan pemasok data untuk AI Apple telah mengambil banyak data, termasuk transkrip videonya. Ia memprediksi masalah ini akan terus berulang dalam waktu yang lama.
Tanggapan Induk YouTube: Google
Google, melalui juru bicaranya, menegaskan kembali pernyataan CEO YouTube, Neal Mohan, bahwa penggunaan data YouTube untuk melatih AI merupakan pelanggaran terhadap syarat layanan platform tersebut.
Namun, Apple, NVIDIA, Anthropic, dan EleutherAI belum memberikan tanggapan atas tuduhan serius ini.
Kurangnya transparansi mengenai data pelatihan menjadi masalah penting dalam industri AI. Baru-baru ini, para seniman dan fotografer mengecam Apple karena tidak mengungkapkan sumber data untuk Apple Intelligence, teknologi AI generatif yang akan hadir di jutaan perangkat Apple tahun ini.
YouTube, sebagai gudang video terbesar dunia, menjadi sasaran empuk bagi perusahaan-perusahaan yang ingin melatih model AI mereka. Platform ini tidak hanya menyediakan transkrip, tetapi juga audio, video, dan gambar.
Advertisement
OpenAI Menghindari Pertanyaan
CEO OpenAI, Mira Murati, menghindari pertanyaan tentang penggunaan video YouTube untuk melatih Sora, alat generasi video AI terbaru mereka.
Sementara CEO Alphabet (induk Google), Sundar Pichai, juga sejalan dengan pernyataan YouTube tentang pelanggaran syarat layanan.
Untuk memeriksa apakah transkrip video YouTube atau saluran favorit kamu termasuk dalam dataset tersebut, kamu dapat mengunjungi alat pencarian yang disediakan oleh Proof News.
Infografis 4 Rekomendasi Chatbot AI Terbaik. (Liputan6.com/Gotri/Abdillah)
Advertisement