Vall-e si AI Microsoft Cuma Butuh 3 Detik Buat Tiru Suara Orang

Microsoft mengembangkan AI bernama Vall-e yang dapat meniru suara orang hanya dalam tiga detik.

oleh Agustin Setyo Wardani diperbarui 13 Jan 2023, 14:00 WIB
Diterbitkan 13 Jan 2023, 14:00 WIB
Ilustrasi Artificial Intelligence (AI), Machine Learning (ML)
Ilustrasi Artificial Intelligence (AI), Machine Learning (ML). Kredit: Gerd Altmann from Pixabay

Liputan6.com, Jakarta - Microsoft memamerkan AI/ kecerdasan buatan terbarunya yang mampu meniru suara orang hanya dalam hitungan detik. AI tersebut dinamai sebagai Vall-e, yang mirip dengan algoritme sebelumnya, Dall-e. Dall-e bisa membuat gambar berdasarkan teks.

Mengutip Gizchina, Jumat (13/1/2023), Vall-e mampu menirukan cara berbicara dengan mendengarkan suara orang sungguhan dalam tiga detik. Meski suaranya terdengar seperti suara robot, hasilnya boleh dibilang mengesankan.

Microsoft menyebutnya model bahasa neural codec. Vall-e dikembangkan atas dasar EnCodec (codec audio menggunakan teknik machine learning) yang dikembangkan oleh Meta pada 2022.

Metode text-to-speech lainnya memperhitungkan bentuk gelombang, namun Vall-e menghasilkan codec audio terpisah dari teks dan audio.

Alhasil, teknologi ini dipakai untuk menganalisis bagaimana suara seseorang. Info tersebut lalu dipecah menjadi bagian-bagian terpisah, yang disebut token, melalui EnCodec.

Pada akhirnya, AI ini menggunakan data pelatihan untuk mencocokkan apa yang 'diketahui' tentang bunyi suara tersebut, jika si AI mengucapkan frasa lain di luar sampel tiga detik.

Vall-e diajarkan memakai pustaka khusus. Pustaka tersebut berisi 60.000 jam pidato bahasa Inggris dari lebih dari 7.000 orang.

Bisa Membahayakan

Bukan Manusia, Partai Politik di Denmark Ini Dipimpin oleh Teknologi AI
Bukan Manusia, Partai Politik di Denmark Ini Dipimpin oleh Teknologi AI (Sumber: Oddity Central)

Pengembang menyarankan, metode ini bisa dipakai untuk aplikasi text-to-speech berkualitas tinggi. Misalnya, bisa memakainya untuk mengedit rekaman ucapan, di mana kata-kata manusia boleh diubah.

Hasilnya, pengguna bisa membuat konten audio, seperti sulih suara untuk buku audio, dan lain-lain.

Meski begitu teknologi semacam itu bisa membawa bahaya tertentu. Pasalnya, cepat atau lambat, bisa saja ada pengguna 'nakal' yang akan menjadikannya sebagai alat untuk pemerasan atau penipuan.

Misalnya, mereka memakai AI untuk membuktikan bahwa ada orang terkenal mengatakan sesuatu yang tidak pernah mereka katakan. Kasus ini ditemui pada deepfake dalam format video.

Robot Bisa Bicara dalam 120 Bahasa

Robot Xoxe yang bisa berinteraksi dengan manusia dalam 120 bahasa
Robot Xoxe yang bisa berinteraksi dengan manusia dalam 120 bahasa (Foto: AI Life)

Bicara soal AI, sebelumnya ada sebuah robot AI baru bernama Xoxe yang memiliki kemampuan layaknya manusia. Mengutip Tech Times, Selasa (10/1/2023), robot AI khusus ini mampu mendeteksi kecemasan manusia dan bisa berinteraksi seperti manusia.

Robot AI ultra-realistis ini dikembangkan oleh sebuah perusahaan bernama AI Life. Perusahaan ini berfokus pada penelitian dan pengembangan AI, serta telah menciptakan robot yang sangat cerdas sebagai terobosan baru di bidang kecerdasan buatan.

Robot Xoxe dikembangkan oleh ahli bedah plastik, Dr Sam Khoze, bersama penasihat teknis Profesor Hiroshi Ishiguro. Robot ini dijuluki sebagai robot paling cerdas dan ultra-realistis di dunia.

Menurut AI Life, Xoxe memiliki aktuator wajah canggih yang bisa terlibat dalam percakapan mengenai topik apa pun. Ia juga diklaim mampu memprediksi usia, mengenali bahasa tubuh, hingga merasakan emosi.

Xoxe juga disebut sebagai robot multibahasa karena dapat berkomunikasi dalam 120 bahasa, punya memori jangka panjang, serta mampu mendeteksi talenta. Ia bahkan diklaim punya kemampuan sosial menakjubkan.

Karakternya Dibuat Menyerupai Influencer

Ilustrasi Machine Learning, Deep Learning, Artificial Intelligence, Kecerdasan Buatan
Ilustrasi Machine Learning, Deep Learning, Artificial Intelligence, Kecerdasan Buatan. Kredit: Pixabay/Mohamed Hassan

Karakter Xoxe dibuat berdasarkan influencer media sosial. Sementara fitur wajahnya dirancang untuk menyerupai kulit manusia. Lengan robot ini juga dimaksudkan untuk bisa bergerak saat sedang berkomunikasi.

Kepada Express.co.uk, Dr. Khoze mengungkap, Xoxe dilatih berdasarkan interaksi antarmanusia di media sosial dan dan rekaman robot sering menarik lebih dari 8.000 views di laman Instagramnya.

Melalui teknologi pengenalan wajah yang dimasukkan ke kameranya, robot Xoxe juga dimaksudkan mengemabngkan kecerdasan emosional yang lebih maju hanya dalam dua bulan.

Meski sudah pintar, kemampuan Xoxe tak berakhir di situ. Robot ini juga bisa menentukan apakah seseorang di hadapannya telah melakukan tindak kriminal. Hal ini memberi keunggulan yang sedikit menyeramkan pada kemampuan luar biasa robot tersebut.

(Tin/Isk)

Infografis Modus Robot Trading Net89, Sudah Ada 8 Tersangka Kasus Investasi Bodong
Infografis Modus Robot Trading Net89, Sudah Ada 8 Tersangka Kasus Investasi Bodong (Liputan6.com/Triyasni)
Lanjutkan Membaca ↓
Loading

Video Pilihan Hari Ini

Video Terkini

POPULER

Berita Terkini Selengkapnya