Liputan6.com, Jakarta - Microsoft memamerkan AI/ kecerdasan buatan terbarunya yang mampu meniru suara orang hanya dalam hitungan detik. AI tersebut dinamai sebagai Vall-e, yang mirip dengan algoritme sebelumnya, Dall-e. Dall-e bisa membuat gambar berdasarkan teks.
Mengutip Gizchina, Jumat (13/1/2023), Vall-e mampu menirukan cara berbicara dengan mendengarkan suara orang sungguhan dalam tiga detik. Meski suaranya terdengar seperti suara robot, hasilnya boleh dibilang mengesankan.
Baca Juga
Microsoft menyebutnya model bahasa neural codec. Vall-e dikembangkan atas dasar EnCodec (codec audio menggunakan teknik machine learning) yang dikembangkan oleh Meta pada 2022.
Advertisement
Metode text-to-speech lainnya memperhitungkan bentuk gelombang, namun Vall-e menghasilkan codec audio terpisah dari teks dan audio.
Alhasil, teknologi ini dipakai untuk menganalisis bagaimana suara seseorang. Info tersebut lalu dipecah menjadi bagian-bagian terpisah, yang disebut token, melalui EnCodec.
Pada akhirnya, AI ini menggunakan data pelatihan untuk mencocokkan apa yang 'diketahui' tentang bunyi suara tersebut, jika si AI mengucapkan frasa lain di luar sampel tiga detik.
Vall-e diajarkan memakai pustaka khusus. Pustaka tersebut berisi 60.000 jam pidato bahasa Inggris dari lebih dari 7.000 orang.
Bisa Membahayakan
Pengembang menyarankan, metode ini bisa dipakai untuk aplikasi text-to-speech berkualitas tinggi. Misalnya, bisa memakainya untuk mengedit rekaman ucapan, di mana kata-kata manusia boleh diubah.
Hasilnya, pengguna bisa membuat konten audio, seperti sulih suara untuk buku audio, dan lain-lain.
Meski begitu teknologi semacam itu bisa membawa bahaya tertentu. Pasalnya, cepat atau lambat, bisa saja ada pengguna 'nakal' yang akan menjadikannya sebagai alat untuk pemerasan atau penipuan.
Misalnya, mereka memakai AI untuk membuktikan bahwa ada orang terkenal mengatakan sesuatu yang tidak pernah mereka katakan. Kasus ini ditemui pada deepfake dalam format video.
Advertisement
Robot Bisa Bicara dalam 120 Bahasa
Bicara soal AI, sebelumnya ada sebuah robot AI baru bernama Xoxe yang memiliki kemampuan layaknya manusia. Mengutip Tech Times, Selasa (10/1/2023), robot AI khusus ini mampu mendeteksi kecemasan manusia dan bisa berinteraksi seperti manusia.
Robot AI ultra-realistis ini dikembangkan oleh sebuah perusahaan bernama AI Life. Perusahaan ini berfokus pada penelitian dan pengembangan AI, serta telah menciptakan robot yang sangat cerdas sebagai terobosan baru di bidang kecerdasan buatan.
Robot Xoxe dikembangkan oleh ahli bedah plastik, Dr Sam Khoze, bersama penasihat teknis Profesor Hiroshi Ishiguro. Robot ini dijuluki sebagai robot paling cerdas dan ultra-realistis di dunia.
Menurut AI Life, Xoxe memiliki aktuator wajah canggih yang bisa terlibat dalam percakapan mengenai topik apa pun. Ia juga diklaim mampu memprediksi usia, mengenali bahasa tubuh, hingga merasakan emosi.
Xoxe juga disebut sebagai robot multibahasa karena dapat berkomunikasi dalam 120 bahasa, punya memori jangka panjang, serta mampu mendeteksi talenta. Ia bahkan diklaim punya kemampuan sosial menakjubkan.
Karakternya Dibuat Menyerupai Influencer
Karakter Xoxe dibuat berdasarkan influencer media sosial. Sementara fitur wajahnya dirancang untuk menyerupai kulit manusia. Lengan robot ini juga dimaksudkan untuk bisa bergerak saat sedang berkomunikasi.
Kepada Express.co.uk, Dr. Khoze mengungkap, Xoxe dilatih berdasarkan interaksi antarmanusia di media sosial dan dan rekaman robot sering menarik lebih dari 8.000 views di laman Instagramnya.
Melalui teknologi pengenalan wajah yang dimasukkan ke kameranya, robot Xoxe juga dimaksudkan mengemabngkan kecerdasan emosional yang lebih maju hanya dalam dua bulan.
Meski sudah pintar, kemampuan Xoxe tak berakhir di situ. Robot ini juga bisa menentukan apakah seseorang di hadapannya telah melakukan tindak kriminal. Hal ini memberi keunggulan yang sedikit menyeramkan pada kemampuan luar biasa robot tersebut.
(Tin/Isk)
Advertisement