Home Teknologi OpenAI sedang mempratinjau alat audio “Voice Engine” yang dapat mereproduksi suara manusia...

Teknologi

OpenAI sedang mempratinjau alat audio “Voice Engine” yang dapat mereproduksi suara manusia dalam waktu 15 detik audio

31 March 2024

OpenAI membagikan hasil awal dari pengujian fitur yang dapat membacakan kata-kata dengan suara manusia yang meyakinkan, menyoroti batas baru dalam kecerdasan buatan dan meningkatkan ancaman bahaya deepfake. Perusahaan ini membagikan demo awal dan kasus penggunaan dari pratinjau model text-to-speech, yang disebut Voice Engine, yang sejauh ini telah dibagikan kepada sekitar 10 pengembang, kata juru bicara perusahaan. OpenAI telah memutuskan untuk tidak meluncurkan fitur ini secara lebih luas, seperti yang telah diberitahukan kepada jurnalis pada awal bulan ini.

Juru bicara OpenAI mengatakan perusahaan memutuskan untuk mengurangi rilis tersebut setelah menerima masukan dari para pemangku kepentingan seperti pembuat kebijakan, pakar industri, pendidik, dan pencipta. Perusahaan awalnya berencana untuk merilis alat tersebut kepada hingga 100 pengembang melalui proses aplikasi, menurut konferensi pers sebelumnya.

“Kami menyadari bahwa menghasilkan pidato yang terdengar seperti suara masyarakat membawa risiko serius, yang terutama menjadi perhatian utama pada tahun pemilu,” tulis perusahaan itu dalam sebuah posting blog pada hari Jumat. “Kami bekerja sama dengan mitra AS dan internasional dari berbagai kalangan pemerintahan, media, hiburan, pendidikan, masyarakat sipil, dan lainnya untuk memastikan masukan mereka disertakan selama pembangunan.”

Teknik AI lainnya telah digunakan untuk memalsukan suara dalam beberapa konteks. Pada bulan Januari, sebuah panggilan telepon palsu namun terdengar realistis yang mengaku berasal dari Presiden Joe Biden mendorong masyarakat di New Hampshire untuk tidak memberikan suara pada pemilihan pendahuluan – sebuah peristiwa yang meningkatkan kekhawatiran AI menjelang pemilu global yang penting.

Berbeda dengan upaya OpenAI sebelumnya dalam membuat konten audio, Mesin Suara dapat membuat ucapan yang terdengar seperti individu, lengkap dengan irama dan nada spesifiknya sendiri. Yang dibutuhkan perangkat lunak hanyalah rekaman audio seseorang yang berbicara selama 15 detik untuk membuat ulang suaranya.

Saat demo alat tersebut, Bloomberg mendengar klip CEO OpenAI Sam Altman menjelaskan secara singkat teknologi tersebut dengan suara yang tidak dapat dibedakan dari ucapannya yang sebenarnya, namun seluruhnya dihasilkan oleh AI.

“Jika Anda memiliki pengaturan audio yang tepat, pada dasarnya itu adalah suara berkaliber manusia,” kata Jeff Harris, manajer produk di OpenAI. “Ini adalah kualitas artistik yang mengesankan.” Namun, Harris berkata, “Jelas ada banyak sensitivitas keselamatan dalam kemampuan meniru ucapan manusia secara akurat.”

Salah satu mitra pengembangan OpenAI yang saat ini menggunakan alat tersebut, Norman Prince Neuroscience Institute di sistem kesehatan nirlaba Lifespan, menggunakan teknologi tersebut untuk membantu pasien mendapatkan kembali suara mereka. Misalnya, alat tersebut digunakan untuk memulihkan suara seorang pasien muda yang kehilangan kemampuan berbicara dengan jelas karena tumor otak dengan mengulangi pidatonya dari rekaman sebelumnya untuk proyek sekolah, kata postingan blog perusahaan tersebut.

Model ucapan khusus OpenAI juga dapat menerjemahkan suara yang dihasilkannya ke berbagai bahasa. Hal ini membuatnya berguna bagi perusahaan di bidang audio, seperti Spotify Technology SA. Spotify telah menggunakan teknologi ini dalam program beta miliknya untuk menerjemahkan podcast untuk host populer seperti Lex Fridman. OpenAI juga memuji aplikasi lain yang berguna untuk teknologi ini, seperti menciptakan jangkauan suara yang lebih luas untuk konten pendidikan anak-anak.

Dalam program pengujiannya, OpenAI mengharuskan mitranya untuk menyetujui kebijakan penggunaannya, mendapatkan persetujuan penutur asli sebelum menggunakan suaranya, dan mengungkapkan kepada pendengar bahwa suara yang mereka dengar dihasilkan oleh AI. Perusahaan juga memasang tanda air audio yang tidak terdengar untuk memungkinkannya membedakan apakah sebagian audio telah dihasilkan oleh alatnya.

Sebelum memutuskan apakah akan meluncurkan fitur tersebut secara lebih luas, OpenAI mengatakan pihaknya sedang mencari masukan dari pakar eksternal. “Penting bagi orang-orang di seluruh dunia untuk memahami ke mana arah teknologi ini, apakah kita menerapkannya dalam skala besar atau tidak,” kata perusahaan itu dalam sebuah postingan blog.

OpenAI juga menulis bahwa mereka berharap pratinjau perangkat lunaknya akan “merangsang kebutuhan untuk memperkuat ketahanan masyarakat” dalam menghadapi tantangan yang ditimbulkan oleh teknologi AI yang lebih maju. Misalnya, perusahaan meminta bank untuk menghentikan otentikasi suara sebagai langkah keamanan untuk mengakses rekening bank dan informasi sensitif. Hal ini juga berupaya untuk mendidik masyarakat tentang konten AI yang menipu dan mengembangkan lebih lanjut teknik untuk mendeteksi apakah konten audio itu nyata atau dihasilkan oleh AI.

(Cerita ini belum diedit oleh staf NDTV dan dibuat secara otomatis dari feed sindikasi.)

Tautan afiliasi dapat dibuat secara otomatis – lihat Pernyataan Etika kami untuk rinciannya.

Sumber