Kyutai Labs meluncurkan chatbot Moshi AI dengan fitur suara real-time sebagai pesaing GPT-4o

Kyutai Labs pada hari Rabu meluncurkan Moshi AI, chatbot kecerdasan buatan yang merespons secara verbal secara real-time. Perusahaan AI Perancis mengumumkan bahwa seluruh model bahasa audio Moshi dikembangkan sendiri. Itu juga dapat memodifikasi suara untuk mengekspresikan emosi dan merespons dengan gaya bicara yang berbeda. Masyarakat dapat mengakses model AI secara gratis. Saat ini, model AI membatasi percakapan hingga lima menit. Menariknya, OpenAI juga mengumumkan fitur ucapan serupa dengan rilis GPT-4o, namun belum dirilis.

Fitur Moshi AI

Perusahaan Amerika Model AI dikembangkan dalam waktu enam bulan dengan tim beranggotakan delapan orang. Saat memperkenalkan prototipe AI di sebuah acara di Paris, Kyotai Labs mengatakan bahwa Moshi bukanlah asisten AI melainkan prototipe yang dapat digunakan untuk mengembangkan alat untuk berbagai kasus penggunaan. Itu juga membuat chatbot tersedia untuk umum Di SiniPengguna dapat memasukkan email mereka dan bergabung dalam daftar tunggu, namun karyawan Gadgets 360 bisa mendapatkan akses instan ke platform tanpa waktu menunggu.

Antarmuka platform ini sangat sederhana. Terdapat desain AI yang disederhanakan di mana pengguna dapat memeriksa seberapa keras suaranya saat berbicara. Ada kotak teks yang hanya menampilkan tanggapan AI. Kotak lain di dekat bagian atas menampilkan detail teknis seperti durasi audio, latensi, dan audio yang hilang.

Di bagian atas, ada tombol putuskan sambungan. Saat ini durasi panggilan maksimal bisa sampai lima menit. Halaman deskripsi menyoroti bahwa Moshi dapat berpikir, berbicara dan mendengarkan pada saat yang sama untuk memaksimalkan alur percakapan.

Gadgets 360 menemukan bahwa waktu respons sangat rendah, dan AI sering kali merespons secara instan. Namun, ada beberapa kasus di mana penundaan waktu respons bisa melebihi 10-15 detik. Tapi ini mungkin karena beban server yang berat. Namun, terkadang perintah verbal tidak terdengar sama sekali, bahkan setelah tiga perempat pengukur tingkat suara terisi.

Antarmuka Moshi AI
Kredit gambar: Laboratorium Kyotai

Gadgets 360 juga menemukan bahwa model AI dapat merespons dengan suara emosional, dapat berbicara dalam gaya berbeda, dan menggunakan modulasi suara berbeda. Model AI juga terhubung ke Internet dan dapat memperoleh respons terhadap pertanyaan yang memerlukan penelusuran web. Perlu dicatat bahwa chatbot tidak mengizinkan pengiriman pesan teks, dan suara adalah satu-satunya cara untuk berinteraksi dengannya.

Kyutai Labs mengatakan model AI akan bersifat open source. Namun, perusahaan AI tersebut belum menghosting bobot model dan kode di portal. Setelah tersedia, pengguna akan dapat mengunduh dan menginstalnya secara lokal, dan dapat diputar di perangkat offline.

Untuk berita dan ulasan teknologi terkini, ikuti Gadgets 360 terus X, Facebook, Ada apa, benang Dan berita GoogleUntuk video terbaru tentang alat dan teknik, berlangganan saluran kami Saluran YoutubeJika Anda ingin mengetahui segalanya tentang influencer top, ikuti situs web kami Siapa 360 pada Instagram Dan Youtube.

Api Lava Diharapkan menampilkan prosesor MediaTek Dimensity 7050



Sumber