Tahun ini benar-benar membentuk menjadi tahun kecerdasan buatan open-source. Kami sudah memiliki peluncuran yang sangat mengganggu Deepseek R1 LLM, Yang telah memberi O1 O1 O1 untuk uangnya dan sekarang, memeluk Face membuat kemajuan besar pada proyek yang disebut Open Deep Research, yang bertujuan untuk mereplikasi fungsionalitas fitur penelitian mendalam ChatGPT, menggunakan alat open source.
Bagi mereka yang tidak terbiasa Penelitian mendalam Openaiini adalah alat yang mengambil kueri yang ingin Anda teliti, kemudian keluar dari pembelajaran informasi dari web dan mensintesis laporan yang diteliti dengan baik dengan banyak kutipan. Menurut Huggingface, penelitian mendalam mencakup model bahasa besar dan kerangka kerja agen yang memandu LLM dalam menggunakan alat -alat seperti pencarian web dan mengatur tindakannya dalam langkah -langkah.
Untuk menjaga model bahasa open-source tetap kompetitif, memeluk wajah menjalankan “misi” 24 jam untuk mencoba meniru penelitian mendalam Openai dan menghasilkan beberapa hasil. Komunitas telah menciptakan Open Deep Research, yang berkinerja cukup kompetitif dengan penelitian mendalam, tetapi lebih banyak pekerjaan yang perlu dilakukan, memeluk wajah yang diakui.
Dalam set validasi GAIA, Proyek Riset DEEP Open mencetak 55,15%, sementara Openai's Deep Research mencetak 67,36%yang lebih mengesankan. Menariknya, Face Memeluk melihat kinerja terbaik saat menggunakan agen pengkodean dibandingkan dengan agen reguler yang menggunakan JSON. Saat menggunakan agen standar, skor pada tes GAIA turun menjadi hanya 33%.
Memeluk wajah tersangka bahwa penelitian mendalam Openai mendapatkan dorongan kinerja dari Operator, agen yang baru diumumkan Itu dapat menelusuri web dan berinteraksi dengan halaman web seperti manusia. Untuk mencoba mengisi celah ini, Face Memeluk ingin membangun agen browser web sendiri dan mengatakan itu akan mempekerjakan seorang insinyur penuh waktu untuk membantu mengatasi masalah ini. Ini juga memanggil siapa pun yang tertarik untuk membantu proyek secara sukarela.
Wajah memeluk telah dirilis demo langsung dari Open Deep Research, Tetapi selama pengujian kami, tampaknya ada masalah dengan token terlampaui, jadi kami tidak bisa mencobanya.