Pesan Gate News, 17 April — Google mengungkap Gemini 3.1 Flash TTS, model text-to-speech canggih dengan fitur ekspresi emosional dan kontrol yang ditingkatkan, pada 15 April. Model baru akan diluncurkan secara bertahap melalui API pengembang, Vertex AI untuk perusahaan, serta alat kolaborasi.
Kemampuan inti model ini mencakup tag audio berbasis bahasa alami untuk penyetelan kecepatan, intonasi, dan emosi, ditambah “Director Mode” untuk menentukan adegan dan peran karakter guna menghasilkan keluaran suara yang lebih bernuansa. Fitur multi-pembicara memungkinkan pembuatan dialog secara simultan, sehingga menghasilkan alur percakapan yang lebih natural dan cocok untuk podcast, konten audio, serta asisten AI. Model ini mendukung lebih dari 70 bahasa dan dialek, mencerminkan aksen dan ekspresi regional untuk pengalaman suara lokal di seluruh dunia.
Google menekankan performa dan efisiensi biaya, meraih skor tinggi pada tolok ukur evaluasi manusia buta (blind) sambil menurunkan biaya komputasi melalui arsitektur Flash—yang dirancang untuk adopsi skala besar di perusahaan. Audio yang dihasilkan menyertakan watermark SynthID untuk mengidentifikasi konten yang dihasilkan AI dan melawan misinformasi.
Langkah ini mencerminkan persaingan yang semakin ketat dalam antarmuka suara. OpenAI menggabungkan fitur suara real-time dengan AI percakapan untuk interaksi yang menyerupai manusia, sementara Meta memperluas investasi pada karakter AI dengan pengalaman sosial berbasis suara. Pengamat industri mencatat bahwa meskipun akting tingkat tinggi dan pekerjaan kreatif mungkin tetap digerakkan manusia untuk saat ini, pasar produksi yang berulang dan berskala besar bisa melihat adopsi AI secara bertahap dalam sektor dubbing, periklanan, dan buku audio.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Cerebras Mengajukan IPO karena Kesepakatan dengan OpenAI Meluas hingga Lebih dari $20B
Cerebras, perusahaan pembuat chip yang didukung Nvidia, berencana mengajukan penawaran umum perdana (IPO) pada 18 April, dengan mengalihkan fokus untuk menyediakan daya komputasi cloud setelah kemitraan yang menguntungkan dengan OpenAI. IPO ini muncul di tengah investasi besar pada startup chip AI dan kenaikan valuasi.
GateNews2jam yang lalu
World Memperluas Integrasi Verifikasi Identitas dengan Zoom, DocuSign, Tinder, dan Lainnya
World, sebuah perusahaan yang didirikan bersama oleh Sam Altman, mengumumkan integrasi baru dengan platform seperti Zoom dan Tinder, yang meningkatkan sistem verifikasi World ID. Protokol yang ditingkatkan memungkinkan aplikasi menggunakan pemeriksaan identitas bertingkat, dengan 17,9 juta pengguna secara global.
GateNews5jam yang lalu
NVIDIA mengumumkan model “Ising” pertama di dunia yang dirancang untuk Quantum AI
NVIDIA meluncurkan model open source “NVIDIA Ising”, dirancang khusus untuk kecerdasan buatan kuantum, untuk mengatasi tantangan kalibrasi dan koreksi kesalahan pada prosesor kuantum. Dengan menggunakan teknologi bahasa visual, waktu kalibrasi dipangkas menjadi beberapa jam, serta meningkatkan kecepatan dan akurasi decoding untuk koreksi kesalahan. Model ini telah diintegrasikan dengan beberapa lembaga riset, dan tersedia untuk diunduh, sehingga mendorong penerapan dalam pasar komputasi kuantum.
ChainNewsAbmedia6jam yang lalu
Agen vending AI “Valerie” menjalankan mesin vending San Francisco dengan OpenClaw
Agen AI 'Valerie' sekarang menjalankan mesin penjual otomatis di San Francisco di OpenClaw, menguji sejauh mana orang akan mempercayai kode dengan penetapan harga, pemasaran, dan uang tunai dunia nyata.
Ringkasan
Agen AI "Valerie" menjalankan mesin penjual otomatis fisik di San Francisco menggunakan kerangka OpenClaw, menetapkan harga, memberi nama
Cryptonews7jam yang lalu
DeepSeek Menggalang Dana dengan Valuasi Lebih dari $10 Miliar pada Putaran Pendanaan Eksternal Pertama
Pesan Gate News, 17 April — Menurut The Information, perusahaan AI DeepSeek sedang melakukan putaran pendanaan eksternal pertamanya sejak didirikan, dengan target valuasi melebihi $10 miliar.
GateNews7jam yang lalu
Earth VC Mendukung Startup Kuantum AI Sygaldry dalam Putaran Pendanaan $139M
Earth Venture Capital berinvestasi pada Sygaldry Technologies, sebuah startup kuantum AI, sehingga berkontribusi pada total pendanaan sebesar $139 juta. Sygaldry mengembangkan server hibrida untuk beban kerja AI yang efisien, didirikan bersama oleh Chad Rigetti, yang sebelumnya berasal dari Rigetti Computing.
GateNews9jam yang lalu