Pesan Gate News, 20 April — Model AI teratas unggul dalam memecahkan masalah kompleks seperti matematika Olimpiade, tetapi kesulitan pada pekerjaan rutin perusahaan, menurut David Meyer dari Databricks. Beberapa model mungkin memperbaiki nomor faktur yang salah alih-alih menandainya sebagai kesalahan, sementara alat pemrograman seperti Claude juga bisa berkinerja di bawah standar pada tugas rekayasa data.
Kesenjangan ini berasal dari perbedaan mendasar antara data perusahaan dan teks web publik yang digunakan untuk melatih model besar. Data perusahaan sering menampilkan label kolom yang tidak jelas, banyak kolom kosong, dan kode yang disimpan sebagai teks biasa. Dalam satu studi akademis, skor F1 model AI, yang menyeimbangkan precision dan recall, turun dari 0.94 pada data publik menjadi 0.07 pada data perusahaan untuk tugas rekayasa data. Selain itu, model besar cenderung mengandalkan pola yang sudah familiar dari pelatihan; beberapa kembali ke Structured Query Language (SQL) bahkan setelah menerima instruksi dan dokumentasi untuk bahasa kueri proprietari milik sebuah perusahaan.
Model sumber terbuka yang lebih kecil yang disetel dengan reinforcement learning dapat menangani pekerjaan tertentu dengan lebih efisien dengan biaya pelatihan yang jauh lebih rendah dibandingkan model umum skala besar. Databricks sedang membangun agen AI yang lebih kecil untuk alur kerja spesifik, seperti KARL, yang menggunakan reinforcement learning untuk penalaran multi-langkah dengan dokumen perusahaan. Industri bergeser dari mengandalkan model raksasa ke arsitektur hibrida, di mana model kecil yang efisien menangani volume rutin, lalu hanya mengeskalasi kasus yang tidak jelas atau kompleks ke sistem yang lebih besar dan lebih mahal.
Databricks baru-baru ini mengakuisisi Quotient AI untuk membantu perusahaan besar menjalankan agen AI dengan lebih andal. Persaingan di bisnis AI kini berpusat pada menjalankan seluruh siklus hidup AI, termasuk sistem umpan balik untuk melacak kesalahan dan terus meningkatkan model dari waktu ke waktu, sehingga alat evaluasi dan penyetelan semakin bernilai setelah penerapan.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Realitas AI Agent di Silicon Valley: Token banyak terbuang, integrasi sistem “sangat kacau”, prediksi Huang Renxun “ChatGPT berikutnya” masih perlu diverifikasi
Dalam konferensi baru-baru ini di Silicon Valley, beberapa CEO startup AI memberikan pandangan mereka tentang masalah penggunaan AI agent saat ini, dan berpendapat bahwa mereka menghadapi dua tantangan besar: pemborosan token dan kekacauan sistem. Para ahli menyatakan bahwa perusahaan perlu lebih cermat dalam menentukan kapan menggunakan model bahasa besar untuk menghindari pemborosan sumber daya yang tidak perlu. Selain itu, kolaborasi beberapa AI agent sering menyebabkan masalah dalam penyampaian pesan dan konsistensi status, yang menunjukkan bahwa standardisasi saat ini masih perlu ditingkatkan. Meskipun Huang Renxun membahas pandangan tentang indikator gaji token, umpan balik menunjukkan bahwa ini tidak sama dengan produktivitas; nilai sebenarnya terletak pada perancangan tugas yang efektif.
ChainNewsAbmedia13jam yang lalu
AI menelan 80% modal ventura global, Q1 2026 menyerap 242 miliar dolar: bagaimana pelaku industri Crypto menanggapi redistribusi dana
Menurut laporan, pada kuartal pertama tahun 2026 total nilai global modal ventura mendekati 300 miliar dolar AS, di mana perusahaan-perusahaan terkait AI menyumbang sekitar 242 miliar dolar AS, atau 80% dari modal ventura. Ini menunjukkan bahwa AI telah menjadi fokus utama modal ventura. Seiring dana terkonsentrasi pada AI, bidang lain seperti crypto tertekan, dan pelaku industri perlu menyesuaikan strategi, mengintegrasikan AI secara lebih mendalam ke dalam bisnis, serta memperkirakan akan muncul tren penggabungan infrastruktur.
ChainNewsAbmedia17jam yang lalu
Robot Humanoid Berprestasi: Tim Qitian Dasheng Juara Paruh Terapan Setengah Marathon Yizhuang Beijing 2026 dalam 50 Menit 26 Detik
Paruh Terapan Setengah Marathon Yizhuang Beijing 2026 menampilkan robot humanoid yang berlomba sejauh 21.0975 km. Tim otonom Qitian Dasheng menang dengan waktu 50:26, sementara tim kendali jarak jauh Jueying Chitu finis pertama dalam waktu bersih namun berada di peringkat lebih rendah karena penalti.
GateNews18jam yang lalu
Polisi Hong Kong Peringatkan Penipuan Kripto "AI Quantitative Trading", Perempuan Kehilangan HK$7,7 Juta
Polisi Hong Kong mengungkap penipuan kripto di mana seorang perempuan kehilangan HK$7,7 juta akibat penipu yang menyamar sebagai ahli investasi melalui Telegram, menjanjikan imbal hasil tinggi melalui perdagangan AI. Polisi memperingatkan masyarakat tentang risiko yang terkait dengan investasi mata uang kripto.
GateNews19jam yang lalu
Pendiri Ethereum Lubin: AI Akan Menjadi Titik Balik Penting untuk Kripto, Tapi Monopoli Raksasa Teknologi Menimbulkan Risiko Sistemik
Pendiri Ethereum Joseph Lubin menekankan potensi transformatif AI bagi sektor kripto sambil mengingatkan risiko sentralisasi di antara raksasa teknologi. Ia membayangkan transaksi otonom yang digerakkan oleh AI di blockchain dan menyoroti konvergensi keuangan tradisional dengan DeFi.
GateNews04-18 14:01
Luffa Bermitra dengan Platform Aset Digital untuk Mengintegrasikan Perdagangan Crypto Berbasis AI
Luffa, ekosistem sosial Web3, bermitra dengan platform perdagangan aset digital untuk mengintegrasikan fitur perdagangan berbasis AI, meningkatkan komunikasi dan perdagangan yang aman dalam satu antarmuka sekaligus mempertahankan desentralisasi dan mitigasi risiko.
GateNews04-18 06:31