Les meilleurs modèles d’IA accusent du retard sur les tâches d’entreprise courantes, selon Databricks : des modèles spécialisés plus petits surpassent

Message de Gate News, 20 avril — Les principaux modèles d’IA excellent à résoudre des problèmes complexes comme les mathématiques de type Olympiade, mais peinent avec le travail d’entreprise de routine, selon David Meyer de Databricks. Certains modèles peuvent corriger un numéro de facture incorrect au lieu de le signaler comme une erreur, tandis que des outils de programmation comme Claude peuvent aussi être en dessous des attentes sur des tâches de data engineering.

L’écart s’explique par des différences fondamentales entre les données d’entreprise et le texte du web public utilisé pour entraîner les grands modèles. Les données d’entreprise présentent souvent des libellés de colonnes vagues, de nombreux champs vides et des codes stockés sous forme de texte brut. Dans une étude universitaire, le score F1 d’un modèle d’IA, qui équilibre précision et rappel, est passé de 0.94 sur des données publiques à 0.07 sur des données d’entreprise pour une tâche de data engineering. En outre, les grands modèles ont tendance à revenir par défaut à des schémas familiers issus de l’entraînement ; certains ont conservé (Structured Query Language )SQL par défaut même après avoir reçu des instructions et une documentation pour le langage de requêtes propriétaire d’une entreprise.

Des modèles open source plus petits, ajustés avec l’apprentissage par renforcement, peuvent traiter des tâches spécifiques de manière plus efficace à des coûts d’entraînement nettement inférieurs à ceux des grands modèles généralistes. Databricks construit des agents d’IA plus petits pour des flux de travail spécifiques, comme KARL, qui utilise l’apprentissage par renforcement pour un raisonnement en plusieurs étapes à partir de documents de l’entreprise. L’industrie s’oriente du recours à des modèles géants vers des architectures hybrides où des modèles petits et efficaces gèrent le volume de routine, puis n’escaladent que les cas ambigus ou complexes vers des systèmes plus grands et plus coûteux.

Databricks a récemment acquis Quotient AI pour aider les grandes entreprises à exécuter des agents d’IA de manière plus fiable. La concurrence dans le secteur de l’IA se concentre désormais sur l’exécution de l’ensemble du cycle de vie de l’IA, y compris des systèmes de feedback pour le suivi des erreurs et l’amélioration continue des modèles au fil du temps, ce qui rend les outils d’évaluation et de réglage de plus en plus précieux après le déploiement.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Réalité des agents IA de la Silicon Valley : énorme gaspillage de jetons, intégration système « extrêmement chaotique », la « prochaine version de ChatGPT » selon Jensen Huang encore à confirmer

Lors de récentes conférences à la Silicon Valley, plusieurs PDG de nouvelles pousses d’IA ont donné leur avis sur les problèmes d’utilisation actuels des agents IA, estimant qu’ils font face à deux grandes difficultés : le gaspillage de jetons et un système en désordre. Des experts indiquent que les entreprises doivent déterminer plus prudemment quand utiliser des modèles de langage de grande taille, afin d’éviter un gaspillage inutile de ressources. En outre, la collaboration de plusieurs agents IA entraîne souvent des problèmes de transmission des messages et d’incohérence de l’état, ce qui montre que la standardisation actuelle doit encore être améliorée. Bien que Huang Renxun ait mentionné l’idée d’un indicateur de rémunération en fonction des jetons, les retours montrent que cela ne correspond pas à la productivité ; la valeur réelle réside dans la conception efficace des tâches.

ChainNewsAbmediaIl y a 13h

L’IA engloutit 80% du capital-risque mondial, Q1 2026 attire 242 milliards de dollars : comment les acteurs de la cryptographie doivent réagir à la réallocation des capitaux

Selon les informations, au premier trimestre 2026, le montant total mondial du capital-risque est proche de 300 milliards de dollars, dont environ 242 milliards de dollars sont attribués exclusivement aux entreprises liées à l’IA, soit 80 % du capital-risque. Cela montre que l’IA est devenue le principal centre d’intérêt du capital-risque. À mesure que les fonds se concentrent sur l’IA, d’autres domaines comme le crypto sont sous pression, et les acteurs doivent ajuster leur stratégie : intégrer l’IA plus en profondeur dans leurs activités, et s’attendre à l’émergence d’une tendance à la consolidation des infrastructures.

ChainNewsAbmediaIl y a 17h

Un robot humanoïde remporte le semi-marathon de Yizhuang à Pékin 2026 en 50 minutes 26 secondes

Le semi-marathon de Yizhuang à Pékin 2026 a mis en scène des robots humanoïdes en compétition sur 21,0975 km. L’équipe autonome Qitian Dasheng a remporté la course en 50:26, tandis que l’équipe télécommandée Jueying Chitu a terminé première en temps net, mais a été classée plus bas en raison de pénalités.

GateNewsIl y a 18h

La police de Hong Kong met en garde contre l’arnaque crypto « trading quantitatif par IA », une femme perd 7,7 millions de HK$

La police de Hong Kong a révélé une fraude en cryptomonnaies dans laquelle une femme a perdu 7,7 millions de HK$ au profit d’escrocs se faisant passer pour des experts en investissement via Telegram, promettant de hauts rendements grâce au trading avec IA. La police a mis le public en garde contre les risques liés aux investissements en cryptomonnaies.

GateNewsIl y a 19h

Cofondateur d’Ethereum Lubin : l’IA sera un tournant critique pour la crypto, mais le monopole des géants de la tech présente un risque systémique

Le cofondateur d’Ethereum, Joseph Lubin, a souligné le potentiel transformateur de l’IA pour le secteur des cryptomonnaies, tout en mettant en garde contre les risques de centralisation parmi les grands acteurs technologiques. Il envisage des transactions autonomes pilotées par l’IA sur la blockchain et met en avant la convergence entre la finance traditionnelle et la DeFi.

GateNews04-18 14:01

Luffa s’associe à une plateforme d’actifs numériques pour intégrer un trading crypto propulsé par l’IA

Luffa, un écosystème social Web3, s’est associé à une plateforme de négociation d’actifs numériques pour intégrer des fonctionnalités de trading pilotées par l’IA, améliorant la communication sécurisée et le trading dans une interface unifiée tout en préservant la décentralisation et la réduction des risques.

GateNews04-18 06:31
Commentaire
0/400
Aucun commentaire