Cette note de Stanford et Harvard explique pourquoi la plupart des systèmes d’« intelligence artificielle agent » suscitent d’abord de l’admiration dans les présentations, puis se dégradent complètement une fois utilisés dans le monde réel.


Son nom est « تكييف الذكاء الاصطناعي الوكيل » et c’est la note la plus importante que j’ai lue cette année.
À l’heure actuelle, tout le monde est obsédé par la construction d’agents autonomes. Nous leur donnons des outils, de la mémoire et un objectif, et nous nous attendons à ce qu’ils accomplissent nos tâches.
Mais lorsqu’on les déploie dans le monde réel, ils se mettent à imaginer des appels d’outils. Ils échouent à planifier à long terme. Ils se bloquent.
Voici la raison :
Nous essayons de comprimer toute l’apprentissage dans le cerveau de l’intelligence artificielle.
Quand les développeurs tentent de réparer un agent en panne, ils ne font généralement que régler le modèle principal pour produire de meilleures réponses finales.
Les chercheurs ont découvert un défaut fatal dans cette approche.
Si vous récompensez uniquement l’intelligence artificielle pour obtenir la bonne réponse finale, elle devient paresseuse.
Elle apprend littéralement à arrêter d’utiliser ses outils. Elle essaie de deviner la réponse au lieu de faire le travail. Elle ignore la calculatrice et essaie d’effectuer le calcul dans sa tête.
Pour y remédier, les chercheurs ont mis au point un nouveau cadre en 4 parties pour apprendre réellement aux agents comment apprendre.
Et la conclusion la plus importante renverse complètement la compréhension actuelle.
Au lieu de réentraîner en permanence le cerveau massif et coûteux de l’agent, les systèmes les plus fiables font l’inverse.
Ils figent le cerveau. Et ils adaptent les outils.
Ils l’appellent adaptation des outils sous la supervision de l'agent.#GateSquareAprilPostingChallenge $BTC
BTC0,17%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler