ANTHROPIC DÉCOUVRE COMMENT IMMUNISER L'IA CONTRE DE TRÈS MAUVAISES DÉCISIONS



Anthropic affirme qu'il peut désormais vacciner l'IA contre le mal.

Utilisant des "vecteurs de persona" pour suivre des traits tels que la tromperie ou la sycophantie, les chercheurs ont formé des modèles linguistiques en injectant délibérément un mauvais comportement, puis
BAD0.66%
Voir l'original
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 7
  • Reposter
  • Partager
Commentaire
0/400
DaoResearchervip
· Il y a 4h
D'après les données des articles pertinents, l'injection de mauvaises habitudes présente un taux d'erreur trop élevé dans l'évaluation AUC.
Voir l'originalRépondre0
PrivacyMaximalistvip
· Il y a 16h
Immunité contre le mal ? Ne me fais pas rire.
Voir l'originalRépondre0
GasSavingMastervip
· 08-07 13:57
Une fois le vaccin reçu, on se sent justifié, n'est-ce pas ?
Voir l'originalRépondre0
AlphaLeakervip
· 08-07 13:56
Cette technique sert-elle à laver le cerveau des IA ou des humains ?
Voir l'originalRépondre0
GhostAddressHuntervip
· 08-07 13:49
L'intelligence artificielle doit-elle se faire vacciner ?
Voir l'originalRépondre0
GhostAddressMinervip
· 08-07 13:40
Eh bien, l'IA est l'IA, même les programmes compliqués ont une logique.
Voir l'originalRépondre0
NotFinancialAdviservip
· 08-07 13:31
À quoi bon feindre d'être une bonne personne
Voir l'originalRépondre0
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)