ANTHROPIC DÉCOUVRE COMMENT IMMUNISER L'IA CONTRE DE TRÈS MAUVAISES DÉCISIONS
Anthropic affirme qu'il peut désormais vacciner l'IA contre le mal.
Utilisant des "vecteurs de persona" pour suivre des traits tels que la tromperie ou la sycophantie, les chercheurs ont formé des modèles linguistiques en injectant délibérément un mauvais comportement, puis
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
15 J'aime
Récompense
15
7
Reposter
Partager
Commentaire
0/400
DaoResearcher
· Il y a 4h
D'après les données des articles pertinents, l'injection de mauvaises habitudes présente un taux d'erreur trop élevé dans l'évaluation AUC.
Voir l'originalRépondre0
PrivacyMaximalist
· Il y a 16h
Immunité contre le mal ? Ne me fais pas rire.
Voir l'originalRépondre0
GasSavingMaster
· 08-07 13:57
Une fois le vaccin reçu, on se sent justifié, n'est-ce pas ?
Voir l'originalRépondre0
AlphaLeaker
· 08-07 13:56
Cette technique sert-elle à laver le cerveau des IA ou des humains ?
Voir l'originalRépondre0
GhostAddressHunter
· 08-07 13:49
L'intelligence artificielle doit-elle se faire vacciner ?
Voir l'originalRépondre0
GhostAddressMiner
· 08-07 13:40
Eh bien, l'IA est l'IA, même les programmes compliqués ont une logique.
ANTHROPIC DÉCOUVRE COMMENT IMMUNISER L'IA CONTRE DE TRÈS MAUVAISES DÉCISIONS
Anthropic affirme qu'il peut désormais vacciner l'IA contre le mal.
Utilisant des "vecteurs de persona" pour suivre des traits tels que la tromperie ou la sycophantie, les chercheurs ont formé des modèles linguistiques en injectant délibérément un mauvais comportement, puis