2025-08-07 13:27:49

ANTHROPIC DÉCOUVRE COMMENT IMMUNISER L'IA CONTRE DE TRÈS MAUVAISES DÉCISIONS

Anthropic affirme qu'il peut désormais vacciner l'IA contre le mal.

Utilisant des "vecteurs de persona" pour suivre des traits tels que la tromperie ou la sycophantie, les chercheurs ont formé des modèles linguistiques en injectant délibérément un mauvais comportement, puis

BAD0.66%

Voir l'original

post-image

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

15 J'aime

Récompense
15
7
Reposter
Partager

Commentaire

0/400

DaoResearcher

· Il y a 4h

D'après les données des articles pertinents, l'injection de mauvaises habitudes présente un taux d'erreur trop élevé dans l'évaluation AUC.

Voir l'originalRépondre0

PrivacyMaximalist

· Il y a 16h

Immunité contre le mal ? Ne me fais pas rire.

Voir l'originalRépondre0

GasSavingMaster

· 08-07 13:57

Une fois le vaccin reçu, on se sent justifié, n'est-ce pas ?

Voir l'originalRépondre0

AlphaLeaker

· 08-07 13:56

Cette technique sert-elle à laver le cerveau des IA ou des humains ?

Voir l'originalRépondre0

GhostAddressHunter

· 08-07 13:49

L'intelligence artificielle doit-elle se faire vacciner ?

Voir l'originalRépondre0

GhostAddressMiner

· 08-07 13:40

Eh bien, l'IA est l'IA, même les programmes compliqués ont une logique.

Voir l'originalRépondre0

NotFinancialAdviser

· 08-07 13:31

À quoi bon feindre d'être une bonne personne

Voir l'originalRépondre0

Rubrique
#Gate & WLFI USD1 Points Program
66k Popularité
#Trump Allows 401(k) Crypto Investing
41k Popularité
#Join Copy Trading Share to Win $2,000
34k Popularité
#Show My Alpha Points
75k Popularité
#SOL Futures Reach New High
22k Popularité

Épingler