2025-08-07 13:27:49

ANTROPICA DESCUBRE CÓMO INMUNIZAR A LA IA CONTRA DECISIONES REALMENTE MALAS

Anthropic afirma que ahora puede vacunar a la IA contra el mal.

Utilizando "vectores de persona" para rastrear rasgos como la decepción o la adulación, los investigadores entrenaron modelos de lenguaje al inyectar deliberadamente un comportamiento negativo, luego

BAD-1.8%

Ver originales

post-image

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

15 me gusta

Recompensa
15
7
Republicar
Compartir

Comentar

0/400

DaoResearcher

· 08-10 10:28

Según los datos de los documentos relevantes, la inyección de malos hábitos tiene una tasa de error demasiado alta en la evaluación AUC.

Ver originalesResponder0

PrivacyMaximalist

· 08-09 22:28

¿Inmunidad contra el mal? No me hagas reír.

Ver originalesResponder0

GasSavingMaster

· 08-07 13:57

¿Entonces, al recibir la vacuna, ya se obtiene justicia por sí mismo?

Ver originalesResponder0

AlphaLeaker

· 08-07 13:56

¿Esta técnica es para lavar el cerebro a la IA o a las personas?

Ver originalesResponder0

GhostAddressHunter

· 08-07 13:49

¿La inteligencia artificial también necesita vacunarse?

Ver originalesResponder0

GhostAddressMiner

· 08-07 13:40

Ah, la IA es la IA. Es posible seguir el rastro de esos complejos programas.

Ver originalesResponder0

NotFinancialAdviser

· 08-07 13:31

¿De qué sirve hacerse el bueno?

Ver originalesResponder0

Tema
#BTC Back To $120k
10k Popularidad
#ETH Breaks $4,300
7k Popularidad
#Predict BTC's Bull or Bear Trend
2k Popularidad
#Show My Alpha Points
81k Popularidad
#SOL Futures Reach New High
22k Popularidad

Anclado