ANTROPICA DESCUBRE CÓMO INMUNIZAR A LA IA CONTRA DECISIONES REALMENTE MALAS
Anthropic afirma que ahora puede vacunar a la IA contra el mal.
Utilizando "vectores de persona" para rastrear rasgos como la decepción o la adulación, los investigadores entrenaron modelos de lenguaje al inyectar deliberadamente un comportamiento negativo, luego
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
15 me gusta
Recompensa
15
7
Republicar
Compartir
Comentar
0/400
DaoResearcher
· 08-10 10:28
Según los datos de los documentos relevantes, la inyección de malos hábitos tiene una tasa de error demasiado alta en la evaluación AUC.
Ver originalesResponder0
PrivacyMaximalist
· 08-09 22:28
¿Inmunidad contra el mal? No me hagas reír.
Ver originalesResponder0
GasSavingMaster
· 08-07 13:57
¿Entonces, al recibir la vacuna, ya se obtiene justicia por sí mismo?
Ver originalesResponder0
AlphaLeaker
· 08-07 13:56
¿Esta técnica es para lavar el cerebro a la IA o a las personas?
Ver originalesResponder0
GhostAddressHunter
· 08-07 13:49
¿La inteligencia artificial también necesita vacunarse?
Ver originalesResponder0
GhostAddressMiner
· 08-07 13:40
Ah, la IA es la IA. Es posible seguir el rastro de esos complejos programas.
ANTROPICA DESCUBRE CÓMO INMUNIZAR A LA IA CONTRA DECISIONES REALMENTE MALAS
Anthropic afirma que ahora puede vacunar a la IA contra el mal.
Utilizando "vectores de persona" para rastrear rasgos como la decepción o la adulación, los investigadores entrenaron modelos de lenguaje al inyectar deliberadamente un comportamiento negativo, luego