ANTROPICA DESCUBRE CÓMO INMUNIZAR A LA IA CONTRA DECISIONES REALMENTE MALAS



Anthropic afirma que ahora puede vacunar a la IA contra el mal.

Utilizando "vectores de persona" para rastrear rasgos como la decepción o la adulación, los investigadores entrenaron modelos de lenguaje al inyectar deliberadamente un comportamiento negativo, luego
BAD-1.8%
Ver originales
post-image
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 7
  • Republicar
  • Compartir
Comentar
0/400
DaoResearchervip
· 08-10 10:28
Según los datos de los documentos relevantes, la inyección de malos hábitos tiene una tasa de error demasiado alta en la evaluación AUC.
Ver originalesResponder0
PrivacyMaximalistvip
· 08-09 22:28
¿Inmunidad contra el mal? No me hagas reír.
Ver originalesResponder0
GasSavingMastervip
· 08-07 13:57
¿Entonces, al recibir la vacuna, ya se obtiene justicia por sí mismo?
Ver originalesResponder0
AlphaLeakervip
· 08-07 13:56
¿Esta técnica es para lavar el cerebro a la IA o a las personas?
Ver originalesResponder0
GhostAddressHuntervip
· 08-07 13:49
¿La inteligencia artificial también necesita vacunarse?
Ver originalesResponder0
GhostAddressMinervip
· 08-07 13:40
Ah, la IA es la IA. Es posible seguir el rastro de esos complejos programas.
Ver originalesResponder0
NotFinancialAdviservip
· 08-07 13:31
¿De qué sirve hacerse el bueno?
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)