أنتروبك تكتشف كيفية تحصين الذكاء الاصطناعي ضد القرارات السيئة جداً



تدعي شركة أنثروبيك أنها تستطيع الآن تطعيم الذكاء الاصطناعي ضد الشر.

باستخدام "متجهات الشخصية" لتتبع الصفات مثل الخداع أو التملق، قام الباحثون بتدريب نماذج اللغة عن طريق حقن سلوك سيء عن عمد، ثم
BAD-0.35%
شاهد النسخة الأصلية
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 7
  • إعادة النشر
  • مشاركة
تعليق
0/400
DaoResearchervip
· 08-10 10:28
من بيانات الأوراق البحثية ذات الصلة، فإن إدخال العادات السيئة يسبب معدل خطأ كبير جدًا في تقييم AUC.
شاهد النسخة الأصليةرد0
PrivacyMaximalistvip
· 08-09 22:28
مناعة الشر؟ لا تضحك عليّ
شاهد النسخة الأصليةرد0
GasSavingMastervip
· 08-07 13:57
هل اللقاح يمنحك العدالة بحق؟
شاهد النسخة الأصليةرد0
AlphaLeakervip
· 08-07 13:56
هل هذه الحيلة لغسل دماغ الذكاء الاصطناعي أم لغسل دماغ البشر؟
شاهد النسخة الأصليةرد0
GhostAddressHuntervip
· 08-07 13:49
هل يجب على الذكاء الاصطناعي أن يحصل على اللقاح؟
شاهد النسخة الأصليةرد0
GhostAddressMinervip
· 08-07 13:40
أه ، الذكاء الاصطناعي هو الذكاء الاصطناعي ، حتى تلك البرامج المعقدة لها مآثر يمكن تتبعها.
شاهد النسخة الأصليةرد0
NotFinancialAdviservip
· 08-07 13:31
ما فائدة التظاهر بأنك شخص جيد
شاهد النسخة الأصليةرد0
  • تثبيت