2025-08-07 13:27:49

أنتروبك تكتشف كيفية تحصين الذكاء الاصطناعي ضد القرارات السيئة جداً

تدعي شركة أنثروبيك أنها تستطيع الآن تطعيم الذكاء الاصطناعي ضد الشر.

باستخدام "متجهات الشخصية" لتتبع الصفات مثل الخداع أو التملق، قام الباحثون بتدريب نماذج اللغة عن طريق حقن سلوك سيء عن عمد، ثم

BAD-0.35%

شاهد النسخة الأصلية

post-image

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 15

أعجبني
15
7
إعادة النشر
مشاركة

تعليق

0/400

DaoResearcher

· 08-10 10:28

من بيانات الأوراق البحثية ذات الصلة، فإن إدخال العادات السيئة يسبب معدل خطأ كبير جدًا في تقييم AUC.

شاهد النسخة الأصليةرد0

PrivacyMaximalist

· 08-09 22:28

مناعة الشر؟ لا تضحك عليّ

شاهد النسخة الأصليةرد0

GasSavingMaster

· 08-07 13:57

هل اللقاح يمنحك العدالة بحق؟

شاهد النسخة الأصليةرد0

AlphaLeaker

· 08-07 13:56

هل هذه الحيلة لغسل دماغ الذكاء الاصطناعي أم لغسل دماغ البشر؟

شاهد النسخة الأصليةرد0

GhostAddressHunter

· 08-07 13:49

هل يجب على الذكاء الاصطناعي أن يحصل على اللقاح؟

شاهد النسخة الأصليةرد0

GhostAddressMiner

· 08-07 13:40

أه ، الذكاء الاصطناعي هو الذكاء الاصطناعي ، حتى تلك البرامج المعقدة لها مآثر يمكن تتبعها.

شاهد النسخة الأصليةرد0

NotFinancialAdviser

· 08-07 13:31

ما فائدة التظاهر بأنك شخص جيد

شاهد النسخة الأصليةرد0

الموضوع
#TOKEN OF LOVE IS BACK
2k درجة الشعبية
#BTC Back To $120k
18k درجة الشعبية
#Show My Alpha Points
84k درجة الشعبية
#SOL Futures Reach New High
22k درجة الشعبية
#ETH ETF Sees 12 Weeks of Inflows
8k درجة الشعبية

تثبيت

خريطة الموقع