ANTROPİK, YAPAY ZEKAYI ÇOK KÖTÜ KARARLARDAN NASIL AŞILAYACAĞINI KEŞFETTİ



Anthropic, yapay zekayı kötülükten aşılayabileceğini iddia ediyor.

"Kişilik vektörleri" kullanarak aldatma veya dalkavukluk gibi özellikleri izlemek için, araştırmacılar dil modellerini kötü davranışları kasıtlı olarak enjekte ederek eğittiler, sonra
BAD1.26%
View Original
post-image
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • 7
  • Repost
  • Share
Comment
0/400
DaoResearchervip
· 4h ago
İlgili makale verilerine göre, kötü alışkanlıkların en iyi sınıflandırma (AUC) değerlendirmesinde hata oranı çok yüksek.
View OriginalReply0
PrivacyMaximalistvip
· 16h ago
Kötüleri bağışlamak mı? Şaka yapıyorsun.
View OriginalReply0
GasSavingMastervip
· 08-07 13:57
Aşıyı yaptırdıktan sonra kendi adaletini mi sağlıyor?
View OriginalReply0
AlphaLeakervip
· 08-07 13:56
Bu numara AI'yi mi beyin yıkıyor yoksa insanları mı beyin yıkıyor?
View OriginalReply0
GhostAddressHuntervip
· 08-07 13:49
Yapay zeka da aşı olmalı mı?
View OriginalReply0
GhostAddressMinervip
· 08-07 13:40
Eh, AI bir AI'dir, bu karmaşık programların da bir iz sürme yolu vardır.
View OriginalReply0
NotFinancialAdviservip
· 08-07 13:31
İyi biri gibi davranmanın ne faydası var
View OriginalReply0
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)