ANTROPİK, YAPAY ZEKAYI ÇOK KÖTÜ KARARLARDAN NASIL AŞILAYACAĞINI KEŞFETTİ
Anthropic, yapay zekayı kötülükten aşılayabileceğini iddia ediyor.
"Kişilik vektörleri" kullanarak aldatma veya dalkavukluk gibi özellikleri izlemek için, araştırmacılar dil modellerini kötü davranışları kasıtlı olarak enjekte ederek eğittiler, sonra
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
15 Likes
Reward
15
7
Repost
Share
Comment
0/400
DaoResearcher
· 4h ago
İlgili makale verilerine göre, kötü alışkanlıkların en iyi sınıflandırma (AUC) değerlendirmesinde hata oranı çok yüksek.
View OriginalReply0
PrivacyMaximalist
· 16h ago
Kötüleri bağışlamak mı? Şaka yapıyorsun.
View OriginalReply0
GasSavingMaster
· 08-07 13:57
Aşıyı yaptırdıktan sonra kendi adaletini mi sağlıyor?
View OriginalReply0
AlphaLeaker
· 08-07 13:56
Bu numara AI'yi mi beyin yıkıyor yoksa insanları mı beyin yıkıyor?
View OriginalReply0
GhostAddressHunter
· 08-07 13:49
Yapay zeka da aşı olmalı mı?
View OriginalReply0
GhostAddressMiner
· 08-07 13:40
Eh, AI bir AI'dir, bu karmaşık programların da bir iz sürme yolu vardır.
ANTROPİK, YAPAY ZEKAYI ÇOK KÖTÜ KARARLARDAN NASIL AŞILAYACAĞINI KEŞFETTİ
Anthropic, yapay zekayı kötülükten aşılayabileceğini iddia ediyor.
"Kişilik vektörleri" kullanarak aldatma veya dalkavukluk gibi özellikleri izlemek için, araştırmacılar dil modellerini kötü davranışları kasıtlı olarak enjekte ederek eğittiler, sonra