2025-08-07 13:27:49

ANTROPİK, YAPAY ZEKAYI ÇOK KÖTÜ KARARLARDAN NASIL AŞILAYACAĞINI KEŞFETTİ

Anthropic, yapay zekayı kötülükten aşılayabileceğini iddia ediyor.

"Kişilik vektörleri" kullanarak aldatma veya dalkavukluk gibi özellikleri izlemek için, araştırmacılar dil modellerini kötü davranışları kasıtlı olarak enjekte ederek eğittiler, sonra

BAD1.26%

View Original

post-image

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

15 Likes

Reward
15
7
Repost
Share

Comment

0/400

DaoResearcher

· 4h ago

İlgili makale verilerine göre, kötü alışkanlıkların en iyi sınıflandırma (AUC) değerlendirmesinde hata oranı çok yüksek.

View OriginalReply0

PrivacyMaximalist

· 16h ago

Kötüleri bağışlamak mı? Şaka yapıyorsun.

View OriginalReply0

GasSavingMaster

· 08-07 13:57

Aşıyı yaptırdıktan sonra kendi adaletini mi sağlıyor?

View OriginalReply0

AlphaLeaker

· 08-07 13:56

Bu numara AI'yi mi beyin yıkıyor yoksa insanları mı beyin yıkıyor?

View OriginalReply0

GhostAddressHunter

· 08-07 13:49

Yapay zeka da aşı olmalı mı?

View OriginalReply0

GhostAddressMiner

· 08-07 13:40

Eh, AI bir AI'dir, bu karmaşık programların da bir iz sürme yolu vardır.

View OriginalReply0

NotFinancialAdviser

· 08-07 13:31

İyi biri gibi davranmanın ne faydası var

View OriginalReply0

Topic
#Gate & WLFI USD1 Points Program
66k Popularity
#Trump Allows 401(k) Crypto Investing
37k Popularity
#Join Copy Trading Share to Win $2,000
34k Popularity
#Show My Alpha Points
77k Popularity
#SOL Futures Reach New High
22k Popularity

Pin