2025-08-06 11:25:34

大規模モデルが賢くなるためには、人が人を教え、管理しなければならない——これが Human-in-the-loop RL です。

最近、@JoinSapien でタスクを行い、AI が書いた推論プロセスを審査しました：

🌱 AIはどう考えているのか？
🌱 合理ですか？
🌱 どのステップから歪み始めたのか？

このタスクはCoT（Chain-of-Thought）評価と呼ばれ、私はその論理監査人です。

さらに進むと、Tree of Thoughts（思考の木）があります。AIは複数のアイデアの分岐を試み、人間がどのパスが最適かを選別します。

実際、あなたはそれを子供に問題を説明していると思うことができますが、その子供はGPTレベルの未来の脳です。

この作業は、AIだけではできず、人が参加する必要があります。

@JoinSapien #sapien @KaitoAI # KaitoAI #SapienProtocol

TREE-1.25%

GPT1.44%

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

報酬
いいね
コメント
共有

0/400

コメントなし

トピック
#Gate ETH Staking APY 5%
40k 人気度
#Show My Alpha Points
50k 人気度
#Crypto IPO Surge
15k 人気度
#SOL Futures Reach New High
27k 人気度
#ETH ETF Sees 12 Weeks of Inflows
7k 人気度

ピン

サイトマップ