大規模モデルが賢くなるためには、人が人を教え、管理しなければならない——これが Human-in-the-loop RL です。



最近、@JoinSapien でタスクを行い、AI が書いた推論プロセスを審査しました:

🌱 AIはどう考えているのか?
🌱 合理ですか?
🌱 どのステップから歪み始めたのか?

このタスクはCoT(Chain-of-Thought)評価と呼ばれ、私はその論理監査人です。

さらに進むと、Tree of Thoughts(思考の木)があります。AIは複数のアイデアの分岐を試み、人間がどのパスが最適かを選別します。

実際、あなたはそれを子供に問題を説明していると思うことができますが、その子供はGPTレベルの未来の脳です。

この作業は、AIだけではできず、人が参加する必要があります。

@JoinSapien #sapien @KaitoAI # KaitoAI #SapienProtocol
TREE-1.25%
GPT1.44%
原文表示
post-image
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)