OpenLedger: بناء نماذج مدفوعة بالبيانات وقابلة للتجميع للاقتصاد الذكي Web3

OpenLedger العمق دراسة: بناء اقتصاد ذكي مدفوع بالبيانات وقابل للتجميع بالنماذج

المقدمة | الانتقال في طبقة نموذج Crypto AI

البيانات والنماذج والقوة الحسابية هي العناصر الأساسية الثلاثة للبنية التحتية للذكاء الاصطناعي، ولا يمكن الاستغناء عن أي منها. على غرار مسار تطور البنية التحتية لصناعة الذكاء الاصطناعي التقليدية، شهد مجال الذكاء الاصطناعي المشفر أيضًا مراحل مشابهة. في أوائل عام 2024، هيمن على السوق مشاريع GPU اللامركزية، التي أكدت على منطق النمو الواسع «لزيادة القوة الحسابية». ومع دخول عام 2025، انتقل تركيز الصناعة تدريجيًا إلى طبقة النماذج والبيانات، مما يدل على أن الذكاء الاصطناعي المشفر ينتقل من المنافسة على الموارد الأساسية إلى بناء طبقة وسطى أكثر استدامة وقيمة تطبيقية.

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ Moments-62B3FAe810F4772AABA3D91C74C1AA6)

نموذج عام (LLM) مقابل نموذج متخصص (SLM)

تدريب نماذج اللغة الكبيرة التقليدية (LLM) يعتمد بشكل كبير على مجموعات بيانات ضخمة وهياكل موزعة معقدة، حيث يتراوح حجم المعلمات بين 70B و 500B، وغالبًا ما تصل تكلفة التدريب لمرة واحدة إلى عدة ملايين من الدولارات. بينما تُعتبر SLM (نموذج اللغة المتخصص) نمطًا خفيفًا للتعديل الدقيق يعتمد على نموذج أساسي قابل لإعادة الاستخدام، وغالبًا ما يستند إلى نماذج مفتوحة المصدر، ويجمع بين كمية قليلة من البيانات المتخصصة عالية الجودة وتقنيات مثل LoRA، لبناء نماذج خبراء تمتلك معرفة في مجالات معينة بسرعة، مما يقلل بشكل كبير من تكاليف التدريب والعوائق التقنية.

من الجدير بالذكر أن SLM لن يتم دمجه في أوزان LLM، بل يتم تشغيله بالتعاون مع LLM من خلال استدعاء هيكل Agent، ونظام المكونات الديناميكي، والتوصيل السريع لوحدات LoRA، و RAG (التوليد المعزز بالاسترجاع) وغيرها من الطرق. يحتفظ هذا الهيكل بقدرة LLM الواسعة، بينما يعزز الأداء المتخصص من خلال وحدات التعديل الدقيق، مما يشكل نظام ذكاء مركب عالي المرونة.

قيمة وحدود Crypto AI في طبقة النموذج

مشاريع الذكاء الاصطناعي في التشفير صعبة في جوهرها لتعزيز القدرات الأساسية للنماذج اللغوية الكبيرة (LLM) بشكل مباشر، والسبب الأساسي هو

  • الحواجز التقنية مرتفعة للغاية: إن حجم البيانات وموارد الحوسبة والقدرات الهندسية المطلوبة لتدريب نموذج الأساس هائلة للغاية، والآن فقط تمتلك شركات التكنولوجيا الكبرى مثل الولايات المتحدة والصين القدرات المناسبة.
  • قيود النظام البيئي المفتوح: على الرغم من أن النماذج الأساسية الرئيسية مفتوحة المصدر، إلا أن المفتاح الحقيقي لدفع اختراق النموذج لا يزال مركزيًا في مؤسسات البحث العلمي ونظم الهندسة المغلقة، حيث أن مساحة المشاركة للمشاريع على السلسلة في طبقة النموذج الأساسية محدودة.

ومع ذلك، يمكن لمشاريع Crypto AI أن تحقق قيمة إضافية من خلال ضبط نماذج اللغة المتخصصة (SLM) فوق نماذج الأساس المفتوح المصدر، بالإضافة إلى دمج القابلية للتحقق وآليات التحفيز الخاصة بـ Web3. كـ "طبقة واجهة محيطة" في سلسلة صناعة الذكاء الاصطناعي، تتجلى في اتجاهين رئيسيين:

  • طبقة التحقق الموثوق: من خلال تسجيل مسار توليد النموذج، ومساهمات البيانات واستخدامها على السلسلة، تعزز من إمكانية تتبع مخرجات الذكاء الاصطناعي وقدرتها على مقاومة التلاعب.
  • آلية التحفيز: بفضل الرمز الأصلي، تستخدم لتحفيز تحميل البيانات، استدعاء النماذج، تنفيذ الوكلاء (Agent) وغيرها من السلوكيات، لبناء حلقة إيجابية لتدريب النماذج والخدمات.

تحليل ملاءمة نوع نموذج الذكاء الاصطناعي وتصنيفه مع البلوك تشين

من هنا نرى أن النقاط الممكنة لمشاريع Crypto AI من نوع نموذجية تتركز بشكل رئيسي على تحسين خفة نماذج SLM الصغيرة، ودخول البيانات والتحقق منها على السلسلة من خلال بنية RAG، وأيضًا نشر النماذج المحلية Edge وتحفيزها. بالاستفادة من قابلية التحقق من blockchain وآلية الرموز، يمكن أن توفر Crypto قيمة فريدة لهذه السيناريوهات ذات الموارد المتوسطة والمنخفضة، مما يشكل قيمة مميزة لطبقة واجهة AI.

سلسلة blockchain AI المستندة إلى البيانات والنماذج، يمكن أن تسجل بوضوح وسجل لا يمكن تغييره للمساهمات من كل بيانات ونماذج، مما يعزز بشكل كبير مصداقية البيانات وقابلية تتبع تدريب النموذج. في الوقت نفسه، من خلال آلية العقود الذكية، يتم تفعيل توزيع المكافآت تلقائيًا عند استدعاء البيانات أو النموذج، مما يحول سلوك AI إلى قيمة رمزية قابلة للقياس والتداول، ويُبنى نظام حوافز مستدام. بالإضافة إلى ذلك، يمكن لمستخدمي المجتمع أيضًا تقييم أداء النموذج من خلال التصويت بالرموز، والمشاركة في وضع القواعد والتكرار، وتحسين هيكل الحكم اللامركزي.

ثانياً، نظرة عامة على المشروع | رؤية OpenLedger للذكاء الاصطناعي في سلسلة الكتل

OpenLedger هو أحد المشاريع القليلة في سوق blockchain AI التي تركز على آليات تحفيز البيانات والنماذج. لقد طرح مفهوم "Payable AI" لأول مرة، والذي يهدف إلى بناء بيئة تشغيلية للذكاء الاصطناعي تكون عادلة وشفافة وقابلة للتجميع، وتحفيز المساهمين في البيانات ومطوري النماذج وبناة تطبيقات الذكاء الاصطناعي للتعاون على نفس المنصة، والحصول على عوائد على السلسلة بناءً على المساهمات الفعلية.

OpenLedger توفر حلقة مغلقة كاملة من "توفير البيانات" إلى "نشر النماذج" ثم "استدعاء الأرباح"، تشمل وحداتها الأساسية:

  • مصنع النماذج: دون الحاجة إلى برمجة، يمكن استخدام LLM مفتوح المصدر لتدريب وتعديل نموذج مخصص باستخدام LoRA.
  • OpenLoRA: يدعم التعايش مع آلاف النماذج، التحميل الديناميكي حسب الحاجة، مما يقلل بشكل كبير من تكاليف النشر؛
  • PoA (إثبات النسبة): تحقيق قياس المساهمة وتوزيع المكافآت من خلال تسجيل استدعاءات الشبكة.
  • Datanets: شبكة بيانات هيكلية موجهة نحو سيناريوهات عمودية، تم بناؤها والتحقق منها من خلال التعاون المجتمعي؛
  • منصة اقتراح النماذج (Model Proposal Platform): سوق نماذج على السلسلة يمكن تجميعها واستدعاؤها ودفع ثمنها.

من خلال الوحدات المذكورة أعلاه، قامت OpenLedger ببناء "البنية التحتية للاقتصاد الذكي" المدفوعة بالبيانات والقابلة للتجميع، مما يعزز تحويل سلسلة قيمة الذكاء الاصطناعي إلى السلسلة.

وفي اعتماد تقنية blockchain، قامت OpenLedger ببناء بيئة تشغيل بيانات وعقود عالية الأداء ومنخفضة التكلفة وقابلة للتحقق باستخدام OP Stack + EigenDA كقاعدة.

  • مبني على OP Stack: يعتمد على تقنية Optimism، يدعم تنفيذ عالي القدرة وبتكاليف منخفضة؛
  • تسوية على الشبكة الرئيسية للإيثيريوم: تأمين أمان المعاملات وسلامة الأصول؛
  • متوافق مع EVM: يسهل على المطورين نشر وتوسيع بسرعة بناءً على Solidity؛
  • EigenDA يوفر دعم توفر البيانات: يقلل بشكل كبير من تكاليف التخزين، ويضمن قابلية التحقق من البيانات.

بالمقارنة مع NEAR ، الذي يركز أكثر على الطبقة الأساسية ويعزز سيادة البيانات و "الوكلاء الذكاء الاصطناعي على بنية BOS" ، تركز OpenLedger بشكل أكبر على بناء سلسلة ذكاء اصطناعي مخصصة تحفز البيانات والنماذج ، وتهدف إلى تحقيق دورة قيمة قابلة للتتبع وقابلة للتجميع ومستدامة لتطوير واستخدام النماذج على السلسلة. إنها بنية تحتية لتحفيز النماذج في عالم Web3 ، تجمع بين استضافة النماذج ، والفوترة للاستخدام ، وواجهات قابلة للتجميع على السلسلة ، مما يعزز مسار تحقيق "النماذج كأصول".

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ Moments-19C2276FCCC616CCF9260FB7E35C9C24)

ثلاثة، المكونات الأساسية والتقنية لـ OpenLedger

3.1 مصنع النماذج، نموذج مصنع بدون كود

ModelFactory هو منصة لتعديل نموذج اللغة الكبير (LLM) ضمن نظام OpenLedger البيئي. بخلاف أطر التعديل التقليدية، يوفر ModelFactory واجهة رسومية بحتة، دون الحاجة إلى أدوات سطر الأوامر أو تكامل API. يمكن للمستخدمين تعديل النموذج بناءً على مجموعة البيانات التي تم الحصول على إذنها ومراجعتها على OpenLedger. تم تحقيق سير العمل المتكامل لتصريح البيانات وتدريب النموذج ونشره، وتشمل العمليات الأساسية ما يلي:

  • التحكم في وصول البيانات: يقدم المستخدم طلب البيانات، يقوم المزود بمراجعته والموافقة عليه، يتم توصيل البيانات تلقائيًا بواجهة تدريب النموذج.
  • اختيار النموذج وتكوينه: يدعم LLM الشائعة، من خلال واجهة المستخدم الرسومية لتكوين المعلمات الفائقة.
  • تحسين خفيف الوزن: محرك LoRA / QLoRA المدمج، يعرض تقدم التدريب في الوقت الحقيقي.
  • تقييم النموذج ونشره: أدوات تقييم مدمجة، تدعم تصدير النشر أو مشاركة استدعاء النظام البيئي.
  • واجهة التحقق التفاعلية: توفر واجهة حوارية، مما يسهل اختبار قدرة النموذج على الإجابة.
  • توليد تتبع RAG: تقديم إجابات مع إشارات للمصدر، لتعزيز الثقة وقابلية التدقيق.

يتضمن هيكل نظام Model Factory ستة وحدات، تشمل المصادقة على الهوية، حقوق البيانات، تعديل النموذج، التقييم والنشر، بالإضافة إلى تتبع RAG، لإنشاء منصة خدمات نماذج متكاملة آمنة وقابلة للتحكم، مع تفاعل في الوقت الحقيقي وإمكانية تحقيق دخل مستدام.

جدول ملخص قدرات نماذج اللغة الكبيرة المدعومة حاليًا بواسطة ModelFactory كالتالي:

  • سلسلة LLaMA: الأكثر انتشارًا في النظام البيئي، مجتمع نشط، أداء عام قوي، وهي واحدة من أكثر النماذج الأساسية مفتوحة المصدر شيوعًا في الوقت الحالي.
  • مِسْترال: بنية فعالة، أداء استدلال ممتاز، مناسبة للتنفيذ المرن والموارد المحدودة.
  • Qwen:الأداء الممتاز في المهام باللغة الصينية، القوة الشاملة، مناسبة للاختيار الأول للمطورين المحليين.
  • ChatGLM: تأثير المحادثة باللغة الصينية بارز، مناسب لخدمة العملاء المتخصصة والسيناريوهات المحلية.
  • Deepseek:تتميز بالأداء المتفوق في توليد الشيفرات والاستدلال الرياضي، وتناسب أدوات المساعدة في التطوير الذكي.
  • Gemma: نموذج خفيف الوزن أطلقته Google، ذو هيكل واضح، سهل الاستخدام والتجريب بسرعة.
  • فالكون: كان معيار الأداء سابقًا، مناسبًا للبحث الأساسي أو اختبارات المقارنة، ولكن نشاط المجتمع قد انخفض.
  • BLOOM: دعم متعدد اللغات قوي، لكن أداء الاستنتاج ضعيف، مناسب لأبحاث تغطية اللغات.
  • GPT-2: نموذج مبكر كلاسيكي، مناسب فقط لأغراض التعليم والتحقق، ولا يُنصح باستخدامه في النشر الفعلي.

على الرغم من أن مجموعة نماذج OpenLedger لا تحتوي على أحدث نماذج MoE عالية الأداء أو النماذج متعددة الوسائط، إلا أن استراتيجيتها ليست قديمة، بل تعتمد على قيود الواقع المعتمدة على السلسلة (تكاليف الاستدلال، التكيف مع RAG، التوافق مع LoRA، بيئة EVM) لتكوين "أولوية العملية".

تعتبر Model Factory كأداة سلسلة بدون كود، حيث تحتوي جميع النماذج على آلية إثبات المساهمة المدمجة، مما يضمن حقوق المساهمين في البيانات ومطوري النماذج، وتتميز بقدرتها على الوصول المنخفض، وإمكانية تحقيق الدخل، والتركيب، مقارنة بأدوات تطوير النماذج التقليدية:

  • للمطورين: تقديم مسار كامل لنموذج الحضانة، التوزيع، والدخل؛
  • بالنسبة للمنصة: تشكيل تدفق أصول النموذج وبيئة التجميع؛
  • للمستخدمين: يمكن دمج النماذج أو الوكلاء كما لو كنت تستدعي واجهة برمجة التطبيقات.

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ Moments-F23F47F09226573B1FCACEBDCFB8c1f3)

3.2 OpenLoRA ، تحويل الأصول على السلسلة لنموذج الضبط الدقيق

LoRA (التكيف منخفض الرتبة) هي طريقة فعالة لضبط المعلمات، من خلال إدخال "مصوفات منخفضة الرتبة" في نموذج كبير تم تدريبه مسبقاً لتعلم مهام جديدة، دون تعديل معلمات النموذج الأصلي، مما يقلل بشكل كبير من تكاليف التدريب ومتطلبات التخزين. عادةً ما تحتوي نماذج اللغة الكبيرة التقليدية على عشرات المليارات أو حتى مئات المليارات من المعلمات. لاستخدامها في مهام محددة، يجب إجراء ضبط. الاستراتيجية الأساسية لـ LoRA هي: "تجميد معلمات النموذج الكبير الأصلي، وتدريب فقط مصوفات المعلمات الجديدة المدخلة."، مع كفاءة عالية في المعلمات، وسرعة في التدريب، ومرونة في النشر، تُعتبر حالياً الطريقة الشائعة الأكثر ملاءمة لنشر نماذج Web3 واستدعائها بشكل مدمج.

OpenLoRA هو إطار استدلال خفيف الوزن تم بناؤه بواسطة OpenLedger، مصمم خصيصًا لنشر نماذج متعددة ومشاركة الموارد. الهدف الأساسي منه هو معالجة المشكلات الشائعة في نشر نماذج الذكاء الاصطناعي الحالية، مثل التكاليف العالية، وانخفاض إعادة الاستخدام، وإهدار موارد GPU، وتعزيز تنفيذ "الذكاء الاصطناعي القابل للدفع".

مكونات النظام الأساسية لـ OpenLoRA ، مبنية على تصميم معياري ، تغطي تخزين النماذج ، تنفيذ الاستدلال ، توجيه الطلبات وغيرها من الجوانب الأساسية ، لتحقيق كفاءة وتكلفة منخفضة في نشر وطلب نماذج متعددة.

  • وحدة تخزين محولات LoRA ( محولات LoRA للتخزين ): يتم استضافة محول LoRA الذي تم تعديله في OpenLedger، مما يتيح التحميل عند الطلب، وتجنب تحميل جميع النماذج في الذاكرة مسبقًا، مما يوفر الموارد.
  • استضافة النموذج ودمج الطبقة الديناميكية (Model Hosting & Adapter Merging Layer): جميع نماذج التخصيص الدقيقة تشترك في النموذج الأساسي الكبير، وخلال الاستدلال يتم دمج محول LoRA بشكل ديناميكي، ويدعم الاستدلال المشترك لعدة محولات، مما يعزز الأداء.
  • محرك الاستدلال (Inference Engine): يدمج تقنيات تحسين CUDA متعددة مثل Flash-Attention و Paged-Attention و SGMV.
  • وحدة توجيه الطلبات وإخراج التدفق (Request Router & Token Streaming): توجيه ديناميكي إلى المحول الصحيح بناءً على النموذج المطلوب في الطلب، وتحقيق توليد التدفق على مستوى الرمز من خلال تحسين النواة.

تتعلق عملية الاستدلال لـ OpenLoRA بعملية خدمة نموذج "ناضجة وعامة" على المستوى الفني، كما يلي:

  • تحميل النموذج الأساسي: يقوم النظام بتحميل مسبق مثل LLaMA 3،
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 5
  • مشاركة
تعليق
0/400
airdrop_huntressvip
· منذ 4 س
التركيز على بيانات الذكاء الاصطناعي
شاهد النسخة الأصليةرد0
FudVaccinatorvip
· منذ 4 س
تكديس المواد له العمق
شاهد النسخة الأصليةرد0
SeeYouInFourYearsvip
· منذ 4 س
المستقبل مشرق
شاهد النسخة الأصليةرد0
StablecoinArbitrageurvip
· منذ 4 س
نموذج مدفوع بالبيانات المثيرة للاهتمام
شاهد النسخة الأصليةرد0
GasFeeDodgervip
· منذ 4 س
أصبح البناء أكثر تنوعاً
شاهد النسخة الأصليةرد0
  • تثبيت