Mistral AI تطلق وكيل الإثبات مفتوح المصدر Leanstral لـ Lean 4

زاك أندرسون ١٦ مارس ٢٠٢٦ ٧:١٣ مساءً

تطلق Mistral منصة Leanstral، وكيل الذكاء الاصطناعي بمعامل 6B لـ Lean 4 للتحقق الرسمي، متفوقاً على النماذج الأكبر بتكلفة أقل بـ 1/15 تحت ترخيص Apache 2.0.

Mistral AI تطلق وكيل الإثبات مفتوح المصدر Leanstral لـ Lean 4

أصدرت Mistral AI منصة Leanstral في ١٦ مارس ٢٠٢٦—أول وكيل الذكاء الاصطناعي مفتوح المصدر مصمم خصيصاً لـ Lean 4 للتحقق الرسمي. يعمل نموذج 120B بمعامل بـ 6B معامل نشط فقط ويأتي بترخيص Apache 2.0، مما يجعل إثبات النظريات على مستوى الإنتاج متاحاً دون ميزانيات المؤسسات.

لماذا يهم هذا للعملات الرقمية؟ أصبح التحقق الرسمي—الإثبات الرياضي بأن الكود يفعل بالضبط ما يدعيه—المعيار الذهبي لتأمين العقود الذكية وبروتوكولات البلوكشين. تسببت الأخطاء في كود DeFi في خسائر بمليارات الدولارات. يمكن أن تخفض Leanstral بشكل كبير الحاجز أمام المشاريع التي تسعى للحصول على أمان تم التحقق منه.

مقايضات الأداء مقابل التكلفة

قامت Mistral باختبار Leanstral مقابل المنافسين الخاصين ومفتوحي المصدر باستخدام FLTEval، وهي مجموعة تقييم جديدة تختبر مهام هندسة الإثبات الحقيقية من مشروع إضفاء الطابع الرسمي على نظرية فيرما الأخيرة.

الأرقام مذهلة. حققت Leanstral عند pass@2 نتيجة 26.3 نقطة مقابل 36 دولاراً في تكاليف الحوسبة. حقق Claude Sonnet 4.6 نتيجة 23.7 نقطة لكنه حقق فاتورة بقيمة 549 دولاراً—أكثر من 15 ضعف التكلفة مقابل أداء أسوأ. حتى عند pass@16، حيث تحقق Leanstral 31.9 نقطة مقابل 290 دولاراً، لا تزال تكلف أقل من خُمس سعر Claude Opus 4.6 البالغ 1,650 دولاراً (على الرغم من أن Opus يتصدر الجودة بـ 39.6).

مقارنة ببدائل مفتوحة المصدر، تتسع فجوة الكفاءة أكثر. يستقر GLM5-744B-A40B وKimi-K2.5-1T-A32B حول 16-20 نقطة على الرغم من امتلاكهما 6-8 أضعاف المعاملات النشطة. يحتاج Qwen3.5-397B-A17B إلى أربع محاولات للوصول إلى 25.4 نقطة—تتفوق Leanstral على ذلك بمحاولتين.

البنية التقنية

تستخدم Leanstral بنية مزيج متناثر من الخبراء محسّنة لسير عمل هندسة الإثبات. يتكامل النموذج مع بروتوكول خادم لغة Lean من خلال MCP (بروتوكول سياق النموذج)، مدرب خصيصاً لأقصى أداء مع أدوات lean-lsp-mcp.

أُطلق Lean 4 نفسه بشكل مستقر في سبتمبر 2023 وشهد اعتماداً سريعاً لإضفاء الطابع الرسمي على الرياضيات. مكتبة Mathlib—مجموعة ضخمة من الإثباتات الرياضية—نُقلت بنجاح إلى Lean 4 في نفس العام. تُظهر مشاريع مثل الإثبات الرسمي لنظرية فيرما الأخيرة قدرة المنصة على العمل الرياضي الجاد.

التطبيقات الواقعية

عرضت Mistral منصة Leanstral وهي تتعامل مع سؤال تصحيح أخطاء حقيقي على Stack Exchange حول التغييرات الجذرية في Lean 4.29.0-rc6. شخّص الوكيل الذكاء الاصطناعي مشكلة مساواة تعريفية مع أسماء مستعارة للأنواع وحدد بشكل صحيح أن استبدال def بـ abbrev سيعيد مطابقة التكتيكات.

أظهر النموذج أيضاً ترجمة عبر اللغات، وتحويل تعريفات Rocq (المعروفة سابقاً باسم Coq) إلى Lean 4 مع الحفاظ على دلالات الإثبات وتنفيذ الترميز المخصص.

خيارات الوصول

توجد ثلاثة مسارات للنشر: التكامل المباشر في Mistral Vibe (استخدم /leanstall للبدء)، أو نقطة نهاية API مجانية على labs-leanstral-2603 لجمع الملاحظات لفترة محدودة، أو النشر الذاتي مع أوزان Apache 2.0.

بالنسبة لمشاريع البلوكشين، فإن الحساب واضح ومباشر. تطلب التحقق الرسمي تقليدياً إما شركات تدقيق باهظة الثمن أو خبرة داخلية عميقة. يمكن لوكيل مفتوح المصدر قادر على إثبات صحة الكود بمبلغ 36-290 دولاراً لكل مهمة أن يعيد تشكيل كيفية تعامل البروتوكولات مع الأمان—بافتراض أن الإثباتات تصمد في ظروف الإنتاج.

مصدر الصورة: Shutterstock