النسخة العامة من Mythos متاحة على الإنترنت وأقوى نموذج لكلود معروض للبيع على موقع Layers

تطلق Anthropic رسميًا كل من Claude Fable 5 وClaude Mythos 5. الأول مفتوح للمستخدمين العاديين، بينما يظل الأخير مقصورًا على "شركاء الأمان الموثوق بهم". يمكن القول أن تسمية النموذج الجديد تتماشى مع أسلوب كلود الثابت.

من هايكو (هايكو) إلى السوناتة (السوناتة) إلى أوبوس (تحفة فنية)، كانت الأنثروبيك تضع نماذج مع المفاهيم الأدبية والفنية. بواسطة ميثوس، توسع الاسم من الأعمال الأدبية إلى "الأساطير" نفسها.

تأتي الحكاية من الكلمة اللاتينية fabula، والتي تعني "شيء يقال"، ولها نفس أصل الأسطورة اليونانية. عند ترجمتها حرفيًا، يطلق عليها عمومًا "الحكاية". الاسم يشبه تمامًا موضع النموذج الجديد، وهو نموذج "على مستوى الأسطورة"، و"أسطورة مفتوحة".

وفقًا لوصف Anthropic، تشترك Fable 5 وMythos 5 في نفس النموذج الأساسي، لكنهما معبأتان في غلاف آمن أكثر ملاءمة للتوزيع العام. فيما يتعلق بقدرات النموذج الرسمي، يتم وضع الاثنين في نفس الموقف.

لكن النتائج هي نتائج، وإذا كان أداء Fable وMythos هو نفسه تمامًا، فأعتقد أنه لن تكون هناك حاجة لفصلهما إلى اسمين.

"الأسطورة" المعاد كتابتها

أُعيدت كتابة الأساطير، وضغطت، وعظت، وأصبحت خرافات.

وفقًا للوثائق الرسمية، فإن Fable 5 هي نسخة عامة. إنه مفتوح للمستخدمين والمطورين العاديين، ولكن في المجالات عالية المخاطر مثل أمن الشبكات والبيولوجيا والكيمياء والتقطير النموذجي، سيتم تضمين مصنفات أمان إضافية. بمجرد أن يحدد النظام أن الطلب قد يتضمن هذه التوجيهات الحساسة، لن يتم متابعة الإجابة بواسطة Fable 5، ولكنها ستعود تلقائيًا إلى Claude Opus 4.8.

تعتمد Mythos 5 على نفس النموذج الأساسي، ولكنها ترفع حواجز الحماية الخاصة بـ Fable 5 في بعض المناطق. قال Anthropic أن شركاء أمان الشبكات في Project Glasswing يمكنهم استخدام "النسخة الكاملة" من Mythos 5؛ وفي المستقبل، قد يستخدم بعض الباحثين في علوم الحياة أيضًا إصدارات تزيل القيود البيولوجية والكيميائية من خلال برنامج الوصول الموثوق.

لن نذكر Mythos غير المستخدمة في الوقت الحالي، فلننظر إلى بعض الأشياء العملية أولاً.

الأول هو التسعير. في كلمة واحدة، باهظة الثمن.

سعر Fable 5 هو 10 دولارات/مليون توكن للمدخلات و50 دولارًا/مليون توكن للمخرجات. يمكن للمطورين الآن الاتصال بـ claude-fable-5 (اسم الطراز) من خلال Claude API.

هذا السعر هو بالضبط ضعف سعر Opus 4.8، وهو نفس الوضع السريع لـ Opus 4.8. من الواضح أن Anthropic قد وضعتها في فئة أسعار أعلى من Opus.

ومع ذلك، قالت Anthropic أن هذا السعر أقل من نصف سعر Claude Mythos Preview السابق - ولكن نظرًا لأن Mythos Preview ليس نموذجًا عامًا لواجهة برمجة التطبيقات (API)، فإن المسؤول لم يقدم سعرًا قياسيًا للجمهور، ولا يمكن التحقق من هذه الجملة.

يحتاج المشتركون أيضًا إلى ملاحظة أن Fable 5 قد لا يتم تضمينها مباشرة في حزمة الاشتراك الأساسية لفترة طويلة.

ذكرت Anthropic في وصفها الرسمي أنه بعد 23 يونيو، حتى لو اشترك المستخدمون في Claude، فقد يتم توفير Fable 5 على أساس الحجم بناءً على قوة الحوسبة وقد لا يتم تضمينها مباشرة في خدمة الاشتراك الأساسية.

أصبحت هذه الشركة بخيلة أكثر فأكثر، ولكن على الأقل لا يزال لديهم فترة تجريبية مدتها نصف شهر. كما ترك المسؤول بعض الفسحة: إذا كانت موارد الطاقة الحاسوبية كافية بعد 23 يونيو، فسوف تحاول Anthropic الاستمرار في تضمين Fable 5 في Pro وMax وخدمات الاشتراك الأخرى.

ليس من الصعب فهم السعر المرتفع في حد ذاته، لكن من الأفضل التأكد من أن قدراته تستحق سعره.

انطلاقًا من النتائج الجارية، فإن Fable 5/Mythos 5 هي في الأساس أقوى لعبة Anthropic حاليًا.

ومع ذلك، هناك ملاحظة في الجدول الرسمي مفادها أن درجات كلود فابل 5 وكلود ميثوس 5 تفصل بشكل عام 1-3 نقاط مئوية فقط (باستثناء أمن الشبكات والاختبارات المتعلقة بالحيوية مع العلامات النجمية)، لذلك يوضح الجدول النتيجة الأعلى للاثنين. من الصعب عدم الشكوى من هذا.

يركز Anthropic على Fable 5 في عدة اتجاهات: هندسة البرمجيات، والعمل المعرفي، والرؤية، وذاكرة السياق الطويلة، وأبحاث علوم الحياة.

تعد هندسة البرمجيات أحد أبرز السيناريوهات. وفقًا للجدول، وصلت نسبة Fable/Mythos 5 إلى 80.3% على SWE-Bench Pro، وهي نسبة أعلى بكثير من نسبة 69.2% التي حققتها Opus 4.8؛ في لعبة FrontierCode Diamond الأكثر صعوبة، حصلت على 29.3%، بينما حصلت Opus 4.8 على 13.4% فقط، وGPT-5.5 على 5.7% فقط.

بالنسبة للعمل المعرفي والمهام البصرية، تقدم الأنثروبيك نوعين من الأدلة.

نوع واحد هو المعيار القياسي. يوضح الجدول الرسمي أن Fable/Mythos 5 سجلت 1932 في مؤشر الناتج المحلي الإجمالي (GDVal-AA)، وهي أعلى من Opus 4.8 وGPT-5.5 وGemini 3.1 Pro؛ وفي مهمة مستند الناتج المحلي الإجمالي.pdf مع الفهم البصري، وصلت إلى 29.8%، متجاوزة أيضًا النماذج الرئيسية الأخرى.

فئة أخرى هي اختبار العملاء المبكر. قالت أنثروبيك أن Fable 5 حققت أعلى الدرجات في معيار التفكير المالي المتقدم لـ Hebbia، مع تركيز مزاياها على تفكير المستندات، وفهم المخططات والجداول، وحل المشكلات؛ وأفادت IMC أيضًا أنها اجتازت تقييم تحليل المعاملات بشكل كامل تقريبًا.

من أجل إظهار القدرات البصرية لـ Fable 5، أعطت Anthropic مثالاً: في السابق، كان نموذج Claude يتطلب أدوات مساعدة معقدة للعب "Pokémon: Fire Red"، لكن Fable 5 يمكنها إكمال المستوى بإدخال مرئي فقط.

فيما يتعلق بالمهام طويلة المدى وقدرات الذاكرة، قالت Anthropic أن Fable 5 يمكنها الاستمرار في التركيز على المهام طويلة المدى بملايين الرموز المميزة واستخدام الملاحظات الخاصة بها لتحسين الإخراج.

وفي ألعاب مثل "Slay the Spire" التي تتطلب اتخاذ قرار متواصل واستراتيجية طويلة المدى، إذا تم توصيل Fable 5 بذاكرة ملف ثابتة حتى تتمكن من تسجيل الاختيارات والتجارب السابقة، فسيتم تحسين أدائها بشكل ملحوظ. التحسن هو ثلاثة أضعاف ما حدث في Opus 4.8، كما تم أيضًا زيادة عدد المرات التي يمكنك فيها الوصول إلى المستوى النهائي ثلاث مرات.

بالمناسبة، Fable هو أيضًا اسم لعبة RPG كلاسيكية، ويُترجم إلى الصينية باسم "Fable" - ربما في يوم من الأيام يمكننا أن نرى Fable يلعب "Fable".

بالإضافة إلى ذلك، فيما يتعلق بقدرات أمان الشبكة، وصلت نسبة Fable/Mythos 5 إلى 78.0% في ExploitBench Cap%، متجاوزة نسبة Claude Mythos Preview البالغة 69.0% وما يقرب من ضعف نسبة Opus 4.8.

يجب استخدام نتيجة Mythos 5 هنا، لأن Fable 5 ستعود إلى Opus 4.8 عند الطلبات عالية المخاطر.

يجب أن تكون النماذج القوية ذات طبقات

هذه المرة، وضعت Anthropic العرض المرئي لإمكانيات النموذج في صفحة منزلقة تشبه "المحفظة"، ولم تقدم سوى فقرة قصيرة من التعليقات لكل عرض توضيحي.

على سبيل المثال، كتب Fable 5 محاكاة للنظام الشمسي استنتجت الحركة المدارية للكوكب من المبادئ الأولى للفيزياء واستخدمتها للتنبؤ بكسوف الشمس.

على سبيل المثال، يمكنه تشغيل "Factory" بشكل مستقل. هذه هي لعبة أتمتة المصانع التي يحبها المهندسون. يتعين على اللاعبين جمع الموارد وتخطيط خطوط الإنتاج وبناء أنظمة الخدمات اللوجستية والطاقة.

استخدمت أنثروبيك هذا المثال لتوضيح أن Fable 5 يمكنها صياغة استراتيجيات في بيئة مفتوحة ومواصلة تعزيز بناء نظام معقد.

في عرض توضيحي آخر، قامت Fable 5 أولاً بإنشاء محرر CAD قائم على المتصفح، ثم استخدمت أداة CAD المطورة ذاتيًا لتصميم نموذج كامل يمكن طباعته ثلاثي الأبعاد. يحتوي هذا المحرر أيضًا على مساعد AI مدمج للمساعدة في النمذجة.

يركز هذا العرض التوضيحي على أن Fable 5 يكمل حلقة مغلقة: قم أولاً بإنشاء الأداة، ثم استخدم الأداة، وأخيرًا أكمل مهمة التصميم الفعلي.

العرض التوضيحي الأخير، Anthropic، أظهر محاكاة سلسة كتبها Fable 5، مع إيقاع الحركة المتزامن مع ريمكس موسيقى كلاسيكية EDM. وذكر المسؤول أيضًا على وجه التحديد أن الموسيقى يتم إنشاؤها أيضًا بواسطة Fable 5 باستخدام الكود.

تبدو هذه الأمثلة خيالية، لكن الفكرة هي نفسها: Fable 5 رائع في مزج التعليمات البرمجية والرؤية والفيزياء والتصميم والتخطيط طويل المدى في المهام.

إذا كان هذا الجزء يوضح ما يمكن أن تفعله Fable 5 بين أيدي المطورين، فإن الجزء التالي يتحدث عن ما يمكن أن تفعله Mythos 5 بين أيدي الباحثين - ولماذا تريد Anthropic فصل Fable و Mythos.

وقالت Anthropic إنه في التقييمات التي أجراها خبراء تصميم البروتين الداخليون، قام Mythos 5 بتسريع بعض جوانب عملية تصميم الدواء بنحو 10 مرات. في إحدى الحالات، تم توصيل Mythos 5 بتصميم البروتين وأدوات المعلوماتية الحيوية، دون مساعدة بشرية، لمطابقة المشغلين البشريين المهرة أو حتى تجاوزهم.

في هذه المهمة، لا يجيب Mythos 5 على الأسئلة فحسب، بل يكمل مجموعة كاملة من سير العمل العلمي: اختيار مواقع الربط، واختيار أدوات تصميم البروتين وتشغيلها، واستعادة نفسه بعد الفشل. وقال المسؤولون إنه من بين 14 هدفًا من البروتين في هذه الدراسة، أنتجت 9 منها جزيئات مرشحة قوية وتخضع حاليًا لمزيد من البحث.

ذكرت أنثروبيك أيضًا أن Mythos 5 يمكن أن يقترح بثبات فرضيات جديدة وجذابة في علم الأحياء الجزيئي. في مقارنة اختبارية عمياء مع نماذج على مستوى أوبوس، فضل العلماء الداخليون الفرضيات التي اقترحتها ميثوس في حوالي 80% من الحالات، والتي تم تقييم بعضها تجريبيًا.

وفي الوقت نفسه، تم تأكيد إحدى فرضيات Mythos 5 حول آلية جديدة لبروتين E. coli في دراسة أجراها مختبر آخر يدرس نفس المشكلة بشكل مستقل.

حتى أنها قامت بدراسة الجينوم.

وقالت أنثروبيك إن Mythos 5 أكمل دراسة جينومية جديدة بشكل مستقل تقريبًا في ما يزيد قليلاً عن أسبوع. وقد نظمت بيانات خلية واحدة من ملايين الخلايا عبر 138 نوعًا حيوانيًا، وصممت ودربت نموذجًا مخصصًا للتعلم الآلي لتحديد الخلايا التي تؤدي نفس الدور في الأنواع المختلفة.

والأمر الأكثر مبالغة هو أن Anthropic تدعي أن أداء النموذج الذي تم تدريبه بواسطة Mythos 5 يتجاوز أداء النموذج الذي تم نشره مؤخرًا في مجلة Science، على الرغم من أن نطاقه لا يتجاوز واحد بالمائة من الأخير. وقالت أنثروبيك إنها تخطط لنشر هذه النتائج في الأشهر المقبلة.

وبطبيعة الحال، لا يزال هذا الجزء بحاجة إلى انتظار الورقة والمراجعة الخارجية. ولكن إذا نظرت فقط إلى المعلومات الرسمية التي تقدمها Anthropic، فإن قدرات Mythos 5 في علوم الحياة قريبة من قدرات وكيل البحث العلمي: يمكنه قراءة الأسئلة، واستخدام الأدوات، ومعالجة البيانات، وتدريب النماذج، واقتراح الفرضيات، وتطوير البحث إلى النقطة التي يمكن نشره فيها.

وبمجرد أن يتمكن النموذج من تطوير المهام في تصميم الأدوية، والنواقل الفيروسية، وتصميم البروتين، وأبحاث الجينوم، فمن الطبيعي أن يكون له استخدامات مزدوجة.

يمكن اعتبار أن الجزء الخاص بعلوم الحياة ليس عرضًا وظيفيًا عاديًا للأسطورة 5، ولكنه عرض للحد الأعلى لقدرات Mythos 5.

ولكن تم توضيح ذلك لتوضيح أن النموذج الأساسي الذي بين يدي Anthropic قوي جدًا لدرجة أنه يجب توزيعه من خلال الوصول الموثوق به.

ومن المثير للاهتمام أن إصدار النموذج في الماضي كان أشبه بمنتج تقني: المعلمات، ونتائج التشغيل، والسعر، وطول السياق، واسم واجهة برمجة التطبيقات. القوي قوي، والإفراج هو إطلاق.

لكن هنا في ميثوس، بدأت الأمور تتعقد. وينقسم نفس النموذج الأساسي إلى نسختين. يحصل المستخدمون العاديون على Fable 5، بينما يحصل الباحثون في مجال الأمن وبعض الباحثين في علوم الحياة على Mythos 5؛ يتم تثبيت الأول في حواجز حماية أكثر صرامة، ويتطلب الأخير وصولاً موثوقًا.

لم تعد القدرات النموذجية يتم التمييز بينها فقط من خلال المستويات العالية والمنخفضة، ولكن أيضًا من خلال السلطة والسيناريوهات والمسؤوليات.

ومن الممكن أن ننظر إلى هذا باعتباره إشارة إلى أن تسويق النماذج المتطورة قد دخل مرحلة جديدة ــ فكلما كان النموذج أقوى، كلما قلت احتمالات طرحه بشكل مباشر للجميع. سيتم تقسيمها إلى إصدارات مختلفة، ووضعها في حدود أمنية مختلفة، ومن ثم إعطاؤها لأنواع مختلفة من المستخدمين.

لقد فعلت الأنثروبيك هذا أولاً لأن نموذجها كان "قويًا جدًا بحيث لا يمكن الكشف عنه بالكامل". وفي المستقبل، قد تتبع الشركات الأخرى التي ترغب في سرد القصص وإثبات قوة نماذجها هذا النهج أيضًا.