وجدت شيئا جديدا. قم بإطعام الذكاء الاصطناعي بصورة ويمكنه تخمين شخصية الشخص لك. فقط من خلال الاعتماد على قائمة التشغيل، يمكنك تخمين الحالة العقلية الأخيرة للشخص. وهذه كلها من كيميأحدث نموذج للتفكير البصري K1يُسلِّم.



لا، لقد مر شهر واحد فقط منذ إطلاق آخر نموذج رياضي k0-math وحصل على المرتبة o1، وقد ظهر k1 لأول مرة بسرعة.

بالطبع، هذا K1 ليس بسيطًا مثل البداية، مجرد النظر إلى الصور وتحليل الشخصية.


عندما اختبرنا k0-math آخر مرة، كنا قد اختبرنا بالفعل قدرة "سيد المشكلة"، وكانت عملية التفكير في حل المشكلة مذهلة للمراجعين. من المؤسف أن بعض أسئلة الرياضيات وأسئلة الهندسة التي تدور حول المنطق أقل إثارة للاهتمام بعض الشيء.

لكن هذه المرة لدى K1 ما يقوله،يتمتع بالقدرات المنطقية والبصرية، مما يعني أنه يمكنك التقاط الصور مباشرة وتحميلها لحل المشكلات، ويُزعم أيضًا أنه قادر على مساواة أو حتى تجاوز O1 الخاص بـ OpenAI في الرياضيات والفيزياء والكيمياء.


إذا قارنا بهذه الطريقة، سنكون متحمسين للغاية. لقد حدث أن طراز k1 الجديد لا يحتاج إلى انتظار الاختبار الداخلي الآن. يمكن استخدامه في كل من التطبيق وإصدار الويب. وبدون مزيد من اللغط، سنبدأ العملية برمتها مباشرة.

عندما جئت، طرحت سؤال الهندسة K1 من امتحان القبول في الكلية لهذا العام.


بادئ ذي بدء، يفسر K1 السؤال بعناية كافية ويعرف ما هو هدفه.

يتم أيضًا أخذ نظرية جيب التمام التي قد تكون متضمنة في الشروط الواردة في السؤال في الاعتبار. إنه مشابه لتفكيرنا عند حل المشكلة. عندما نرى a²+b²−c²=2ab، سنفكر على الفور في صيغة جيب التمام c²=a²+b²-2ab·cosC.

ثم واصل الاستدلال وفقًا للصيغة والشروط، ويمكنك بسرعة العثور على الزاوية B = 60°.

اسحب لأعلى لرؤية المزيد


السؤال (2) صعب بعض الشيء، لكن المراجع قام بفحص عملية حل مشكلة k1 بعناية ووجد أن الأفكار والحلول كلها صحيحة. الإجابة النهائية لطول الضلع c=2√2 صحيحة أيضًا. (نظرًا لأن عملية التفكير في السؤال k1 طويلة جدًا، لا تظهر لقطة الشاشة.)

تم طرح نفس السؤال على o1. أولاً، فيما يتعلق بسرعة التفكير، فقد خسر o1 بالفعل خلال 58 ثانية.

من حيث الدقة، فإن o1 وk1 مرتبطان، وكلاهما على صواب.

الفرق هو أن o1 يخفي فكرة الإجابة على السؤال ولا يعطي عملية تفكير كاملة مثل k1.


ومع ذلك، هناك شيء واحد يجب قوله وهو أن المراجع لم يتفاجأ بشكل خاص بطريقة نموذج k1 في تقليد التفكير البشري. لأن نموذج k0-math صدمني في المرة الأخيرة. ويبدو أنها كانت على علم بأخطائها وستجري عمليات تحقق متكررة.يبدو أنني أجهد عقلي عند كتابة مسائل الرياضيات.

في المقابل، هذه المرة يعتبر K1 أكثر تميزًا في تعويض أوجه القصور. لقد جربت سؤال الهندسة في المدرسة الإعدادية في الرياضيات K0 آخر مرة مع K1 مرة أخرى، والآن يمكنني الإجابة عليه بشكل صحيح. حتى صعوبة امتحان القبول بالكلية ليست مخيفة.

ووجدت أيضًا أن k1 ليس جيدًا في حل مسائل الرياضيات فحسب، بل أيضًا في مسائل الفيزياء.

اسحب لأعلى لرؤية المزيد


بعد ذلك، قمت بإخراج سؤال فخ منطقي آخر بمنطق معقد قليلاً وجربته:تم شراء البطيخ بـ 50 يوانًا وبيعه بـ 70 يوانًا. تلقى الرئيس 100 يوان بالعملة المزيفة. كم من المال خسر في النهاية؟

يبدو هذا السؤال بسيطًا للوهلة الأولى، لكن إجابات مستخدمي الإنترنت على هذا السؤال متنوعة. البعض يقول خسروا 150، والبعض يقول 180، والبعض يقول 100...

دعونا نلقي نظرة على سؤال لا يستطيع الكثير من البشر اكتشافه، ونرى ما إذا كان k1 يمكنه اكتشاف الفخ الموجود بداخله.

علاوة على ذلك، تعمدت كتابة هذا السؤال يدويًا بطريقة غير متقنة، وبالمناسبة، قمت أيضًا باختبار ما إذا كانت قدرة K1 البصرية جيدة كما هو معلن.


لا تقل لي، لا تخبرني، "عيون" هذا النموذج ليست سيئة بالفعل.

من حيث دقة السؤال، جاء التحليل في النصف الأول من k1 أولاً بإجابة خسارة 100 يوان، لكنه سرعان ما نفى نفسه.

الاستمرار فيالعملة المزيفة والتغيير وربح التكلفةمع أخذ هذه العوامل المعقدة في الاعتبار، اكتشفنا أخيرًا أن الرئيس خسر 80 يوانًا. (الإجابة الصحيحة هي 80 يوان)

اسحب لأعلى لرؤية المزيد


هذه القدرة المنطقية قوية بالفعل.

بما في ذلك أنني أعطيت k1 العديد من الأسئلة المنطقية التناظرية للاختبار. وعلى الرغم من أن مسار التحليل المنطقي كان مختلفًا عن الإجابة المرجعية، إلا أن الإجابات النهائية كانت كلها صحيحة.

اسحب لأعلى لرؤية المزيد


على أي حال، بعد هذا الاختبار، وجد المراجع أن k1 يمكنه التفكير بشكل منطقي، ولديه عيون جيدة، ولديه معدل ذكاء مرتفع. كيمي هو"أن تكون كاتب أسئلة"تم تأكيد اسمه أخيرًا.

ولكن بالإضافة إلى الإجابة على الأسئلة، اكتشفت أيضًا طرقًا أكثر روعة للعب هذه المرة.

ليس هناك فائدة من تحليل البيانات والنظر في التقارير. ألا يقوم نموذج k1 بعمل استنتاجات بناءً على الصور؟ إذًا لا بد أنه جيد في التعرف على العملات القديمة، أليس كذلك؟

لقد وجدت بشكل خاص صورة للعملات الفضية من فترة جمهورية الصين على الإنترنت. كانت عملتان فضيتان مزيفتان في الأعلى وحقيقية في الأسفل. لقد أرسلته إلى k1 لمراجعة سريعة."نسخة الذكاء الاصطناعي للاستماع إلى الربيع للتعرف على الكنوز".

مصدر الصورة مستخدم Xiaohongshu @古古金来 (تم التعليق عليه بواسطة وكيل المدونة العام)


لم يعرف K1 أن العملة تعود إلى فترة جمهورية الصين فحسب، بل أخرج أيضًا جميع تفاصيل العملة. وفي النهاية، رأى بالفعل أن العملة المذكورة أعلاه كانت مزيفة.


دعنا نرسل فقط صورة للغرفة وندع k1 يلقي نظرة على "فنغ شوي".

وماذا عن "فتحات الهواء"، والتخطيط المتناسق، وتوازن الطاقة... لقد تحدث عنها بوضوح ووضوح، بل وقدم لنا اقتراحات، مثل تغيير وضع السرير، وتقليم النباتات بانتظام، والتغيير إلى ثريا أبسط.

اسحب لأعلى لرؤية المزيد


قم بالتقاط صورة لـ k1 أثناء تناول الطعام وسيتضح لك عدد السعرات الحرارية التي استهلكتها أثناء الوجبة.

اسحب لأعلى لرؤية المزيد


ولكن ما يذهلني أكثر هو k1تخمين الفيلم من خلال النظر إلى الصورقدرة.

لقد أعطيتها لقطة شاشة من فيلم "الخطايا السبع المميتة". لا توجد خطوط، الصور فقط. بالنسبة للعديد من الأشخاص الذين لم يشاهدوا الفيلم من قبل، يصعب تخمينه.


عندما قرأت تحليل k1 لأول مرة، اعتقدت أن هذا التحليل ربما سيكون سيئًا. لكن في الثانية التالية قلت: "زاوية التصوير ونبرة التصوير ذكّرتني بأفلام ديفيد فينشر". واستنتجت أيضًا أن المشهد في لقطة الشاشة كان مشهدًا من فيلم "الخطايا السبع المميتة".


انها حقا قوية جدا ...

حتى لو قمت برمي بعض الميمات الغامضة إلى k1، فلا يزال بإمكانها شرح النقطة المضحكة بطريقة جادة.


على الرغم من المبالغة في تفسيرها قليلاً، إلا أن المعنى العام مفهوم بشكل أساسي.


دعونا نضع الأمر بهذه الطريقة، بناءً على قدرات K1 البصرية والتفكيرية، فإن الإجابة على الأسئلة أمر أساسي. طالما أن عقلك كبير بما فيه الكفاية، يمكنك فتح المزيد من طرق اللعب.

تعود قدرة k1 هذه إلى حد كبير إلى شخص يسمىسلسلة التفكير COT (سلسلة الفكر).تكنولوجيا.

المعنى العام هو أنه قبل أن يقوم النموذج بإخراج الإجابة،تقليد الطريقة التي يفكر بها العقل البشري، وتقسيم المهام المعقدة ومن ثم حلها خطوة بخطوة.يمكن لهذه التقنية أن تجعل معدل ذكاء العارضة أعلى.

من ناحية أخرى، وبمساعدة تقنية التعلم المعزز، يتعلم النموذج أيضًا التطور في عملية التجربة والخطأ المستمرة لتحقيق النتائج المثلى.تماما مثل تدريب الكلب.


أما لماذا أخذ كيمي زمام المبادرة في اختيار الرياضيات كمدخل لنموذج الاستدلال، فأعتقد أنه نفس السبب الذي يجعلنا نحن البشر نتعلم الرياضيات جيدًا ونمارس تفكيرنا.

وعلى أساس "تعلم الرياضيات جيدًا" في النموذج، يمكننا بعد ذلك تطبيق قدرة التفكير المنطقي هذه على الفيزياء والكيمياء وحتى جميع جوانب حياتنا اليومية، حتى نفهم العالم حقًا في النهاية.


ومن الواضح،القدرة على التعميم لنموذج الاستدلال كيميلقد بدأت بالفعل في الظهور.

في ظل فرضية أن البيانات قد بلغت ذروتها، فإن هذا المسار القائم على تقنية التعلم المعزز قد يسمح للنموذج بتحقيق نتائج أفضل.

ولكن في التحليل النهائي، ما هي التقنيات المستخدمة في النموذج وما مدى ارتفاع درجاته الورقية؟في الواقع، يهتم الجميع أكثر بما إذا كان النموذج سهل الاستخدام وعمليًا.

يركز Kimi، الذي كان دائمًا جيدًا في النصوص الطويلة، الآن على كل من النصوص الطويلة والتعلم المعزز، وهو أيضًا مظهر من مظاهر تعديل سمات أداته للاقتراب ببطء من احتياجات المستخدم.

بعد كل شيء، عندما لم تعد التكنولوجيا متفوقة ويمكنها مساعدة الناس على حل المشكلات العملية، فإنها ستكمل مهمتها حقًا.