وفقًا للأخبار الصادرة يوم 12 ديسمبر، أطلقت شركة xAI، وهي شركة ناشئة في مجال الذكاء الاصطناعي مملوكة لشركة Tesla والرئيس التنفيذي لشركة SpaceX Elon Musk، مؤخرًا روبوت الدردشة Grok، ولكن يبدو أن شيئًا ما قد حدث خطأ. يوم الجمعة، نشر مختبر الأمان Jax Winterbourne لقطة شاشة على منصة التواصل الاجتماعي
وقد أثار هذا فضول الناس لأن شركة OpenAI لم تطور Grok، ولا يزال الطرفان متنافسين.
والأمر الأكثر إثارة للاهتمام هو أن الأشخاص في xAI لم ينفوا حدوث هذا السلوك في نماذج الذكاء الاصطناعي الخاصة بهم. كتب إيغور بابوشكين في رده: "المشكلة هي أنه عندما كنا ندرب Grok، كانت الشبكة مليئة بمخرجات ChatGPT، واستخدمنا بعضها عن طريق الخطأ. كما أننا فوجئنا جدًا عندما لاحظنا هذه المشكلة لأول مرة. على أي حال، هذه المشكلة نادرة جدًا، والآن بعد أن أدركنا ذلك، سنتأكد من أن الإصدارات المستقبلية من Grok لا تعاني من هذه المشكلة. لا تقلق، لم يتم استخدام كود OpenAI لتطوير Grok."
ردًا على بابوشكين، كتب وينتربورن: "شكرًا لك على ردك. سأقول أن هذا الموقف ليس نادرًا ويحدث بشكل متكرر عندما يتعلق الأمر بإنشاء التعليمات البرمجية. ومع ذلك، سأترك الأمر لأولئك المتخصصين في نماذج اللغات الكبيرة والذكاء الاصطناعي لمناقشة هذا الأمر بشكل أكبر. ففي نهاية المطاف، أنا مجرد شخص عادي."
لكن بالنسبة للعديد من الخبراء، بدا تفسير بابوشكين غير مقنع. عادةً لا تقوم النماذج اللغوية الكبيرة بنشر بيانات التدريب الخاصة بها حرفيًا، وسيكون من المفهوم أن يذكر Grok سياسات OpenAI عبر الإنترنت. قد يتطلب رفض الاستجابة بناءً على سياسة OpenAI تدريبًا متخصصًا. السبب الأكثر ترجيحًا لحدوث ذلك هو أن Grok قام بضبط بيانات الإخراج الخاصة بنموذج اللغة الكبير OpenAI.
قال باحث الذكاء الاصطناعي سيمون ويليسون في مقابلة: "أنا متشكك قليلاً بشأن هذا. هل يتصرف Grok بهذه الطريقة فقط لأن الإنترنت مليء بالمحتوى الذي تم إنشاؤه بواسطة ChatGPT؟ لقد رأيت الكثير من النماذج ذات الوزن المفتوح على HuggingFace تظهر نفس السلوك، مثل أنها أيضًا نفس ChatGPT. وذلك لأن هذه النماذج تم ضبطها بدقة على مجموعات البيانات التي تم إنشاؤها باستخدام OpenAIAPI، أو باستخدام مجموعات البيانات التي تم إنشاؤها بواسطة ChatGPT نفسها. أعتقد ذلك. من المرجح أن يكون Grok قد تم ضبطه على مجموعة البيانات التي تحتوي على مخرجات ChatGPT، وليس حادثًا يعتمد على بيانات الشبكة.
نظرًا لأن نماذج اللغة الكبيرة في OpenAI أصبحت أكثر وأكثر قوة، فقد أصبح من الشائع بشكل متزايد بالنسبة لبعض مشاريع الذكاء الاصطناعي (خاصة المشاريع مفتوحة المصدر) استخدام البيانات الاصطناعية التي تم إنشاؤها بواسطة نماذج لغوية كبيرة أخرى لضبط مخرجات نماذج الذكاء الاصطناعي الخاصة بها. يمكن أن يخدم الضبط الدقيق لسلوك نموذج الذكاء الاصطناعي أغراضًا محددة، مثل تحسين قدرات البرمجة بعد إجراء تدريب أولي. في مارس من هذا العام، أثارت مجموعة من الباحثين في جامعة ستانفورد ضجة عندما استخدموا مخرجات نموذج GPT-3 الخاص بشركة OpenAI (المسمى Text-DaVinci-003) لضبط تتبع التعليمات.
عبر الإنترنت، يمكننا بسهولة العثور على العديد من مجموعات البيانات مفتوحة المصدر التي جمعها الباحثون من مخرجات ChatGPT. لذلك ربما قامت xAI بضبط Grok باستخدام إحدى مجموعات البيانات لتحقيق بعض الأهداف المحددة. هذه الممارسة شائعة جدًا لدرجة أن هناك مقالًا بعنوان "كيفية استخدام ChatGPT لإنشاء مجموعة بيانات" على موقع دليل الحياة بأسلوب الموسوعة WikiHow.
وهذه إحدى الطرق في المستقبل لاستخدام أدوات الذكاء الاصطناعي لبناء أدوات ذكاء اصطناعي أكثر تعقيدًا، تمامًا كما بدأ الناس في استخدام الحواسيب الصغيرة لتصميم المعالجات الدقيقة التي كانت أكثر تعقيدًا من الرسومات الورقية والقلم الرصاص. ومع ذلك، قد تتمكن XAI من تجنب ذلك في المستقبل عن طريق تصفية بيانات التدريب بعناية أكبر.
في حين أن استعارة أعمال الآخرين قد تكون شائعة في مجتمع التعلم الآلي (على الرغم من أن هذا عادة ما يكون مخالفًا لشروط الخدمة)، فقد أدت هذه الحادثة إلى زيادة حدة المنافسة بين OpenAI وxAI، والتي يعود تاريخها إلى انتقادات Musk السابقة لـ OpenAI. مع انتشار الأخبار التي تفيد بأن Grok قد يستعير بيانات نموذج OpenAI، نشر حساب ChatGPT الرسمي منشورًا يسخر من xAI، قائلًا: "لدينا الكثير من القواسم المشتركة" ويقتبس من مشاركة وينتربورن. رد " ماسك " قائلاً: "أنت تجمع كل بيانات التدريب من هذه المنصة، يجب أن تعرف ذلك!"