يؤدي خلل ChatGPT إلى تسريب نصائح خاصة إلى Google Search Console

في سبتمبر من هذا العام، اكتشف بعض المطورين الذين يستخدمون Google Search Console حالة شاذة - حيث ظهر نص يشبه الدردشة في تقرير حركة البحث على موقع الويب بدلاً من مصطلحات البحث القصيرة السابقة. تبدو هذه الإدخالات الجديدة أشبه بمحادثات خاصة بين المستخدمين وروبوتات الدردشة حول الأسئلة الشخصية أو المتعلقة بالعمل، بدلاً من طلبات زوار البحث المعتادة في الموقع.

تم استخدام Google Search Console في الأصل لإظهار كيفية وصول المستخدمين إلى موقع الويب من خلال بحث Google. ولصدمة مسؤولي مواقع الويب، لم يكن المحتوى الجديد يحمل أي تشابه مع مصطلحات البحث، وبدا أشبه بمحادثات خاصة مع روبوتات الدردشة التي يتم تسجيل دخولها إلى نظام كان من المفترض أن يحتوي فقط على بيانات تحليل حركة المرور.

تم نشر هذه الحالة الشاذة لأول مرة بواسطة جيسون باكر، مؤسس شركة التحليلات Quantable، على مدونة الشركة. من خلال العمل مع مستشار تحسين مواقع الويب سلوبودان مانيتش، أمضى أسابيع في تكرار التجربة واختبار مدخلات مختلفة وتتبع تفاعل وظيفة البحث في ChatGPT مع نظام فهرسة Google. وكشفت النتائج النهائية عن مخاطر الخصوصية التي تجاوزت مجرد "مجرد عطل".

وفقًا لاختبار باكر ومانيتش، فإن بعض جلسات ChatGPT توجه عن غير قصد مطالبات المستخدم إلى عمليات بحث Google. لقد قاموا بتتبعه مرة أخرى إلى نمط عنوان URL محدد – https://openai.com/index/chatgpt/ – والذي يظهر بشكل متكرر في بداية المحتوى المسرب. عندما يقوم Google بتجزئة الكلمات على العنوان، سيتم تحليلها إلى "openai" و"index" و"chatgpt". بالنسبة لمواقع الويب التي حصلت على تصنيف مرتفع لهذه الكلمات، يمكنك أن ترى أن بعض مطالبات مستخدم ChatGPT يتم تسجيلها في الواجهة الخلفية لـ Search Console.

بمعنى آخر، إذا أدت نصيحة مستخدم مقدمة من ChatGPT إلى إجراء بحث خارجي، فسيسجل Google أحيانًا النصيحة نفسها كمصطلح بحث. بالنسبة لمسؤولي المواقع المتأثرة، ستظهر كلمات المطالبة المسربة في الخلفية كبيانات حركة المرور.

وأقرت شركة OpenAI بالمشكلة، واصفة إياها بأنها "خلل في التوجيه أثر لفترة وجيزة على عدد صغير من عمليات البحث" وقالت إنه تم إصلاحها دون الخوض في تفاصيل. رحب باكر بالحل السريع الذي قدمته OpenAI، لكنه أشار إلى أن الشركة لم تعالج السؤال الأكبر: ما إذا كان الحادث أكد أن ChatGPT استمر في استخراج نتائج بحث Google لتعزيز استجابته.

تتضمن هذه المشكلة سلوك "تصفح الويب" الذي يقدمه ChatGPT في الإصدار الجديد من نموذج GPT-5 - عندما يحدد النظام أن المطالبة تتطلب أحدث المعلومات أو معلومات خارجية، سيتم تشغيل بحث على الويب. ومع ذلك، اكتشف باكر ومانيتش وجود معلمة "تلميحات = بحث" في أحد إصدارات واجهة الدردشة، مما أدى إلى إجراء بحث في كل مرة تقريبًا.

كما تسبب خطأ في مربع الإدخال في إلحاق عنوان URL المُحيل بكل استعلام. بهذه الطريقة، في كل مرة يقوم فيها ChatGPT بإجراء بحث، لا يقوم Google بتسجيل عنوان URL فحسب، بل يسجل أيضًا مطالبة المستخدم. نظرًا لأن Search Console تتتبع سلسلة البحث بأكملها، فإن هذا يجعل مطالبات المستخدم "مرئية بالكامل" لمالك الموقع ذي الصلة.

ويعتقد باكر أن النظام يتفاعل بشكل مباشر مع البنية الأساسية لفهرسة Google، وليس من خلال واجهة برمجة تطبيقات خاصة أو قناة بيانات داخلية (والتي لن تظهر في Search Console). تظهر هذه الرؤية غير المتوقعة في الواقع أن ChatGPT يجري عمليات بحث مباشرة على Google ويكشف مدخلات المستخدم إلى Google وجميع المواقع ذات الصلة.

وقالت OpenAI إنه تم تسريب عدد صغير جدًا من طلبات البحث ولم تذكر رقمًا محددًا، لذلك ليس من الواضح بعد عدد المستخدمين النشطين أسبوعيًا البالغ عددهم 700 مليون مستخدم.

في السابق، كانت هناك مشكلة حيث اكتشف المستخدمون أن روابطهم العامة إلى ChatGPT مضمنة في موقع الويب الرئيسي لشركة Google. في ذلك الوقت، ادعى OpenAI أن المستخدم قام بتشغيل مفتاح المشاركة عن طريق الخطأ. وفي هذه الحالة، أكد باكر أنه لم يتسبب أي إجراء من جانب المستخدم في حدوث التسرب. وقال لـ Ars Technica في مقابلة: "لا توجد آلية موافقة". "لم ينقر أحد على زر "مشاركة"، وتم توجيه الكلمات السريعة بشكل غير صحيح." على عكس الصفحات العامة، لا يمكن للمستخدمين المتأثرين حذف الإدخالات في Search Console يدويًا، لذلك سيتم عرض المحتوى دائمًا لأصحاب مواقع الويب الذين يقومون بتصنيف الكلمات الرئيسية ذات الصلة.

ويشتبه الباحثون في أن هذا الشذوذ قد يكون مرتبطًا أيضًا بظاهرة تُعرف في دوائر تحليلات محركات البحث باسم "فم التمساح" - وهي زيادة كبيرة في مرات الظهور ولكن انخفاض في النقرات على الرسم البياني في Search Console. إذا قام نظام OpenAI بالاستعلام بشكل متكرر عن Google بعدد كبير من الاستعلامات الاصطناعية، فمن المحتمل أن يؤدي ذلك إلى تشويه بيانات التحليل هذه.

لا يزال باكر ومانيتش غير قادرين على تأكيد ما إذا كان إصلاح OpenAI يحظر تمامًا جميع أنواع تسرب الكلمات السريعة، أو يحل فقط خطأ في آلية توجيه عنوان URL المحددة. قالوا إنهم بحاجة إلى مواصلة الاهتمام. وقال باكر: "لا نعرف حتى الآن ما إذا كان يؤثر فقط على واجهة معينة، أو ما إذا كان يشمل نطاقًا أوسع من المحادثات". "باختصار، هذا يذكرنا بأنه لا يزال هناك العديد من المخاطر التي لا يمكن السيطرة عليها ولا يمكن التنبؤ بها في معالجة بيانات المستخدم من قبل الأنظمة التي تقف وراء أدوات الذكاء الاصطناعي هذه."