رفعت شركة Gracenote، وهي شركة خدمات البيانات الوصفية وتحديد المحتوى المملوكة لشركة Nielsen، دعوى قضائية ضد OpenAI في المحكمة الفيدرالية الأمريكية للمنطقة الجنوبية من نيويورك، متهمة شركة الذكاء الاصطناعي بالزحف واستخدام قاعدة بيانات التعريف الخاصة بالوسائط وإطار ربط البيانات الفريد على نطاق واسع دون تصريح ودون دفع أي رسوم، لتدريب نماذج لغوية كبيرة تدعم المنتجات التجارية مثل ChatGPT، مما يشكل انتهاكًا خطيرًا لحقوق الطبع والنشر ويعرض أعمالها الأساسية للخطر.

ذكرت Gracenote في الشكوى أنها اعتمدت على مئات المحررين على مر السنين لتحرير محتوى الأفلام والتلفزيون والموسيقى والرياضة يدويًا حول العالم وإضافة تعليقات توضيحية إليه، وأنشأت "قاعدة بيانات برامج" تتضمن مقدمات البرامج وأوصاف ميزات الفيديو ومعرفات المحتوى الفريدة ورسوم بيانية للعلاقات المعقدة، وأكملت التسجيل لدى مكتب حقوق الطبع والنشر الأمريكي. تعتقد الشركة أن قاعدة البيانات هذه لا تحتوي فقط على محتوى نصي محدد، ولكنها تتضمن أيضًا تصميمًا هيكليًا خاصًا لتصنيف الأعمال المختلفة وربطها وتنظيمها. يعد "إطار العلاقة" هذا مصدرًا مهمًا للقيمة لخدماتها لعملاء المؤسسات مثل منصات الوسائط المتدفقة وشركات تصنيع أجهزة التلفاز الذكية.

تنص الشكوى على أن OpenAI قامت بالزحف إلى البيانات المذكورة أعلاه واستيعابها دون إذن، وعندما طرح المستخدمون أسئلة من خلال ChatGPT، قام بإخراج وصف كان مشابهًا إلى حد كبير أو حتى متسقًا تمامًا مع مقدمة برنامج Gracenote بطريقة شبه حرفية. تشمل الأمثلة التي قدمتها Gracenote عندما طلب أحد المستخدمين من ChatGPT وصف المسلسل التلفزيوني الشهير Game of Thrones، وتوصل النموذج إلى محتوى مطابق تقريبًا للإصدار الذي كتبه محررو Gracenote. وقالت الشركة أيضًا إن إصدارات متعددة من ChatGPT كانت قادرة على قراءة أجزاء كبيرة من أوصاف البرامج في قاعدة البيانات الخاصة بها مع عدد قليل جدًا من الكلمات السريعة، مما يشير إلى أن النص ذي الصلة وبنيته التنظيمية الأساسية قد تم نسخهما مباشرة ودمجهما في النموذج.

اقترحت Gracenote أن الاستخدام غير المصرح به لـ OpenAI لبياناتها الوصفية وإطارها العلائقي لا ينتهك فقط النصوص المحمية بحقوق الطبع والنشر وهياكل قواعد البيانات، ولكنه يوفر أيضًا لموزعي محتوى الوسائط ومصنعي المعدات إمكانية إنشاء خدمات بيانات وصفية بديلة تعتمد على "البيانات التي يتم الزحف إليها مجانًا"، وبالتالي إضعاف القدرة التنافسية في السوق لمنتجات Gracenote المماثلة بشكل مباشر. تحذر الشكوى من أنه إذا لم يكن من الممكن إيقاف هذا السلوك ومعالجته، فيمكن لمصنعي المحطات الطرفية مثل أجهزة التلفاز الذكية الاعتماد على البيانات "المشتقة عكسيًا" من نماذج الذكاء الاصطناعي لبناء منصات البيانات الوصفية الخاصة بهم والتي تتنافس مع Gracenote دون الحاجة إلى دفع أي رسوم ترخيص.

فيما يتعلق بالمطالبات، تعتمد Gracenote على حقيقة أن قاعدة البيانات الخاصة بها قد تم تسجيلها لدى مكتب حقوق الطبع والنشر الأمريكي، وبالإضافة إلى المطالبة بالتعويض عن الخسائر الفعلية، فإنها تسعى أيضًا للحصول على تعويضات قانونية للتعامل مع ما تدعي أنه انتهاك مستمر وواسع النطاق. يشير ما يسمى بالأضرار القانونية إلى مبلغ ثابت أو نطاق يحدده القانون مسبقًا لأنواع معينة من انتهاك حقوق الطبع والنشر، بينما تُستخدم الأضرار الفعلية لتعويض صاحب الحق عن الخسائر الاقتصادية الفعلية التي تكبدها بسبب الانتهاك.

ردًا على مقابلة مع أكسيوس، قال متحدث باسم OpenAI إن نماذجها "تمكن الابتكار" ويتم تدريبها على "البيانات المتاحة للعامة" ويدعمها "الاستخدام العادل". وقد زعمت العديد من شركات الذكاء الاصطناعي، بما في ذلك OpenAI، باستمرار أن نماذج التدريب عن طريق الزحف إلى محتوى الإنترنت العام تتوافق مع تحديد الاستخدام العادل بموجب قانون حقوق الطبع والنشر الحالي في الولايات المتحدة، على أساس أن هذه البيانات يمكن أن تزود المستخدمين بخدمات ومعلومات جديدة ومفيدة بعد تحويلها بواسطة النموذج.

سبب آخر وراء جذب الدعوى القضائية التي رفعتها Gracenote الانتباه هو أن الشركة كانت دائمًا منفتحة للتعاون مع شركات الذكاء الاصطناعي وقد توصلت إلى اتفاقيات ترخيص بيانات متعددة متعلقة بالذكاء الاصطناعي مع Samsung وGoogle وشركات أخرى. ذكرت Gracenote في الشكوى أنها اتصلت بـ OpenAI عدة مرات لمناقشة مسائل الترخيص، ولكن "تم رفضها أو تجاهلها بشكل متكرر لفترة طويلة من الزمن" وبالتالي اضطرت إلى اللجوء إلى التقاضي لحماية حقوقها ومصالحها. وشدد الرئيس التنفيذي للشركة جاريد غروسد في بيان له على أن "دعم تطوير الذكاء الاصطناعي ومعارضة السرقة ليسا متعارضين. إنهما الطريق الوحيد للتنمية المستدامة للصناعة"، قائلا إن الدعوى القضائية تهدف إلى حماية هذا المستقبل.

يعتقد المتخصصون القانونيون أنه مع وجود نزاعات متعددة حول حقوق الطبع والنشر بين شركات الإعلام والمعلومات وشركات الذكاء الاصطناعي التي تنتظر أحكام المحكمة، فمن المرجح أن تصبح هذه القضية مرجعًا مهمًا للقضاة لفحص ما إذا كانت "الأعمال غير التقليدية" مثل هياكل قواعد البيانات وخرائط ارتباط البيانات الوصفية يمكنها الحصول على حماية حقوق الطبع والنشر وكيفية تحديد "حدود الاستخدام العادل للنماذج الكبيرة". وشددت Gracenote في شكواها على أن الكثير من المحتوى الذي تنتجه OpenAI "مطابق تقريبًا" للبيانات الوصفية التي رخصتها لعملائها. ولذلك، فهي لا تستمد معلومات جديدة، ولكنها نسخة جوهرية من المحتوى الموجود. ستصبح هذه إحدى نقاط الخلاف الرئيسية التي تميز هذه القضية عن قضايا حقوق الطبع والنشر الأخرى الخاصة بالذكاء الاصطناعي.