واجهت Meta مؤخرًا دعوى قضائية تتعلق بانتهاك حقوق الطبع والنشر بسبب المخاطر القانونية لاستخدام آلاف الكتب المقرصنة لتدريب نماذج الذكاء الاصطناعي.يُذكر أن Meta استخدمت مجموعة بيانات "Books3" لعدد كبير من الكتب المقرصنة لتدريب نماذج LLAM1 وLLAM2 الخاصة بها. وعلى الرغم من اعتراف شركة ميتا بأنها استخدمت مجموعة بيانات Books3، إلا أنها رفضت دفع التعويض المناسب للمؤلفين.

Books3 عبارة عن مجموعة بيانات نصية تحتوي على 195000 كتاب بسعة إجمالية تبلغ حوالي 37 جيجابايت. تم إنشاؤه بواسطة باحث الذكاء الاصطناعي Shawn Presser في عام 2020 لتوفير مصدر بيانات أفضل لتحسين خوارزميات التعلم الآلي.

تستخدمه Meta أيضًا لتدريب نموذج LLAM الخاص به. ومع ذلك، يحتوي Books3 على عدد كبير من الأعمال المحمية بحقوق الطبع والنشر التي تم الزحف إليها من موقع الويب المقرصنة Bibliotik، مما يعرض إجراءات Meta للخطر القانوني.

وقد واجهت العديد من شركات التكنولوجيا شكاوى مماثلة هذا العام، متهمة إياها بانتهاك حقوق الطبع والنشر للفنانين والمؤلفين وغيرهم من منشئي المحتوى عند بناء نماذج الذكاء الاصطناعي التوليدية.

بالإضافة إلى ذلك، قد تجبر قواعد الاتحاد الأوروبي المؤقتة الجديدة بشأن الذكاء الاصطناعي الشركات على الكشف عن مجموعات البيانات المستخدمة لتدريب النماذج، وهو ما قد يعرضها لمخاطر قانونية أكبر.