صور "سموم" Nightshade لإيقاف تدريب الذكاء الاصطناعي والمساعدة في حماية Artist

أحد المخاوف العديدة بشأن الذكاء الاصطناعي التوليدي هو قدرته على إنشاء صور باستخدام صور مأخوذة من الإنترنت دون إذن من المنشئ الأصلي. لكن هناك أداة جديدة يمكنها حل هذه المشكلة عن طريق "تسميم" البيانات المستخدمة لتدريب النموذج.

تسلط مجلة MIT Technology Review الضوء على أداة جديدة تسمى Nightshade أنشأها باحثون في جامعة شيكاغو. إنه يعمل عن طريق إجراء تغييرات صغيرة جدًا على وحدات بكسل الصورة غير المرئية للعين المجردة قبل تحميلها. يؤدي هذا إلى تسميم بيانات التدريب التي تستخدمها أدوات مثل DALL-E وStableDiffusion وMidjourney، مما يتسبب في تعطل النموذج بطرق غير متوقعة.

بعض الأمثلة على كيفية تفسير الذكاء الاصطناعي التوليدي بشكل غير صحيح لصور الأشخاص الذين تسمموا بالباذنجانيات تشمل تحويل الكلاب إلى قطط، والسيارات إلى أبقار، والقبعات إلى كعك، وحقائب اليد إلى محمصات خبز. كما أنها رائعة للإشارة إلى أنماط فنية مختلفة: تصبح التكعيبية رسومًا متحركة، والرسوم المتحركة تصبح انطباعية، والفن المفاهيمي يصبح تجريدًا.

تصف ورقة بحثية حديثة نشرها باحثون على موقع arXiv، Nightshade بأنه هجوم تسمم خاص بالتلميحات. بدلاً من تسميم ملايين الصور، يمكن لـ Nightshade تدمير إشارات الانتشار المستقرة بحوالي 50 عينة، كما هو موضح في الصورة أدناه.

وكتب الباحثون أن الأداة لا يمكنها تسميم مصطلحات سريعة محددة مثل "كلب" فحسب، بل يمكنها أيضًا "التسلل" إلى مفاهيم ذات صلة مثل "جرو" و"كلب الصيد" و"هاسكي". حتى أنه يؤثر على الصور ذات الصلة بشكل غير مباشر؛ على سبيل المثال، سيؤدي تسميم "Fantasy Art" إلى تحويل المطالبات الخاصة بـ "تنين" و"قلعة من سيد الخواتم" و"لوحة لمايكل ويلان" إلى شيء مختلف.

وقال بن تشاو، الأستاذ في جامعة شيكاغو الذي قاد الفريق الذي أنشأ Nightshade، إنه يأمل أن تكون الأداة بمثابة رادع لشركات الذكاء الاصطناعي التي لا تحترم حقوق النشر وحقوق الملكية الفكرية للفنانين. واعترف بإمكانية الاستخدام الضار، ولكن لإحداث ضرر حقيقي للنماذج الأكبر والأكثر قوة، سيحتاج المهاجمون إلى تسميم آلاف الصور لأن هذه الأنظمة مدربة على مليارات عينات البيانات.

يمكن لمدربي نماذج الذكاء الاصطناعي التوليدي أيضًا استخدام الدفاعات ضد هذه الممارسة، مثل تصفية البيانات ذات الخسارة العالية، وتحليل التردد، وطرق الكشف/الإزالة الأخرى، لكن بن تشاو قال إنها ليست قوية جدًا.

تمنح بعض شركات الذكاء الاصطناعي الكبرى للفنانين خيار عدم استخدام أعمالهم في مجموعات بيانات تدريب الذكاء الاصطناعي، ولكن قد تكون هذه عملية شاقة ولا تعالج أي عمل ربما تم إلغاؤه. يعتقد الكثيرون أن الفنانين يجب أن يكونوا قادرين على الاشتراك بدلاً من الاضطرار إلى الانسحاب.