تقوم OpenAI بطرح أحدث مولداتها لتحويل النص إلى صورة على نطاق أوسع. وفي يوم الخميس، ستتيح الشركة طراز DALL-E3 الجديد للاستخدام في تطبيق ChatGPT لعملاء ChatGPTPlus والمؤسسات. وقالت OpenAI إنها أعدت حزمة تخفيف أمنية للنموذج، مما يسمح لها بتوسيع إصدارها.
تم إصدار DALL-E3 لأول مرة في الشهر الماضي، وأظهرت OpenAI كيف تحسنت عن DALL-E2 السابقة من خلال السماح للمستخدمين بالاستفادة من ChatGPT لكتابة مطالبات أطول وأكثر وصفية بصريًا لاستخدامها بواسطة مولدات الصور. تمت إضافة DALL-E3 إلى Bing Chat وBing Image Generator، مما يجعل منصة Microsoft أول منصة توفر وصولاً أوسع للنموذج إلى الجمهور - حتى قبل ChatGPT.
لم تكن الضمانات المعلن عنها للحد من الصور الضارة ناجحة دائمًا، حيث قام المستخدمون بإنشاء صور لمركز التجارة العالمي يظهر فيها سبونج بوب سكوير بانتس وشخصيات أخرى تطير بالطائرات نحو المباني. على الرغم من أن Microsoft حاولت حظر بعض المطالبات، فقد أدت الحلول البسيطة الأخرى إلى نتائج مماثلة.
لقد أثارت مولدات تحويل النص إلى صورة مثل Midjourney وStableDiffusion والإصدارات السابقة من DALL-E جدلاً. قامت هذه التكنولوجيا بتصدير مواد صور محمية بحقوق الطبع والنشر، والعري غير التوافقي، وموضوعات تغيير العرق، والتمثيلات الواقعية المضللة للشخصيات العامة.
تعد OpenAI بنهج أوسع هذه المرة وقد قدمت موقعًا إلكترونيًا يعرض البحث الذي تم إجراؤه على DALL-E3. وتقول الشركة إنها "ستعمل على الحد من احتمال قيام العارضات بإنشاء محتوى من تصميم الفنانين الأحياء وصور الشخصيات العامة، وتحسين التمثيل الديموغرافي للصور التي تم إنشاؤها". لدى OpenAI أيضًا أداة داخلية لـ "مصنف المصدر"، والتي تقول إنها دقيقة بنسبة 99٪ في اكتشاف ما إذا كانت الصورة قد تم إنشاؤها بواسطة DALL-E3.