DALL·E3 قادم! لن يقتصر الأمر على ذلك فحسب، بل سيتم دمجه أيضًا في ChatGPT.بمعنى آخر، بالإضافة إلى المحادثات العادية وكتابة التعليمات البرمجية وحل المسائل الرياضية،أخيرًا، أصبح لدى ChatGPT، الذي يدمج أحدث DALL·E3، وظيفة صورة هذه المرة.
ChatGPT+DALL·E، هذه الموجة عبارة عن تحالف قوي. أحدهما هو الملك غير المتوج في نموذج اللغة الكبيرة، والآخر هو أيضًا الرائد في نموذج الرسم البياني فنسنت. التأثير الحقيقي سيكون حتماً 1+1>2.
يُعتقد أن هذا الإعلان الرسمي المفاجئ قد ملأ فجوة كبيرة في ChatGPT متعدد الوسائط والتي ترددت شائعات على نطاق واسع بعد ظهور GPT-4 في بداية هذا العام.
ومع ذلك، لم تعلن OpenAI عن هذا الخبر إلا الآن.وقت الإطلاق المحدد هو أكتوبر. بالنسبة لمستخدمي Plus وEnterprise Edition، سيتم أيضًا إطلاق DALL·E3 منفصل هذا الخريف.
ما مدى قوة هذا الشيء؟ على الرغم من أننا لا نستطيع أن نبدأ بعد، إلا أنه انطلاقًا من الأمثلة التي أصدرتها OpenAI، فإنها لا تزال متفجرة تمامًا.
من بينهم، قام بعض مستخدمي الإنترنت المتحمسين بالاتصال بـ Midjourney مباشرة وزودوها بمثال الكلمات السريعة لـ DALL · E3 حتى يتمكنوا من التنافس مباشرة.
ولا يمكن أن نقول النتيجة إلا:منتصف الرحلة في خطر.
الأول هو ميم طبي كلاسيكي جدًا للأفوكادو. الموجه هو: ثمرة الأفوكادو تجلس على كرسي المعالج وتقول "أشعر بالفراغ الشديد من الداخل". يوجد ثقب بحجم حفرة صغيرة في منتصف ثمرة الأفوكادو. المعالج، ملعقة، ملاحظات خربش.
على الرغم من أنه يبدو للوهلة الأولى أنهما نمطان مختلفان. ولكن إذا قارنا بعناية الكلمات السريعة، فمن الواضح أنتتجاهل Midjourney ملاحظات المعالج والملعقة والكتابة على الجدران. يتم أيضًا كتابة النص الموجود في مربع الحوار بشكل عشوائي ولا يتبع المتطلبات.
ثم طُلب منهم إنشاء صورة لقلب شفاف وطلب منهم نقش اقتباس محدد أسفل القلب.
نصيحة: هذا رسم توضيحي لقلب إنسان مصنوع من الزجاج الشفاف، يقف على قاعدة في محيط عاصف. يخترق ضوء الشمس الغيوم وينير الروح ويكشف عن الكون الصغير بداخلها. تم كتابة عبارة "اكتشف الكون بداخلك" بأحرف غامقة على القاعدة.
ليس هناك شك في أن DALL·E3 هزمت Midjourney مرة أخرى هذه المرة.بالإضافة إلى عدم نقش الشخصيات كما هو مطلوب، فشلت Midjourney أيضًا في إظهار أي تفاصيل مثل المحيط العاصف والعالم الداخلي المصغر.
إليكم صورة أخرى لكرسي كروي مستوحى من الليتشي، مع تفاصيل تستدعي مظهرًا خارجيًا أبيضًا وعرًا وتصميمًا داخليًا ناعمًا يتناقض مع ورق الحائط الاستوائي خلفه.
وهذا يجعل جميع عناصر الصورة التي تم إنشاؤها بواسطتهم تنبض بالحياة.ولكن يبدو أن Midjourney قد أساء فهم الفرق بين ورق الحائط الاستوائي والغابات الاستوائية المطيرة.
وبطبيعة الحال، فإن سوء فهم الكلمات السريعة وإخراجها من سياقها يعادل الأمراض المزمنة في نموذج مخطط فنسنت السابق.
فقط أنجب سلطعونًا مثل السلطعون الناسك...
أدى الطلب منها إنشاء فرقة غابات مجسمة ثنائية الأبعاد إلى إنتاج مجموعة ثلاثية الأبعاد...
أما بالنسبة لهذه المشاكل القديمة، وفقًا لبيان OpenAI الخاص والأمثلة المقدمة، فإن هذا الموقف غير موجود أساسًا في DALL · E3 الجديد.
بالإضافة إلى حل المشكلات القديمة، قامت DALL·E3 أيضًا بترقية بنية نسخة الجيل الثاني الأصلية.
على سبيل المثال، اسمح لهم برسم مشهد للاعب كرة سلة يغطس، حيث يكون العنصر انفجارًا في السماء المرصعة بالنجوم.
في الأصل، كانت الصور التي تم إنشاؤها بواسطة DALL·E2 تستوفي المتطلبات بالفعل. بشكل غير متوقع، كان DALL · E3 الذي تمت ترقيته أكثر واقعية، مع عرض تفاصيل مثل خطوط العضلات وألوان الكون واحدًا تلو الآخر. لقد كانت بالفعل ضربة لتقليل الأبعاد.
اليسار: DALL · E2، اليمين: DALL · E3
إجمالي،بدعم من ChatGPT، وصلت قدرة DALL·E3 على فهم اللغة إلى الحد الأقصى بشكل مباشر، ويكاد يكون من المستحيل الفوز بها.
لن تفقد النسخة المطورة من ChatGPT نقاط المعلومات الأساسية فحسب، بل حتى إذا قمت بكتابة بعض الكلمات الرئيسية هنا وهناك، فيمكن أن تساعدك على إكمال الوصف تلقائيًا ثم السماح لـ DALL·E3 بإنشاء الصورة.
لقد استوعب OpenAI جوهر "الصحراء الثقافية" لمستخدمي الإنترنت المعاصرين (رأس الكلب).
وبطبيعة الحال، فإن التكامل بين DALL·E3 وChatGPT ليس بسيطًا مثل القدرة على فهم الكلام البشري بشكل أفضل، بل سينتج أيضًا بعض الشرارات الرائعة.
على سبيل المثال، يتمتع الإصدار الذي تمت ترقيته من ChatGPT أيضًا بقدرات فهم السياق في الرسم، ويمكن استخدامه مباشرة كأداة إنتاجية.
لمعرفة مدى قوتها على وجه التحديد، يوفر الموقع الرسمي لـ OpenAI مقطع فيديو توضيحيًا. لأكون صادقًا، بعد مشاهدته، كان Shichao قلقًا بشأن وظيفة الرسام.
أولاً، اسمح لـ ChatGPT بإنشاء قنفذ عباد الشمس الفائق. سيعطيك أربع صور. بعد اختيار الشخص الذي يعجبك أكثر، يمكنك المتابعة إلى الخطوة التالية من المحادثة.
ثم قم بتسمية القنفذ Larry، واسمح لـ ChatGPT بإنشاء المزيد من الصور له.
بعد ذلك، دعونا نزيد الصعوبة وننشئ مشهدًا لإظهار منزل لاري.
يمكن أن يُظهر هذا مباشرة قوة DALL·E3+ChatGPT. لم يظل مظهر لاري كما هو فحسب (ربما تغير هذا بالنسبة لأجهزة الذكاء الاصطناعي الأخرى)، ولكن صندوق البريد الموجود عند الباب مكتوب عليه أيضًا اسم "LARRY".
بالإضافة إلى ذلك، وصف خصائص لاري، واستخدام الصور لإظهار حبه، وحتى صنع الأجهزة الطرفية لاري وتصميم بعض الملصقات، كلها أمور سهلة بالنسبة لـ ChatGPT.
وأخيرًا، دعه ينظم قصة ما قبل النوم ووضعية النهاية. ChatGPT هو أيضًا في متناول يدك. u1s1 لقد صدمت حقًا بهذا الحوار الحريري ...
برؤية هذا، حصل Shichao فجأة على إلهام جديد. بعد ذلك، يمكن إرسال المقالة التي كتبناها مباشرة إلى ChatGPT والسماح لها باستخراج الكلمات الرئيسية لعمل الغلاف.
إذا كان لديك أي متطلبات خاصة، يمكنك إخبار ChatGPT مباشرة. يمكنك أيضًا رمي الصور المرجعية لها. مهارات الصيد +1+1...
وبالقرب من المنزل، لم يتم إثبات التأثيرات المذكورة أعلاه إلا من جانب واحد بواسطة OpenAI. ولن يتم معرفة كيفية استخدامه فعليًا حتى يتم نشره على الإنترنت في أكتوبر. من المقدر أنه ستكون هناك موجة من التقنيات المخفية التي طورها مستخدمو الإنترنت بحلول ذلك الوقت. فقط انتظر وانظر.
بالإضافة إلى ذلك، عندما يتعلق الأمر بالرسم بالذكاء الاصطناعي، لا يزال هناك موضوع مشترك لا يمكن تجنبه: قضايا حقوق النشر.
لا يزال OpenAI يحتفظ بمكانته السابقة.تمامًا مثل الإصدار الثاني، يمكن استخدام الصور التي تم إنشاؤها باستخدام DALL·E3 دون إذن ويمكن استخدامها تجاريًا.
ومع ذلك، بعد أن تعلمت الكثير من الماضي، أصبحت OpenAI ذكية بعض الشيء هذه المرة، حيث قالت إن الفنانين يمكنهم اختيار رفض إرسال أعمالهم إلى DALL · E، طالما أنهم يملأون نموذجًا.
على الرغم من أن هذا يعني إلى حد ما "عدم الرفض هو الإذعان"، ولكن مقارنة بالسابق، على الأقل لم يعد الفنانون سلبيين جدًا ...
لدى DALL·E أيضًا إجراءات مضادة ضد لوحات الذكاء الاصطناعي السابقة على الإنترنت والتي غزت خصوصية الشخصيات العامة وغيرها من القضايا المتحيزة:في الاستخدام الفعلي، سيرفض ChatGPT مباشرة الطلبات التي تتضمن اسم شخصية عامة في المطالبة.
بمعنى آخر، ربما لن نرى صورًا ممتعة مثل هذه في ChatGPT...
كما شكلوا "فريقًا أحمر" لتقييم وتقليل المخاطر التي قد تنشأ عن النموذج في مراحل مختلفة.
أخيرًا، ذكرت OpenAI أيضًا على موقعها الرسمي على الإنترنت أنها تعمل على أداة للتعرف على رسومات الذكاء الاصطناعي، والتي يمكنها تحديد الصور التي تم إنشاؤها بواسطة DALL·E3.
(آمل فقط ألا تكون مثل أداة التعرف على النص السابقة التي تعمل بتقنية الذكاء الاصطناعي، لأنها كانت عديمة الفائدة وتوقفت في منتصف الطريق...
بشكل عام، ChatGPT مع وظيفة الرسم البياني Vincent كافية لإثارة موجة من الحماس في دائرة الذكاء الاصطناعي، وهذه الموجة هي النسخة المتكاملة والمحدثة من DALL·E3، والتي من الصعب ألا تكون مثيرة. على أية حال، Shichao لا يستطيع الانتظار لتجربته.
لكن بعض الناس سعداء والبعض الآخر قلقون. لقد تركت هذه الموجة من OpenAI نظيراتها مرة أخرى بمسافة طويلة. بعد تحديث أكتوبر، من المقدر أن العديد من الشركات الناشئة في مجال الذكاء الاصطناعي سيتم سحقها تحت عجلات ChatGPT...