موجه لم يعد موجودا؟ تم دمج DALL·E3 فجأة في ChatGPT، مع رسم دقيق وتفاصيل واقعية. لقد فجر OpenAI حقًا دائرة الرسم بالذكاء الاصطناعي اليوم. عندما استيقظت في الصباح، كانت دائرة الرسم بالذكاء الاصطناعي قد تلاشت. أطلقت OpenAI منتجًا رائعًا - تم الإعلان رسميًا عن DALL·E3، الذي تم دمجه مع ChatGPT!
أحدهما هو أقوى نموذج لغوي في التاريخ، والآخر هو أقوى نموذج بياني فنسنتي في التاريخ. لا بد أن يؤدي الجمع بين الاثنين إلى تخريب دائرة AIGC بأكملها.
بعد خضوعه لأقوى تحول، يستطيع DALL · E3 فهم الفروق الدقيقة في الدلالات، والتفاصيل واقعية بشكل مرعب.
رسالة عاجلة: "رسم توضيحي لثمرة الأفوكادو تجلس على كرسي المعالج النفسي وتقول "أشعر بالفراغ في الداخل" مع وجود ثقب بحجم حفرة في المنتصف. المعالج، ملعقة، ملاحظات خربشة"
هتف مستخدمو الإنترنت: "إذا كان DALL · E3 قادرًا على تمثيل النص الموجود في الصورة بدقة، فسوف يغير قواعد اللعبة تمامًا !!!"
وفي الوقت نفسه، تم أيضًا تقليل عتبة المطالبات بشكل كبير.
لم يعد المستخدمون الذين "يموتون مبكرًا" مضطرين للقلق بشأن عدم قدرتهم على كتابة كلمات سريعة رائعة. فقط أعطني تلميحًا وسوف يقوم ChatGPT بكتابة فقرات بليغة لك.
باختصار، يمكنك إطلاق العنان لخيالك والسماح لـ ChatGPT بالتحليق!
لا مزيد من الأرفف عقلك لمعرفة كيفية المطالبة! فقط من خلال التحدث إلى ChatGPT، يمكنك كتابة أشياء رائعة
يمكنك أيضًا إجراء تغييرات في أي وقت بناءً على الصورة التي تم إنشاؤها أثناء المحادثة.
يمكن ملاحظة أنه من أجل اللحاق بإصدار Gemini متعدد الوسائط من Google، أخذت OpenAI زمام المبادرة.
قال جيم فان، كبير علماء الذكاء الاصطناعي في Nvidia، بحماس أن هذه معاينة للمعركة الملحمية بين LLM متعددة الوسائط واسعة النطاق وGoogle Gemini!
كما قال سام ألتمان، الرئيس التنفيذي لشركة OpenAI، بفخر في منطقة التعليق: "Wearesoback".
حاليًا، لا يزال DALL · E3 قيد الاختبار الداخلي ومن المتوقع أن يتم إطلاقه لجميع مستخدمي Plus ومستخدمي المؤسسات في أوائل أكتوبر.
منافس Midjourney موجود هنا حقًا!
يعتبر DALL·E3 فريدًا من حيث أنه تم إنشاؤه أصلاً على ChatGPT.
ما عليك سوى تقديم طلب إلى ChatGPT، جملة بسيطة، أو فقرة مفصلة، وسوف يبدأ في تبادل الأفكار وتحسين النصائح.
وقال جيم فان، كبير علماء نفيديا، إن هذا أمر صادم للغاية!
تكمن أهمية DALL · E3 في أنها ليست مجرد خصم قوي لـ Midjourney،كما أنه يمثل أن حرب النماذج الكبيرة متعددة الوسائط على وشك أن تندلع.
تعتمد إمكانيات مطابقة اللغة الممتازة لـ DALL·E3 على أساس نصي متين GPT. لا يتمتع Midjourney بالكثير من "العقل المنطقي"، ولهذا السبب هناك حاجة إلى الكثير من التلميحات.
العقول أولاً، والبكسلات لاحقاً، هذه هي كيفية بناء ذكاء اصطناعي قوي ومتعدد الوسائط.
ليست هناك حاجة لتعلم الهندسة السريعة، يمكنك فقط أن تفعل ما تريد. للحصول على كلمات سريعة، سيساعدك ChatGPT في كتابتها، وسيتم الاهتمام بتفاصيل اللوحات الرائعة بواسطة DALL·E3.
يوضح لك المثال التالي كيف قام DALL·E3 بنقش كل مشهد في النص بدقة في اللوحة عند إنشاء اللوحة التالية، وتكون جودة الصورة مثل الفيلم.
وتحت البدر، امتلأت الشوارع بالمشاة الصاخبين الذين يستمتعون بالحياة الليلية.
في كشك زاوية، كانت فتاة ذات شعر أحمر ناري وترتدي عباءة مخملية أنيقة تتفاوض مع رئيسها الغاضب.
كان الرئيس، طويل القامة وقوي البنية، يرتدي بدلة أنيقة ولحية صغيرة ملفتة للنظر، يتحدث بحيوية على هاتفه ذي الطراز القديم.
بالإضافة إلى ذلك، وبموجب نفس الموجه، ستكون الصورة المرسومة بواسطة DALL·E3 أكثر دقة من تلك الخاصة بـ DALL·E2.
على سبيل المثال، "لوحة زيتية معبرة للاعب كرة سلة يغطس، تصور انفجارًا لعنيبولا"، DALL · E3 أكثر تفصيلاً في إنشاء الشخصيات وكرات السلة والمزيد من الخلفيات الكلية.
كما يمكن رؤيته من مخطط المقارنة الذي قام به مستخدمو الإنترنت، يمكن القول أن الفجوة بين DALL·E3 وDALL·E2 هائلة.
قال مستخدمو الإنترنت إن OpenAI لا تحاول فقط تجاوز Midjourney هذه المرة. جوجل هو أكبر منافس لهم، وخاصة في الآونة الأخيرة الجوزاء كان وشيكاً.
يقول بعض الناس أن هذا التغيير يعكس اتجاهًا تطوريًا مهمًا في أدوات الرسم بالذكاء الاصطناعي:فهم الناس.
سيكون أمرًا رائعًا لو سمح لنا الذكاء الاصطناعي بوصف الصور وتعديلها بشكل أفضل! دعونا ننتظر ونرى إلى أي مدى يمكن أن يصل DALL·E3.
DALL·E3+ChatGPT
DALL·E3+ChatGPT، كم هو رائع؟
قام Altman بإخفاء التفاصيل اللطيفة التي تم إنشاؤها بواسطة DALL·E3 في مقطع فيديو ترويجي.
يمكن لـ DALL · E3 تحويل خيال طفل يبلغ من العمر 5 سنوات إلى حقيقة.
"كان طفلي البالغ من العمر 5 سنوات يتحدث عن "قنفذ عباد الشمس الفائق". كيف ينبغي أن يبدو شكله؟"
يقوم ChatGPT تلقائيًا بإنشاء صور بأنماط مختلفة بناءً على 4 كلمات مطالبة مختلفة. من خلال تحديد الصورة الأخيرة هنا، يمكنك تعيين الصورة الأساسية لمواصلة الإنشاء.
بعد ذلك، قم بتسمية القنفذ الصغير لاري وارسم له منزلاً.
يمكن ملاحظة أن DALL·E3 لم يفهم المتطلبات بدقة فحسب، بل كان قادرًا أيضًا على إضافة تعليق توضيحي للنص في الصورة، بما في ذلك "Larry" في صندوق البريد.
تم حل مشكلة عدم قدرة نموذج DALL·E السابق على الكتابة على الإطلاق.
يمكنك أيضًا إكمال القصة أثناء الرسم، وحتى إضافة الرسوم التوضيحية إليها.
بالإضافة إلى ذلك، يمكن لـ DALL·E3 أيضًا إنشاء ملصقات لطيفة بناءً على الأنماط المذكورة أعلاه.
أخيرًا، دع ChatGPT يلخص المحتوى أعلاه وينشئ قصة ما قبل النوم، وهو أمر مثالي تمامًا.
يوفر مسؤول OpenAI أيضًا عددًا كبيرًا من ألبومات الصور الرائعة.
موجه: هذه قطعة فنية ورقية تصور فتاة تعانق قطة بلطف. كانا كلاهما جالسين في أصيص نبات، والقط يخرخر برضا والفتاة تبتسم. المشهد مليء بالزهور والأوراق الورقية المصنوعة يدويًا.
فن من الأعمال الورقية يصور فتاة تعانق قطتها. يجلس كلاهما وسط النباتات المحفوظة في أصص، مع خرخرة القطة برضا بينما تبتسم الفتاة. المشهد مزين بالزهور الورقية وأوراق الشجر المصنوعة يدويًا.
يمكن لـ DALL·E3 إنشاء ملصقات جميلة وإضافة نص.
موجه: ملصق السفر الرجعية فينوس، صورة شخصية. تُظهر الصورة كوكب الزهرة محاطًا بسحب كثيفة صفراء وصورة ظلية لسفينة صاروخية قديمة تقترب. تشير الأشكال الغامضة إلى الجبال والوديان تحت السحب. يقول النص الموجود في الأسفل "استكشاف كوكب الزهرة: الجمال وراء الضباب". يتكون نظام الألوان من الذهبي والأصفر والبرتقالي الناعم لإثارة الفضول.
ملصق سفر عتيق لكوكب الزهرة في اتجاه عمودي. يصور المشهد السحب السميكة الصفراء لكوكب الزهرة مع صورة ظلية لسفينة صاروخية قديمة تقترب. شكل غامض في الجبال والوديان أسفل السحب. يقرأ النص السفلي، "استكشف الزهرة: الجمال خلف الضباب". يتكون نظام الألوان من اللون الذهبي والأصفر والبرتقالي الناعم، مما يثير الشعور بالعجب.
موجه: يصور هذا الرسم التوضيحي قلبًا بشريًا مصنوعًا من الزجاج الشفاف، واقفًا على قاعدة وسط أمواج عاصفة. يخترق شعاع من ضوء الشمس الغيوم، فينير القلب ويكشف عن الكون الصغير بداخله. وفي الأفق، نقش على النصب سطر من الحروف الجذابة: "ابحث عن الكون بداخلك".
رسم توضيحي لقلب إنسان مصنوع من الزجاج الشفاف، واقفًا على قاعدة وسط بحر عاصف. تخترق أشعة الشمس الغيوم، وتضيء القلب، وتكشف عن كون صغير بداخله.
موجه: هذا عرض ثلاثي الأبعاد لفنجان قهوة موضوع على حافة النافذة في يوم عاصف. تنعكس العاصفة خارج النافذة في فنجان القهوة، حيث يمكن رؤية البرق المصغر والأمواج المتلاطمة. الإضاءة الداخلية خافتة، مما يزيد من الأجواء الدرامية.
A3 تقديم كوب قهوة موضوع على حافة النافذة أثناء يوم عاصف. تنعكس العاصفة خارج النافذة على القهوة، مع ظهور صواعق صغيرة وموجات مضطربة داخل الكوب. الغرفة مضاءة بشكل خافت، مما يضيف إلى الجو الدرامي.
موجه: لوحة زيتية مفصلة لقبطان عجوز يقود سفينته خلال العاصفة. رش الماء المالح على وجهه المتجمد، وكانت عيناه عازمتين. في الأعلى، يمكن رؤية السحب الشريرة الدوامة، والأمواج العاتية تهدد بإغراق السفينة، بينما تغوص طيور النورس وتدور عبر المناظر الطبيعية الفوضوية. وسمع الرعد والأضواء من بعيد، وأضاءت المشهد بوهج أخضر غريب.
لوحة زيتية تفصيلية لقبطان البحر القديم، وهو يقود سفينته عبر العاصفة. المياه المالحة تتناثر مرة أخرى على هذا الوجه المتجمد، العزم في نحلته. تهدد الأمواج الصارمة بغمر السفينة بينما تغوص طيور النورس وتدور خلال المشهد الفوضوي. الرعد والأضواء تبحر على مسافة. تضيء المشهد بتوهج أخضر غريب.
منتصف الرحلة ضعيف جدا
بمجرد ظهور الأخبار، ظهرت بسرعة موجة من الصور المقارنة مع Midjourney على الإنترنت.
للتذكير نفسه، Midjourney وDALL·E3 ليسا على نفس المستوى.
كما يقوم SDXL وDALL·E3 بإنشاء مخططات مقارنة.
قال بعض مستخدمي الإنترنت إنهم استخدموا RawMidjourney وNon-rawMidjourney وDALL·E3 لإنشاء صور باستخدام نفس الموجه.
قام بعض مستخدمي الإنترنت بالتقاط المزيد من الصور لـ Midjourney وDALL·E3PK.
نموذج أولي جديد يحمل الاسم الرمزي "Gizmo"
في الوقت نفسه، نشر مستخدم الإنترنت "TiborBlaho" أيضًا الأخبار التي تفيد بأن OpenAI تعمل على تطوير نموذج أولي جديد يحمل الاسم الرمزي "Gizmo" لـ ChatGPT ——
يحتوي على واجهة مستخدم محدثة ويقدم "Gizmo Editor" القوي لعملاء المؤسسات، مما يسمح للمستخدمين بإنشاء "GPT" الخاص بهم.
على وجه التحديد، يمكنك تحديد صورة الملف الشخصي والنموذج (GPT-3.5 أو GPT-4) لـ GPT الخاص بك، والإمكانيات (بما في ذلك DALL · E، وتصفح الويب، ووضع حماية التشفير، والمكونات الإضافية، وما إلى ذلك)، وقائمة المكونات الإضافية الممكّنة، والسلوك (ما هي GPT هذه، وماذا تفعل، وما يجب أن تعرفه)، ورسالة الترحيب (ما يجب قوله عندما يبدأ المستخدم محادثة جديدة مع GPT هذه)، وتحديد ما إذا كانت GPT هذه خاصة أم لا.