قبل بضعة أسابيع، أصدرت OpenAI أحدث نموذج لغوي واسع النطاق لخدمات الذكاء الاصطناعي التوليدي، GPT-4Turbo، في أول حدث للمطورين. أعلنت Microsoft لاحقًا أنها ستضيف طراز GPT-4Turbo إلى خدمة Azure OpenAI الخاصة بها. أعلنت Microsoft اليوم عن تحسينات على خدمة Azure OpenAI، حيث أصبح نموذج GPT-4 Turbo مع Vision متاحًا الآن للعملاء كمعاينة عامة.
قالت مايكروسوفت في منشور بالمدونة:
يحتفظ نموذج الذكاء الاصطناعي المتقدم متعدد الوسائط بجميع الميزات القوية لـ GPT-4Turbo مع تقديم القدرة على معالجة وتحليل إدخال الصور. وهذا يفتح الفرصة للاستفادة من GPT-4 لمجموعة واسعة من المهام، بما في ذلك تحسينات إمكانية الوصول، وتفسير البيانات المرئية وتحليلها، والإجابة على الأسئلة المرئية (VQA).
بالإضافة إلى ذلك، أضافت Microsoft المزيد من الميزات لعملاء Azure OpenAI من خلال إصدار المعاينة من GPT-4 Turbo مع Vision. أحد هذه التقنيات هو التعرف الضوئي على الحروف (OCR)، الذي يقوم بفحص الصورة واستخراج أي نص في الصورة حتى يمكن دمجه في مطالبات المستخدم.
ميزة أخرى لـ GPT-4 TurbowithVision هي خاصية تأريض الكائن، والتي تسمح للذكاء الاصطناعي بفحص الصورة وعرض الكائنات الرئيسية في الصورة بناءً على المطالبات النصية من المستخدم. وبالمثل، يمكن للذكاء الاصطناعي أيضًا تحليل إطارات معينة من الفيديو.
وأضافت مايكروسوفت:
من خلال الجمع بين GPT-4 Turbo وVision وAzure AI Search وAzure AI Vision، أصبح من الممكن الآن إضافة الصور والبيانات النصية معًا لتطوير حلول تتصل ببيانات المستخدم باستخدام البحث المتجه لتحسين تجربة روبوت الدردشة.
يبلغ سعر الخدمة 0.01 دولارًا لكل 1000 كلمة من المدخلات و0.03 دولارًا لكل 1000 كلمة من المخرجات، مع اختلاف أسعار الميزات المحسنة.
حاليًا، يتوفر GPT-4Turbo with Vision في مناطق شرق أستراليا ووسط السويد وشمال سويسرا وغرب الولايات المتحدة في AzureOpenAI. سيتم تحديث العملاء الذين يصلون إلى المعاينة العامة لـ GPT-4Turbo مع إمكانات الرؤية تلقائيًا إلى "إصدار مستقر وجاهز للإنتاج في الأسابيع المقبلة."