تم تطوير NovaAct في مختبرات AGI التي افتتحتها أمازون حديثًا في سان فرانسيسكو، وستوفر أيضًا وظائف رئيسية لترقية الشركة القادمة إلى Alexa+، وهو تحسين الذكاء الاصطناعي العام للمساعد الصوتي الشهير من أمازون. ومع ذلك، فإن إصدار NovaAct المتوفر ابتداءً من اليوم هو أقل جودة قليلاً. تسميها أمازون معاينة بحثية.
يمكن للمطورين الوصول إلى مجموعة أدوات NovaAct من خلال موقع الويب الجديد nova.amazon.com، والذي يعمل أيضًا بمثابة عرض لنماذج Nova الأساسية المتنوعة من Amazon.
NovaAct هي محاولة أمازون للاستفادة من تقنية وكيل الذكاء الاصطناعي العامة الخاصة بها للتنافس مع مشغل OpenAI وAnthropic's ComputerUse. تعتقد العديد من شركات التكنولوجيا الرائدة أن وكلاء الذكاء الاصطناعي القادرين على تصفح الويب للمستخدمين سيجعلون روبوتات الدردشة المستندة إلى الذكاء الاصطناعي اليوم أكثر فائدة.
قد لا تكون أمازون أول من طور هذا النوع من تكنولوجيا الوكيل، ولكن مع Alexa +، قد يكون نطاقها هو الأوسع.
تقول أمازون إن المطورين الذين يستخدمون NovaAct SDK يجب أن يكونوا قادرين على أتمتة الإجراءات الأساسية نيابة عن المستخدمين، مثل طلب سلطة من Sweetgreen أو إجراء حجز عشاء. باستخدام مجموعة أدوات NovaAct، يمكن للمطورين دمج الأدوات التي تسمح لعملاء الذكاء الاصطناعي بتصفح الويب أو ملء النماذج أو تحديد التواريخ في التقويم.
تدعي أمازون أن NovaAct تفوقت على عملاء OpenAI وAnthropic في العديد من الاختبارات داخل الشركة. على سبيل المثال، في ScreenSpot WebText، الذي يقيس كيفية تفاعل وكيل الذكاء الاصطناعي مع النص الموجود على الشاشة، سجلت NovaAct 94%، وهي أفضل من CUA لـ OpenAI (88%) وAnthropic’s Claude3.7Sonnet (90%).
ومع ذلك، لم تقم أمازون بقياس NovaAct باستخدام تقييمات الوكيل الأكثر شيوعًا مثل WebVoyager.
NovaAct هو أول منتج عام أطلقه مختبر AGI المذكور أعلاه في أمازون. ويشارك في قيادة المشروع باحثان سابقان في OpenAI، ديفيد لوان وبيتر أبيل. وقد أسس كلاهما في السابق شركتيهما الناشئة - أسس لوان شركة Adept، في حين شارك أبيل في تأسيس شركة Covariant - واستأجرتهما أمازون العام الماضي لقيادة جهود وكيل الذكاء الاصطناعي.
في حين أنه قد يبدو غريبًا أن تقوم AGI Labs بتطوير وكيل ذكاء اصطناعي قادر على طلب SweetGreen، إلا أن Luan يرى العملاء كخطوة حاسمة في إنشاء أنظمة ذكاء اصطناعي فائقة الذكاء. يعرّف لوان الذكاء الاصطناعي العام بأنه "نظام ذكاء اصطناعي يمكنه مساعدتك في القيام بكل ما يفعله الإنسان على جهاز الكمبيوتر".
قال Luan إن فريقه صمم NovaActSDK لأتمتة المهام القصيرة بشكل موثوق وتزويد المطورين بالأدوات التي تسمح لهم بتحديد متى يكون التدخل البشري مطلوبًا بدقة في سير عمل الوكيل. ويأمل أن يسمح هذا للمطورين بإنشاء تطبيقات وكيل أكثر موثوقية، على الرغم من أنها ليست بالضرورة تطبيقات مستقلة تمامًا.
أطلقت أمازون أول وكيل عام للذكاء الاصطناعي في سوق مزدحمة، لكنها تقنية رئيسية تعلق عليها الشركة آمالاً كبيرة. يقدم الاختبار المبكر لـ NovaAct لمحة عن بعض إمكانيات Alexa + التي طال انتظارها، مما يمثل لحظة نجاح أو فشل لجهود الذكاء الاصطناعي في أمازون.
المشكلة الرئيسية مع وكلاء الذكاء الاصطناعي الأوائل من OpenAI وGoogle وAnthropic هي موثوقيتهم في المجالات المختلفة. في اختبار TechCrunch، كانت هذه الأنظمة بطيئة، ويصعب تشغيلها بشكل مستقل لفترات طويلة من الزمن، وعرضة لارتكاب أخطاء لا يرتكبها البشر. سنرى قريبًا ما إذا كانت أمازون قد تمكنت من فك الشفرة - أو ما إذا كان وكلاؤها يعانون من نفس العيوب التي ابتليت بها منافسيها.