تشير دراسة حديثة نُشرت في مجلة Scientific Reports إلى أن روبوتات الدردشة ذات الذكاء الاصطناعي ذات النموذج اللغوي الكبير (LLM) قد تتفوق على البشر العاديين في المهام الإبداعية، مثل تبادل الأفكار حول الاستخدامات البديلة للعناصر المشتركة، وهو ما يعكس التفكير المتباين. ومع ذلك، فإن الأفراد الحاصلين على أعلى الدرجات في هذه المهام ما زالوا يتجاوزون نتائج أفضل روبوتات الدردشة أداءً.
التفكير المتباين هو عملية تفكير ترتبط غالبًا بالإبداع وتركز على توليد العديد من الأفكار أو الحلول المختلفة لمهمة محددة.
يتم تقييمه عادةً من خلال مهمة الاستخدام البديل (AUT)، حيث يُطلب من المشاركين التوصل إلى أكبر عدد ممكن من الاستخدامات البديلة للأشياء اليومية في فترة زمنية قصيرة. تم تقسيم الإجابات إلى أربع فئات مختلفة: الطلاقة، والمرونة، والأصالة، والتوضيح.
قارن ميكا كويفيستو وسيمون جراسيني استجابات 256 مشاركًا بشريًا مع استجابات ثلاثة روبوتات دردشة تعمل بالذكاء الاصطناعي (ChatGPT3، وChatGPT4، وCopy.Ai) واستجاباتهم لـ AUT لأربعة أشياء: حبل، وصندوق، وقلم رصاص، وشمعة. قام المؤلفون بتقييم أصالة الاستجابات من خلال تصنيف المسافة الدلالية (مدى ارتباط الاستجابة بالاستخدام الأصلي للكائن) والإبداع.
يتم قياس المسافة الدلالية باستخدام أساليب حسابية على مقياس من 0 إلى 2، في حين أن المقيمين البشريين، الذين لا يرون من بدأ الاستجابة، يقيمون الإبداع بشكل شخصي على مقياس من 1 إلى 5. في المتوسط، أنتجت روبوتات الدردشة استجابات سجلت أعلى بكثير من الاستجابات البشرية للمسافة الدلالية (0.95 مقابل 0.91) والإبداع (2.91 مقابل 2.47).
كان للاستجابات البشرية نطاق أوسع في كلا المقياسين، وكانت أدنى الدرجات أقل بكثير من استجابات الذكاء الاصطناعي، ولكن أعلى الدرجات كانت أعلى بشكل عام. لقد تفوقت أفضل استجابة بشرية على أفضل استجابة لكل روبوت محادثة في سبع من فئات التصنيف الثماني.
تشير هذه النتائج إلى أن روبوتات الدردشة المدعمة بالذكاء الاصطناعي يمكنها الآن توليد الأفكار على الأقل مثل البشر. ومع ذلك، لاحظ المؤلفون أنهم نظروا فقط في الأداء في مهمة واحدة ذات صلة بتقييم الإبداع. يقترح المؤلفون أن الأبحاث المستقبلية يمكن أن تستكشف كيفية دمج الذكاء الاصطناعي في العملية الإبداعية لتحسين الأداء البشري.