تطبيقات

تم اختبار GPT-4o: أسرع وأكثر تنوعًا من ذي قبل، ولكن الأسئلة تلوح في الأفق حول الموثوقية


منذ نوفمبر 2022، عندما تم طرح ChatGPT لأول مرة للجمهور، كانت OpenAI هي الشركة التي فازت في مجال الذكاء الاصطناعي (AI). على الرغم من إنفاق مليارات الدولارات وإنشاء وإعادة هيكلة قسم الذكاء الاصطناعي الخاص بهم، فقد وجد عمالقة التكنولوجيا الكبار أنفسهم يحاولون اللحاق بشركة الذكاء الاصطناعي باستمرار. ولم يكن الشهر الماضي مختلفا. قبل يوم واحد فقط من حدث Google I/O، استضافت OpenAI حدث Spring Update وقدمت GPT-4o مع ترقيات مهمة.

مميزات جي بي تي-4o

يرمز الحرف “o” في GPT-4o إلى القناة الشاملة، وهو التركيز الرئيسي للإمكانيات الجديدة لأحدث نموذج للذكاء الاصطناعي من الدرجة الأولى من OpenAI. أضافت توليد الصوت العاطفي في الوقت الفعلي، والوصول إلى الإنترنت، والتكامل مع بعض الخدمات السحابية، ورؤية الكمبيوتر، والمزيد. على الرغم من أن الميزات كانت مثيرة للإعجاب على الورق (وفي العروض التوضيحية للتكنولوجيا)، إلا أن الحدث الأبرز كان الإعلان عن أن ChatGPT الذي يعمل بنظام GPT-4o سيكون متاحًا للجميع، بما في ذلك المستخدمين المجانيين.

ومع ذلك، كان هناك تحذيران. يتمتع المستخدمون المجانيون بوصول محدود فقط إلى GPT-4o، والذي يُترجم تقريبًا إلى 5-6 دورات من المحادثة إذا كنت تستخدم بحث الويب وتحميل صورة (نعم، الحد الأقصى هو صورة واحدة يوميًا للمستخدمين المجانيين). كما أن ميزة الصوت غير متاحة للمستخدمين المجانيين.

ولم يتطلب الأمر من OpenAI طرح نموذج الذكاء الاصطناعي الجديد للجمهور أيضًا. لحسن الحظ، تمكنت من الوصول إلى أحدث ابتكارات الشركة في مجال الذكاء الاصطناعي في غضون أيام وبدأت على الفور في اللعب به. كنت أرغب في اختبار تحسنه مقارنة بسابقه وبجميع شهادات LLM المجانية المتاحة في السوق. لقد أمضيت الآن ما يقرب من أسبوعين مع مساعد الذكاء الاصطناعي، وبينما تركتني بعض جوانبه في حالة من الرهبة، إلا أن البعض الآخر خذلني. اسمحوا لي أن أشرح.

GPT-4o القدرات التوليدية العامة

لقد قلت في مراجعتي لبرنامج Gemini من Google أنني لست من محبي القدرات التوليدية لـ ChatGPT. أجد أنه رسمي للغاية ولطيف. الكثير منها لا يزال على حاله. طلبت منه أن يكتب رسالة إلى والدتي يشرح فيها أنني قد تم تسريحي من وظيفتي، وجاءت الرسالة بالسطر الرائع “أشعر بإحساس عميق بالحزن والأسى”. ولكن بمجرد أن طلبت منه أن يجعل الأمر أكثر حوارية، كانت النتيجة أفضل بكثير.

GPT-4o القدرات التوليدية

لقد اختبرت ذلك باستخدام العديد من المطالبات المشابهة حيث كان على الذكاء الاصطناعي التعبير عن بعض المشاعر في كتابته. في جميع الحالات تقريبًا، كان علي أن أتبع ذلك بموجه آخر للتأكيد على المشاعر على الرغم من أنني قمت بذلك بالفعل في الموجه الأصلي. وبالمقارنة، كانت تجربتي مع Gemini وCopilot أفضل بكثير حيث حافظا على لغة المحادثة والتعبير عن المشاعر بشكل أقرب بكثير إلى الطريقة التي أكتب بها.

إن سرعة إنشاء النص ليست شيئًا يستحق الكتابة عنه. تتميز معظم روبوتات الدردشة المدعمة بالذكاء الاصطناعي بالسرعة إلى حد ما عندما يتعلق الأمر بمخرجات النص، ولا يتفوق عليها أحدث نموذج للذكاء الاصطناعي من OpenAI بهامش كبير.

GPT-4o قدرات المحادثة

على الرغم من عدم توفر ميزة الدردشة الصوتية التي تمت ترقيتها، إلا أنني أردت اختبار قدرات المحادثة لنموذج الذكاء الاصطناعي لأنه غالبًا ما يكون الجزء الأكثر إغفالًا في برنامج الدردشة الآلي. أردت أن تكون تجربتي مشابهة للتحدث مع شخص حقيقي، وكنت آمل أن تتمكن من التقاط جمل غامضة تشير إلى المواضيع المذكورة سابقًا. أردت أيضًا أن أرى رد فعلها عندما يكون الشخص صعبًا.

في الاختبار الذي أجريته، وجدت أن GPT-4o جيد جدًا من حيث قدرات المحادثة. يمكنه أن يناقش معي أخلاقيات الذكاء الاصطناعي بقدر كبير من التفصيل ويعترف عندما أقدم عرضًا مقنعًا. لقد رد أيضًا بشكل داعم عندما أخبرته أنني شعرت بالحزن (لأنني كنت أطرد من العمل) وعرضت المساعدة بطرق مختلفة. عندما قلت عن GPT-4o أن كل حلوله كانت غبية، لم يستجب بطريقة انتهازية، ولم يتراجع تمامًا، وهو ما أدهشني. قال: “أنا آسف حقًا لسماع أنك تشعر بهذه الطريقة. سأعطيك بعض المساحة. إذا كنت بحاجة إلى التحدث أو تحتاج إلى أي مساعدة، سأكون هنا. يعتني.”

بشكل عام، وجدت GPT-4o أفضل في إجراء المحادثات من Copilot وGemini. يشعر الجوزاء بأنه مقيد للغاية، وغالبًا ما يبتعد مساعد الطيار عندما تصبح الردود غامضة. لم يفعل ChatGPT أيًا من هذه الأمور.

إذا كان علي أن أذكر جانبًا سلبيًا واحدًا، فسيكون استخدام النقاط والترقيم. فقط إذا فهم نموذج الذكاء الاصطناعي أن الناس في الحياة الواقعية يفضلون جدارًا من النصوص والرسائل القصيرة المتعددة المرسلة في تتابع سريع على الاستجابات جيدة التنسيق، فمن الممكن أن يتم تعليق وهمي لمدة أطول من بضع دقائق.

GPT-4o رؤية الكمبيوتر

إن رؤية الكمبيوتر هي قدرة اكتسبتها ChatGPT حديثًا، وكنت متحمسًا لتجربتها. في جوهره، يسمح لك بتحميل صورة وتحليلها لتزويدك بالمعلومات. في اختباري الأولي، قمت بمشاركة صور لأشياء للتعرف عليها، وقد قامت بعمل رائع في ذلك. وفي كل حالة، يمكنه التعرف على الكائن ومشاركة المعلومات المتعلقة به.

لقطة شاشة gpt 4o ss2 GPT-4o

رؤية الكمبيوتر GPT-4o: تحديد الأجهزة التقنية

ثم حان الوقت لزيادة الصعوبة واختبار قدراته في حالات الاستخدام الواقعية. كانت صديقتي تبحث عن إصلاح شامل لخزانة الملابس، وكوني صديقًا جيدًا، قررت استخدام ChatGPT لإجراء تحليل الألوان لاقتراح ما سيبدو جيدًا عليها. ولدهشتي، لم يكن قادرًا فقط على تحليل لون بشرتها وما كانت ترتديه (من خلفية ملونة مماثلة)، بل كان قادرًا أيضًا على مشاركة تحليل مفصل مع اقتراحات الزي.

لقطة شاشة gpt 4o ss3 GPT-4o

تحليل الألوان GPT-4o

أثناء اقتراح الملابس، شارك أيضًا روابط من تجار تجزئة مختلفين عبر الإنترنت لملابس معينة. ومع ذلك، فمن المخيب للآمال أن أيًا من عناوين URL لم يطابق النص.

بشكل عام، رؤية الكمبيوتر ممتازة وربما الميزة المفضلة لدي في التحديث الجديد، مع تجاهل الجانب السلبي.

عمليات بحث الويب GPT-4o

كان الوصول إلى الإنترنت أحد المجالات التي كان فيها كل من Copilot وGemini متقدمين على ChatGPT. ولكن ليس بعد الآن، حيث يمكن لـ ChatGPT أيضًا البحث في الإنترنت للحصول على معلومات. في اختباري الأولي، كان أداء برنامج الدردشة الآلي جيدًا. لقد عرضت جدول IPL 2024 وبحثت عن مقالات إخبارية حديثة حول جيفري هينتون، أحد العرابين الثلاثة للذكاء الاصطناعي.

لقد كان ذلك مفيدًا للغاية عندما أردت البحث عن شخصيات مشهورة لإجراء المقابلات التي أجريتها. كان بإمكاني البحث بسرعة عن أي مقال إخباري حديث عنها بدقة، وهو ما ينافس بحث Google. ومع ذلك، فقد قرع هذا أيضًا بعض أجراس الإنذار في رأسي.

قامت شركة جوجل بتعطيل القدرة على البحث عن معلومات عن الأشخاص، بما في ذلك المشاهير. يتم ذلك بشكل أساسي لحماية خصوصيتهم وتجنب مشاركة أي معلومات غير دقيقة عن أي فرد. لقد فوجئت بأن ChatGPT لا يزال يسمح بذلك، وبدأت في طرح سلسلة من الأسئلة عليه والتي لا ينبغي أن يكون قادرًا على الإجابة عليها. لقد فوجئت بالنتائج.

على الرغم من أن أيًا من المعلومات المعروضة لم يتم أخذها من مصدر غير عام، إلا أن حقيقة أن أي شخص يمكنه بسهولة البحث عن معلومات حول المشاهير والأشخاص الذين لديهم بصمات رقمية أمر مثير للقلق العميق. لا سيما بالنظر إلى الموقف الأخلاقي القوي الذي اتخذته الشركة مؤخرًا عندما نشرت مواصفات النموذج الخاص بها، فإن هذا لا يناسبني. سأدعك تقرر ما إذا كان هذا في المنطقة الرمادية أم أنه يمثل مشكلة كبيرة.

GPT-4o الاستدلال المنطقي

خلال حدث Spring Update، تحدثت OpenAI أيضًا عن كيفية قيام GPT-4o بدور المعلم للأطفال ومساعدتهم في حل المشكلات. قررت أن أختبره باستخدام بعض الأسئلة المنطقية الشهيرة. بشكل عام، كان أداؤه جيدًا. حتى أنه أجاب على بعض الأسئلة الأكثر صعوبة التي حيرت GPT 3.5.

ومع ذلك، لا تزال هناك أخطاء. لقد وجدت أمثلة متعددة لسلسلة الأرقام حيث تعثر الذكاء الاصطناعي وأعطى إجابة غير صحيحة. على الرغم من أنني لا أزال أتقبل ارتكاب الذكاء الاصطناعي لبعض الأخطاء، إلا أن ما خيب أملي حقًا هنا هو كيف أنه لا يزال يسقط في بعض الأسئلة السهلة للغاية (ولكنها تهدف إلى خداع الذكاء الاصطناعي).

لقطة شاشة gpt 4o ss4 GPT-4o

مثال على هلوسة GPT-4o

وعندما سأل: “كم يوجد في كلمة الفراولة”، أجاب بثقة اثنين (الإجابة الصحيحة هي ثلاثة، إذا كنت تتساءل). نفس المشكلة موجودة في العديد من الأسئلة الخادعة الأخرى. من خلال تجربتي، فإن المنطق المنطقي والموثوقية لـ GPT-4o تشبه سابقتها، وهي ليست رائعة على الإطلاق.

GPT-4o: الأفكار النهائية

بشكل عام، أنا معجب إلى حد ما بالترقيات في مجالات معينة من نموذج الذكاء الاصطناعي الجديد، مع كون رؤية الكمبيوتر والكلام التحادثي هي المفضلة لدي. أنا أيضًا معجب بقدرته على البحث على الإنترنت، لكنه جيد جدًا لدرجة أنه يقلقني أكثر. فيما يتعلق بالتفكير المنطقي والقدرات التوليدية، هناك القليل من التحسن.

في رأيي، إذا كان لديك وصول متميز إلى GPT-4o، فمن المحتمل أن يكون أفضل من أي منافس آخر من حيث التسليم الإجمالي. ومع ذلك، هناك مجال كبير للتحسين، ولا يمكن الوثوق بالذكاء الاصطناعي بشكل أعمى.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *