تحسين أداء ChatGPT 2.0 في معالجة النصوص غير اللاتينية

أعلنت شركة أوبن آي عن إصدار نموذج ChatGPT Images 2.0، والذي يعتبر بمثابة “نقطة تحول” في تقنيات توليد الصور. بعد أكثر من عام من تقديم الخيار لمستخدمي ChatGPT لإنشاء صور وتصميمات مباشرة من الروبوت، يتم الآن إطلاق هذا النموذج الجديد الذي يتميز بقدرات متقدمة في استيعاب التعليمات بدقة، والتعامل مع النصوص الكثيفة، وتنظيم العناصر في المشهد.
يشمل النموذج الجديد خصائص عقلانية، مما يتيح له القدرة على البحث عبر الإنترنت والتحقق من صحة ما ينتجه. وقد أكدت الشركة أن هذه المميزات ستساهم في تحقيق نتائج أكثر دقة وثباتًا من حيث الاتساق والتماسك البصري. علاوة على ذلك، عملت أوبن آي على تحسين النموذج ليكون أكثر فعالية في فهم وتوليد النصوص غير اللاتينية، وخصوصًا في اللغات مثل اليابانية والكورية والصينية والهندية والبنغالية.
يتميز ChatGPT Images 2.0 أيضًا بمرونة أكبر في نسبة العرض إلى الارتفاع، حيث يمكنه توليد صور بعرض يصل إلى 3:1 وارتفاع يصل إلى 1:3، بالإضافة إلى إنتاج تصميمات بدقة تصل إلى 2K، وإمكانية توليد ما يصل إلى ثمانية مخرجات في جلسة واحدة.
خلال عرض للنموذج قبل إطلاقه، قمت بمطالبة ChatGPT بتوليد صورة لقط من نوع “التورتويسشيل” بأسلوب الفن البكسلي المستخدم في الجيل الثالث من ألعاب بوكيمون. وبالفعل، أتت الصورة الناتجة جيدة للغاية. ثم طلبت تحويل هذه الصورة إلى صيغة PNG شفافة. في اختبار أخير، طلبت من ChatGPT إنتاج مانغا من أربع صفحات تصوّر قطتي وهي تستمتع بيوم مشمس بجوار جدول في مدينة جميلة.
من بين هذه الاختبارات، استغرق النموذج وقتًا أطول في الثانية، حيث كانت النتيجة مختلفة قليلاً عن الصورة الأولى، مما جعله يبتعد عن الطلب الأصلي. ومع ذلك، تمكن من إنتاج صورة شفافة بشكل صحيح، وهو ما تُعاني منه بعض نماذج الصور الأخرى.
مع دخول المزيد من الناس لاستخدام هذا النموذج، سنكون قادرين على تقييم أدائه مقارنة بنموذج Nano Banana 2 من غوغل، وتحديد المجالات التي يمكن لشركة أوبن آي تحسينها في المستقبل. النموذج متاح بالفعل لمستخدمي ChatGPT، بما في ذلك الحاصلين على اشتراكات مجانية واشتراكات بحدود معينة، فيما يحصل المشتركون في الخطط المتميزة على ميزات متقدمة. كما توفر أوبن آي النموذج عبر خدمة API وتطبيق Codex البرمجي الذي تم تحديثه مؤخرًا لتضمين خاصية توليد الصور.



