تكنولوجيا

تكنولوجيا جيميني من جوجل قادرة على إنتاج أي محتوى انطلاقاً من أي مدخل، بدءًا من الفيديو.

في إطار سلسلة التطورات التي أعلنت عنها خلال مؤتمر Google I/O، كشفت شركة جوجل عن نموذج جديد يحمل اسم “جمنّي أومني”. ويُعتبر هذا النموذج تطورًا كبيرًا في مجال الذكاء الاصطناعي، حيث يمكنه “إنشاء أي شيء من أي مدخلات، بدءًا بالفيديو”. يأخذ النموذج الأول وهو “جمنّي أومني فلاش” اليوم طريقه نحو التطبيق الخاص بجمنّي، إضافة إلى خدمات جوجل فلو وستوريز YouTube.

وصفته جوجل بأنه “الخطوة التالية” لما يُعرف بمولد الفيديو “فيو 3.1″، حيث يتيح للمستخدمين دمج الصور، الصوت، الفيديو والنصوص كمدخلات لإنشاء مقاطع فيديو عالية الجودة تستند إلى معرفة جمنّي بالعالم الواقعي. بالإضافة إلى ذلك، يمكن تحرير هذه الفيديوهات من خلال محادثة طبيعية، حيث يتم بناء كل تعليمات على ما سبق لضمان تماسك الشخصيات والعناصر الأخرى.

على عكس “فيو 3.1″، الذي اقتصر على إنشاء الفيديوهات من خلال تعليمات وصور محددة، فإن “جمنّي أومني” يقبل مجموعة واسعة من المدخلات، ويوفر وظائف أكثر تنوعًا. يمكن للمستخدم تصوير فيديو وطلب من “أومني” تغيير ما يحدث فيه. بموجب الشرح المقدم من جوجل، يتحول الفيديو إلى نقطة انطلاق لمحتوى قد يكون من الصعب تصويره بنفسك. يمكن أيضًا تعديل الحركة، إدخال شخصيات أو أشياء جديدة، أو تحويل لحظة معينة إلى شيء غير متوقع، بالإضافة إلى إمكانية تغيير البيئة، الزاوية، النمط أو حتى التفاصيل الدقيقة.

من المميزات الأخرى لهذا النموذج هو فهمه الأفضل للقوى الفيزيائية مثل الجاذبية والطاقة الحركية، مما يسهم في جعل المشاهد أكثر واقعية. يجمع النظام بين هذه المفاهيم ومعرفة جمنّي في مجالات التاريخ والعلوم والسياق الثقافي، مما يربط بين الواقعية التصويرية والسرد القصصي المعنى.

كما تشير التقارير إلى أن التطبيق يمكنه إنتاج شروحات مثيرة من تعليمات قصيرة، لإنشاء رسومات توضيحية تُبسط الأفكار الأكثر تعقيدًا. ومع ذلك، فإن المرحلة الأولى ستدعم فقط الإشارات الصوتية للإخراج الصوتي. وإذا رغب المستخدمون في إنتاج فيديوهات تكون فيها الصورة الذاتية، يوفر “أومني” إمكانية استخدام صوتهم لإنشاء شخصية رقمية تشبههم مظهراً وصوتاً، رغم أن جوجل أكدت أنها لديها سياسات واضحة لحماية المستخدمين من أي مشاكل متعلقة بالخصوصية.

فيما يخص تعديل الصوت والكلام، لا تزال الشركة تختبر هذه الوظيفة لتقديمها للمستخدمين بشكل مسؤول. بالإضافة إلى ذلك، ستستخدم جميع الفيديوهات علامة مائية رقمية غير مرئية تُعرف باسم “SynthID” للتحقق من أن الفيديوهات تم إنشاؤها باستخدام “جمنّي أومني”.

على الرغم من هذه المزايا المثيرة، يبقى التحدي الرئيسي هو المشكلة المتمثلة في الشكل غير الطبيعي للفيديوهات الناتجة عن “فيو 3.1” وتطبيقات مولدات الفيديو الأخرى، والذي غالباً ما يسبب عدم رضا المستخدمين. لذا سيكون من المثير للاهتمام تقييم ما إذا كانت جودة الإخراج ستتوافق مع ادعاءات جوجل. “جمنّي أومني فلاش” متاح الآن لجميع المشتركين في خدمات الذكاء الاصطناعي من جوجل، بدءًا من هذا الأسبوع، سواء لمستخدمي تطبيق يوتيوب شورتس أو تطبيق إنشاء المحتوى على يوتيوب.

مقالات ذات صلة

زر الذهاب إلى الأعلى