ميتا تطرح نموذجا جديدا، “موفي جن”
٠ميتا تطرح نموذجا جديدا، “موفي جن” | قدمت مجموعة “ميتا” أمس الجمعة واجهة الذكاء الاصطناعي التوليدي الجديدة “موفي جن” التي تتيح إنشاء مقاطع فيديو بالصوت بالاستناد إلى نصوص أو صور، وهو ما تسمح به خدمات رائدة أخرى في الذكاء الاصطناعي.
وباتت (موفي جن) نموذج توليد الصور الثالث لمجموعة “ميتا”، بعد نموذج أول في يوليو 2022، وثانٍ في نوفمبر 2023.
لم تتم إتاحة أي من الواجهات الثلاث للعامة، إذ تخضع للاختبار في هذه المرحلة من قبل صانعي محتوى ومخرجين يقوّمون موفي جن ويساعدون في تحسين البرنامج. ولم تعلن “ميتا” موعد طرح موفي جن .وبالإضافة إلى مقاطع الفيديو التوضيحية، نشرت المجموعة الجمعة وثيقة بحثية تتضمن توصيفاً للنموذج الجديد.
يذكر أن نماذج اللغة هي برامج تعتمد على قواعد بيانات ضخمة، ما يسمح لها بإنشاء محتوى، من نص أو صورة أو فيديو أو صوت أو رمز معلوماتية، استجابةً لطلب تمت صياغته باللغة اليومية.
بإمكان (موفي جن) إنتاج مقطع فيديو بناءً على طلب مكتوب، وأيضاً من صورة. كما يوفر وظائف تحرير لمقاطع فيديو موجودة.
يتيح النموذج أيضاً إضافة مقطع صوتي إلى الفيديو، وفقاً للمبدأ نفسه القائم على الطلبات باللغة اليومية.
وفي مقطع قصير نُشر على موقع “ميتا”، يكفي التلفظ بجملة واحدة لتعديل فيديو عبر إضافة مشاهد لسيارة رباعية الدفع في الصحراء مع صوت محرك هادر ونغمة غيتار.
وألمحت “ميتا” إلى أن نسخة (موفي جن) قد تصبح متاحة للاستخدام يوماً ما عبر شبكتي إنستغرام وفيسبوك، أو حتى من خلال رسائل واتساب.
وليست “ميتا” أول مشغل للذكاء الاصطناعي يطوّر نموذجاً لإنشاء الفيديو.
وفي هذا الإطار، يتيح برنامج “رانواي” من شركة “رانواي إيه آي” الناشئة، من خلال طلب مكتوب، إنشاء لقطة مدتها بضع ثوانٍ، أو تحويل سلسلة من الصور الثابتة إلى فيديو قصير، أو إعادة تشكيل تسلسل موجود لتحويله.
وفي فبراير، أطلقت “أوبن إيه آي” أيضاً نسختها المسماة “سورا” ، بينما تعمل غوغل على نموذج يُسمّى “لوميير” .
وتقول “ميتا” إن موفي جن يتفوق على نماذج القطاع المماثلة عند تقييم إنتاجها من جانب البشر”.