كشفت «علي بابا» عن Wan2.2-S2V (تحويل الكلام إلى فيديو)، أحدث نموذج مفتوح المصدر مصمم لإنشاء مقاطع فيديو بشرية رقمية وتحول هذه الأداة المبتكرة صور البورتريه إلى صور رمزية بجودة أفلام، قادرة على التحدث والغناء والأداء.

ويعد النموذج الجديد جزءاً من سلسلة إنتاج مقاطع الفيديو Wan2.2 من علي بابا، ويمكنه إنشاء مقاطع فيديو متحركة عالية الجودة من صورة واحدة ومقطع صوتي.

ويوفر Wan2.2-S2V إمكانيات متنوعة لتحريك الشخصيات، ما يتيح إنشاء مقاطع فيديو عبر خيارات تأطير متعددة، مثل منظور البورتريه والصدر والجسم الكامل. كما يمكنه توليد حركات الشخصيات والعوامل البيئية ديناميكياً بناءً على تعليمات سريعة، ما يسمح لصناع المحتوى المحترفين بالتقاط تمثيلات بصرية دقيقة معدة خصيصاً لمتطلبات سرد القصص والتصميم.

وبفضل تقنية الرسوم المتحركة الصوتية المتقدمة، يقدم هذا النموذج أداءً واقعياً للشخصيات، بدءاً من الحوار الطبيعي وصولاً إلى العروض الموسيقية، ويتعامل بسلاسة مع شخصيات متعددة داخل المشهد. ويمكن للمبدعين الآن تحويل التسجيلات الصوتية إلى حركات واقعية، ما يدعم مجموعة متنوعة من الصور الرمزية، من الرسوم المتحركة والحيوانات إلى الشخصيات المنمقة.

ولتلبية الاحتياجات المتنوعة لصناع المحتوى المحترفين، توفر هذه التقنية دقة إخراج مرنة تبلغ 480 بكسل و720 بكسل، وهذا يضمن إنتاجاً بصرياً عالي الجودة يلبي مختلف المعايير المهنية والإبداعية، ما يجعله مناسباً لكل من محتوى وسائل التواصل الاجتماعي والعروض التقديمية الاحترافية.

ويتجاوز Wan2.2-S2V الرسوم المتحركة التقليدية بالرأس الناطق من خلال الجمع بين التحكم الشامل في الحركة الموجه بالنص والحركات المحلية الدقيقة المدعومة بالصوت، وهذا يتيح أداءً طبيعياً ومعبراً للشخصيات في سيناريوهات معقدة وصعبة.

ويكمن إنجاز رئيسي آخر في تقنية معالجة الإطارات المبتكرة في النموذج. فمن خلال ضغط الإطارات التاريخية ذات الطول العشوائي في تمثيل كامن واحد مضغوط، تقلل هذه التقنية بشكل كبير من التكلفة الحسابية. كما يتيح هذا النهج توليد مقاطع فيديو طويلة مستقرة بشكل ملحوظ، ما يعالج تحدياً بالغ الأهمية في إنتاج المحتوى الممتد للرسوم المتحركة.

يذكر أن نموذج Wan2.2-S2V متاح للتنزيل عبر Hugging Face وGitHub، بالإضافة إلى ModelScope، مجتمع علي بابا كلاود مفتوح المصدر. وباعتبارها مساهماً رئيسياً في المجتمع العالمي للمصادر المفتوحة، قامت علي بابا بفتح المصدر لنماذج Wan2.1 في شهر فبراير 2025 ونماذج Wan 2.2 في شهر يوليو. وحتى الآن، سجلت سلسلة Wan أكثر من 6.9 ملايين عملية تنزيل على Hugging Face وModelScope.