أطلقت مجموعة علي بابا القابضة المحدودة نموذج ذكاء اصطناعي جديداً مجانياً، تقول إنه قادر على قراءة المشاعر، في محاولة واضحة للتغلب على أحدث نموذج من شركة OpenAI ومستفيدة من الظهور الأول المذهل للشركة الصينية «ديب سيك» (DeepSeek).
الرؤية الحاسوبية
في عرضين توضيحيين، عرض باحثو مختبر تونغي التابع لشركة علي بابا نموذجهم الجديد مفتوح المصدر R1-Omni، الذي يستنتج الحالة العاطفية لشخص ما في مقطع فيديو، مع تقديم وصف لملابسه وبيئته.
يُضيف هذا النموذج مستوى جديداً من الفهم لما يُسمى بالرؤية الحاسوبية، وهو نسخة مُحسّنة من نموذج مفتوح المصدر آخر، HumanOmni، من تطوير الباحث الرئيسي نفسه، جياشينغ تشاو.
إصدارات جديدة
تسارعت جهود علي بابا لترسيخ مكانتها الرائدة في مجال الذكاء الاصطناعي بفضل الظهور اللافت لشركة DeepSeek في يناير، وهي الآن تُطلق إصدارات جديدة من أدوات وتطبيقات الذكاء الاصطناعي في مجالات متعددة.
قارنت الشركة نموذج Qwen الخاص بها مع DeepSeek، وأبرمت شراكة رئيسية مع شركة Apple Inc. للذكاء الاصطناعي على أجهزة iPhone، وتتطلع الآن إلى منافسة OpenAI أيضاً. فهي تُتيح للمستخدمين تنزيل R1-Omni مجاناً على Hugging Face.
الذكاء العاطفي
انتشرت على نطاق واسع محاولات تحقيق الذكاء العاطفي - الذي يُمكّن أجهزة الكمبيوتر من التعرف على المشاعر الإنسانية والاستجابة لها. وتُستخدم تقنية تحديد الحالة النفسية للشخص ورفاهيته لمساعدة روبوتات الدردشة في خدمة العملاء على اكتشاف الإحباط، وسيارات شركة تيسلا على رصد السائقين النعسانين.
تحديد الإشارات الدقيقة
أطلقت شركة OpenAI نموذجها GPT-4.5 في وقت سابق من هذا العام، مُشيرة إلى أنه أفضل في تحديد الإشارات الدقيقة من خلال توجيهات المستخدمين الكتابية والاستجابة لها. إلا أن هذا النموذج يأتي بتكلفة باهظة: فهو متاح في البداية فقط للمستخدمين الذين يدفعون 200 دولار شهرياً. أما شركة علي بابا، التي تخوض حرب أسعار مع عملائها في الصين، فتُطلقه بالمجان، وتتيح للجميع استخدام نموذجها الجديد.
تُظهر العروض التوضيحية فقط أنه يُظهر أوصافاً عاطفية عامة مثل «سعيد» أو «غاضب»، إلا أن قدرته المزعومة على استخلاص هذه الأوصاف من الإشارات البصرية تُعدّ مهمة.
