روبوتات الدردشة تهدد مهنة التعليق الرياضي

باتت روبوتات الدردشة تشكل تهديداً وجودياً لمهنة التعليق الرياضي، والبداية صادمة عبر دراسة علمية دقيقة أجرتها (آي بي إم)، وبحسب الدراسة المذهلة فإنه قريباً سيكون المشاهد عاجزاً عن التفريق بين المعلق الرياضي الحقيقي وروبوتات الدردشة، بفضل التطورات التي تجمع بين الرؤية الحاسوبية ونماذج لغة تحويل النص إلى كلام بطرق جديدة، يصعب على المشجعين التمييز بينهما.

الروبوت المعلق

يعمل باحثو IBM من مختبر MIT-IBM Watson للذكاء الاصطناعي على دمج نماذج الذكاء الاصطناعي بهذه الطريقة لضبط عناصر الكلام، مثل التنغيم ومستوى الصوت، في التعليقات الرياضية المولدة بواسطة الذكاء الاصطناعي، بحيث تبدو أكثر واقعية وتفاعلية. على سبيل المثال، تستطيع النماذج اكتشاف متى يبدي المشجعون واللاعبون حماساً شديداً بعد نقطة مهمة، ويمكن لصوت الذكاء الاصطناعي أن يصبح أكثر حيوية استجابة لذلك، بدلاً من تقديم جميع التعليقات بمستوى الحماس الآلي نفسه.

تعزيز قدرات البشر

قال روجيريو فيريس، كبير العلماء والمدير الأول لمختبر الذكاء الاصطناعي التابع لمعهد ماساتشوستس للتكنولوجيا (MIT) وIBM واتسون: «إن فكرة التعليقات المولدة بواسطة الذكاء الاصطناعي لا تهدف إلى استبدال البشر، بل إلى تعزيز قدرات البشر وتوفير تغطية أوسع للمحاكم التي تفتقر حالياً إلى التعليقات».

التكنولوجيا وراء الصوت

في عام 2023، تعاونت شركتا IBM للاستشارات وIBM للأبحاث لتقديم تعليقات رياضية مولدة بالذكاء الاصطناعي لبطولتي الولايات المتحدة المفتوحة وويمبلدون. ولتحقيق ذلك، استخرج الفريق أولاً بيانات وصفية تفصيلية من لقطات فيديو باستخدام الرؤية الحاسوبية لفهم كل تفاصيل المباراة. رصد النموذج حركة الملعب والشباك وموقعهما؛ وتعقب اللاعبين والكرات؛ وصنف ضربات مختلفة، من الضربات الخلفية إلى الضربات الأمامية إلى الضربات الطائرة؛ وحدد اتجاه كل ضربة. دمج الباحثون هذه البيانات الوصفية مع معلومات إضافية من مصادر أخرى، مثل صوت هتاف الجماهير، بالإضافة إلى بيانات تسجيل المباريات وسرعة الكرة المقاسة بالرادار. ثم غذى الفريق هذه البيانات الوصفية الغنية في نموذج لغوي كبير (LLM) معدل بدقة لإنتاج تعليقات باللغة الطبيعية كمخرجات.

مخرجات الذكاء الاصطناعي

كانت المهمة التالية هي جعل مخرجات الذكاء الاصطناعي تبدو وكأنها بشرية. مع أن المخرجات كانت دقيقة من حيث المحتوى، إلا أن معظم طلاب الماجستير في القانون لا يستطيعون إنتاج لغة تتضمن علم العروض، وهو المصطلح اللغوي لعناصر الكلام - مثل التنغيم والنبر والإيقاع وشدة الصوت - التي تعطي معاني مختلفة لكلمات أو عبارات معينة.

نموذج أولي واعد

تم تدريب ProsodyLM مسبقاً على 30.000 ساعة من الكتب الصوتية، وأظهر في النهاية فهماً أفضل للعروض مقارنة بالنماذج السابقة في مختلف الفئات. على سبيل المثال، يستطيع ProsodyLM التعرف بشكل صحيح على المشاعر والتوتر في العبارات الكلامية، دون الحاجة إلى تدريب على أداء هذه المهام. من خلال ترميز معلومات ومحتوى العروض بشكل واضح، يمكن لنموذج اللغة الناتج توليد كلام معبر للغاية، وتطوير فهم أولي للتوكيد والعاطفة، واستنساخ الأنماط بنجاح في الكلام المرجعي.

إثارة بالذكاء الاصطناعي

«الآن، بدلاً من المعلقين بالذكاء الاصطناعي الذين يتحدثون بمستوى رتيب من الإثارة ويبدون غير طبيعيين للجمهور، يمكن لهذه الأدوات التعبير عن مستوى عالٍ من الإثارة تماماً مثل المعلقين البشريين، الذين يصبحون أكثر تعبيراً خلال تجمع مثير للغاية»، كما قال تشانغ.

قال فيريس إنه بعد تطوير النموذج الأولي إلى مرحلة الإنتاج وإطلاق التعليق الرياضي المثير في بطولات التنس الرسمية، قد تكون الخطوة التالية هي السماح للجماهير بتخصيص التعليق الرياضي. على سبيل المثال، يمكن للجماهير تحديد ما إذا كانوا يريدون تعليقاً حماسياً أم منخفضاً. في غضون ذلك، أشار تشانغ إلى أن الفريق يحظى باهتمام كبير من الباحثين والعملاء الذين يعملون على رياضات أخرى مثل سباقات سيارات الفورمولا 1.

عرض تقديمي

بالإضافة إلى ذلك، كان هذا التعليق الرياضي المفعم بالإثارة، والمعتمد على الذكاء الاصطناعي، جزءاً من عرض تقديمي من IBM بعنوان «خلف الكواليس» لبطولة أمريكا المفتوحة 2025 هذا العام، والذي تناول تقنيات التنس الناشئة. هذا يعني أنه في المستقبل القريب، قد ترغبون في متابعة الحدث عن كثب لمعرفة ما إذا كان بإمكانكم اكتشاف ما إذا كان معلقاً بشرياً أم معلق ذكاء اصطناعي يثير حماس الجمهور بعد ضربة ساحقة من أعلى أو ضربة مفاجئة.