باحثو إنتل يعلمون أجهزة الكمبيوتر «قراءة الشفاه» لتعزيز دقة برامج التعرف على الكلام

الخميس 29 صفر 1424 هـ الموافق 1 مايو 2003 أصدر الباحثون في شركة إنتل برنامجا بموجب ترخيص مفتوح المصدر يسمح للمطورين بتصنيع أجهزة كمبيوتر ترى و«تقرأ الشفاه» تماما كما يفعل الإنسان، وذلك لكي تفهم الأوامر الشفهية بشكل أفضل. وتعمل الخوارزميات الحالية للتعرف على الكلام بشكل جيد عندما يخلو المكان من الضجيج أو عند استخدام سماعة رأسية جيدة ولكن دقتها تقل بشكل سريع عندما تُشغل التطبيقات في بيئات بها ضجيج مثل الأماكن العامة. وعند جمعها مع خوارزميات استبيان الوجه من مكتبة OpenCV لرؤية الكمبيوتر التابعة لـ «إنتل»، تُمكن البرامج السمعية والبصرية للتعرف على الكلام (AVSR) أجهزة الكمبيوتر من استبيان وجه المتكلم وتتبع حركات فمه. وتسمح قدرات مواقتة بيانات الفيديو مع تقنيات التعرف على الكلام بالتعرف على الكلام بدقة أكبر مما يُحسن مجموعة واسعة من تطبيقات الكمبيوتر في البيئات التي تتسم بالضجيج. هذا ويشكل برنامج AVSR جزءا من مكتبة OpenCV لرؤية الكمبيوتر التابعة لإنتل والتي هي عبارة عن طاقم أدوات يضم أكثر من 599 وظيفة تصويرية تساعد الباحثين على تطوير تطبيقات رؤية الكمبيوتر. وقال جستن راتنر، كبير الزملاء في إنتل في مجموعة منصات الشركات ومدير مختبرات بحوث المعالجات المكروية في إنتل: «تسعى إنتل لتطوير تقنيات تُمكَن أجهزة الكمبيوتر من التفاعل بشكل طبيعي مع العالم كما يفعل الإنسان. ونادرا ما تعتمد قدرة الإنسان على التعرف على شيء ما على نوع واحد من المعلومات. فنحن نتخذ القرارات بجمع المعلومات من مصادر متنوعة. ومن المؤكد أن إضافة شيفرة التعرف على الكلام من خلال تقنيات الصوت والفيديو إلى مكتبة OpenCV التابعة لإنتل سيدفع جهود الأبحاث والتطوير في مجال تطبيقات التعرف على الكلام بمساعدة الرؤية». وتسهم المعالجات المكروية الأسرع وانخفاض أسعار الكاميرات وعرض النطاق الأوسع بعشر مرات لالتقاط صور الفيديو والذي تتيحه تقنيات مثل USB2، في إتاحة تشغيل خوارزميات رؤية الكمبيوتر في الزمن الحقيقي على أجهزة الكمبيوتر العادية. وقد صُممت مكتبة OpenCV لتحث على الابتكار في هذا المجال بتقديمها شيفرة المصدر لمجموعة كبيرة من وظائف رؤية الكمبيوتر ووظائف التصوير. ومنذ تدشينها في عام 2000، سجلت OpenCV أكثر من 500.000 عملية تحميل للشفرة كما استقطبت ما يزيد على 5.000 عضو مسجل في مجموعة مستخدمي المكتبة. ويستعمل المطورون شيفرة OpenCV في تطبيقات تتراوح ما بين الألعاب وحتى التصنيع في القطاع الصناعي. ويشتمل البرنامج على شيفرة المصدر «سي» التي تتيح وظائفية المكتبة بالكامل فضلا عن ترخيص لإعادة التوزيع بدون رسوم ملكية. وطورت إنتل نموذجا لامركزيا للأبحاث فريدا من نوعه يضم أكثر من 70 مختبرا حول العالم. ويتمركز غالبية مطوري برامج AVSR في مركز أبحاث إنتل في مدينة بيجنغ في الصين. ويعمل في هذا المركز الذي أسس في عام 1998، أكثر من 40 عالم ومهندس أبحاث يعملون في مجالات مثل رؤية الكمبيوتر والوسائط وشبكات Bayesian وبرامج الترجمة والأدوات.

طباعة Email
تعليقات

تعليقات