«البيان» أول مؤسسة إعلامية تقوم بتطبيقه، إطلاق أحدث محرك بحث يعتمد على استخدام المشتقات والمترادفات بعيداً عن محدودية القواميس

ت + ت - الحجم الطبيعي

الاربعاء 10 شعبان 1423 هـ الموافق 16 أكتوبر 2002 يشهد جناح مؤسسة «البيان» للصحافة والطباعة والنشر بمعرض جيتكس 2002 اقبالاً واسعاً للتعرف على أحدث مشاريع معالجة اللغة العربية بالذكاء الاصطناعي والتوثيق الالكتروني التي تشارك بها المؤسسة في المعرض، وذلك استمراراً لعملية التطوير والتحديث التي تتبعها «البيان» لتقديم ما هو أفضل وأيسر لمتصفحي موقعها على شبكة الانترنت الذي تم اطلاقه منذ عام 1998. ويقول فيصل بن حيدر مدير تقنية المعلومات بالمؤسسة ان تدشين المشروعين الجديدين لمؤسسة «البيان» يأتي استمراراً لمسيرة المؤسسة التقنية نحو تقديم أفضل خدمة لزائر موقع «البيان» سواء على صعيد البحث أو الارشفة. وأضاف ان موقع «البيان» الذي تم اطلاقه منذ أكثر من 4 سنوات يحتوي حالياً على أكثر من 250 ألف خبر يتم البحث خلالها بسهولة، مشيراً الى انه استمراراً لهذه العملية التطويرية تعرض المؤسسة ومن خلال جناحها في المعرض مشروعي معالجة اللغة العربية باستخدام الذكاء الاصطناعي والتوثيق الالكتروني للأخبار. خدمة متميزة وأوضح بن حيدر ان مؤسسة «البيان» تنفرد من بين المؤسسات الاعلامية الاخرى بتقديم هذه الخدمة لمتصفحيها على شبكة الانترنت، مشيراً الى انه تم تخصيص مركز للتوثيق الالكتروني بالمؤسسة يعمل به 13 موثقاً واختصاصي توثيق يقومون يومياً بتصنيف الاخبار وتوثيقها الكترونياً باستخدام «مكنز» جامعة الدول العربية والذي تم تعديله وتطويره ليحتوي على 68 الف واصفة «الواصفة جملة تصف محتوى الخبر» بعد ان كان يحتوي على 11 ألف واصفة فقط. استخدام الذكاء الاصطناعي وقال مدير التقنية «بالمؤسسة» ان هذا المشروع يتكامل مع المشروع الثاني وهو مشروع معالجة اللغة العربية باستخدام الذكاء الاصطناعي الذي يعد من المشروعات التقنية الرائدة للمؤسسة والذي يهدف الى تسهيل عملية البحث عن الكلمة العربية التي تتميز بتعدد مشتقاتها وفروعها مما يتسبب في حدوث بعض المشاكل عند عملية البحث من خلال محركات البحث الاخرى. وقال ان المحرك الجديد يمكن من خلاله الوصول الى المعنى الذي يقصده الباحث بسهولة حيث يظهر له أصل الكلمة ومشتقاتها ومترادفاتها وواصفاتها، وضرب لذلك مثلاً بكلمة رجوع التي هي مصدر للفعل رجع، فعند البحث عن خبر يحتوي عنوانه على كلمة «رجوع» تظهر الكلمة بمشتقاتها: رجع، رجوع، استرجاع.. الخ. ومرادفاتها: عودة، قدوم.. الخ، وايضا واصفات خبرية تحمل جملاً وصفية لها، وعندئذ يقوم الباحث بسهولة بتحديد المعنى والعنوان الذي يقصده بالفعل للدخول عليه مباشرة. وأوضح بن حيدر ان هذه العملية تتم بدون استخدام الجهاز لأي قواميس أو معاجم لغوية التي تعد محدودة في كلماتها وانما تتم عن طريق خوارزميات ذكية تستخدم الذكاء الاصطناعي. محدودية القواميس من جانبه يقول هلال الخيواني خبير البرمجة اللغوية وصاحب فكرة برنامج المعالجة بالذكاء الاصطناعي للغة ان الفكرة استغرقت نحو 7 سنوات لترى النور والهدف منها هو سد الفجوة الكبيرة الموجودة في عمليات البحث التي تعتمد على استخدام قواميس اللغة والتي تكون قاصرة في كثير من الاحيان على ايجاد المعنى الذي يقصده الباحث لمحدوديتها وكذلك الهدف هو ايجاد حلول لمشاكل التعامل اللغوي مع الكمبيوتر والتي لم تحظ بالاهتمام على مدى العشرين عاماً الماضية رغم التطور الكبير الذي يشهده مجال الحاسوب بسرعة كبيرة. سخاء اللغة العربية وأضاف هلال انه من هذه المشاكل توجد مشكلة خاصة باللغة العربية التي تتعدد بها المشتقات واللواصق في الكلمة الواحدة والتي تصل الى نحو 60 ألف شكل للكلمة، مشيراً الى انه في الحالة التي يستخدم فيها القاموس فإنه يجب ان يحتوي على 60 ألف احتمال للتعامل مع الكلمة وهذا شيء مستحيل حدوثه، أما من خلال استخدام المحرك الجديد الذي يعتمد على الذكاء الاصطناعي فانه يتم تحليل الكلمة من خلال المرور بعدة خطوات مثل، نزع السوابق واللواصق ثم تحليلها حرفياً للوصول الى الجذر وتحليلها دلالياً وصولاً الى المعنى المراد. الحلول وأوضح هلال ان من المشاكل التي استطاع البرنامج ايجاد حلول شاملة لها مشاكل الاحلال والابدال ومشاكل الحروف المحذوفة والمشاكل الاملائية، وقال ان البرنامج يقوم بالبحث في ابعاد الكلمة الصوتية والدلالية التي تصل الى 23 ألف قيمة صوتية و220 قيمة دلالية ثم يتم تحديد كود رقمي للبعد الصوتي والبعد الدلالي للكلمة بهدف الحصول السهل على جميع المشتقات والمترادفات، وأضاف ان طريقة البحث الجديدة تعد أول طريقة يتم استخدامها للبحث بالمترادفات وتعد «البيان» أولى المؤسسات التي تعتمدها في البحث، وأشار الى ان طرق البحث في البرنامج عديدة منها البحث على مستوى الكلمة واللواصق والمترادفات والجذور. وحول برنامج الارشفة الالكترونية قال خبير البرمجة اللغوية «بالبيان» ان من خلال هذا المشروع يتم تحديد ملف خاص لأي خبر ليأخذ كوداً رقمياً ويتم ربطه بمكنز «البيان» ومن ثم يتم التعرف الآلي على محتوى الوثيقة وارشفتها لتسهل بعد ذلك عملية البحث الالكتروني، من خلال الوصول الى الواصفات للكلمة المطلوبة.

Email