الجمعة 25 محرم 1424 هـ الموافق 28 مارس 2003 في اطار الخدمات المتميزة التي نقدمها للقراء نبدأ من هذا العدد نشر دراسة علمية متكاملة حول محركات البحث على الانترنت اعدها خصيصاً للمجلة الدكتور زين عبدالهادي مدير إدارة المعلومات بالمنظمة العربية للتنمية ، الإدارية ونائب رئيس الاتحاد العربي للمكتبات والمعلومات، وتتناول الدراسة التعريف بمحركات البحث على شبكة الانترنت واهميتها وبنيتها وتركيبها وطرق البحث المعتمدة، كما تعرض بعض التجارب المحركات لاختبار قوتها وسماتها ومدى ملاءمتها لمواقف بحثية معينة، ثم عرض لنتائج هذه التجارب بما يضع بين يدي القاريء صورة متكاملة وعن قرب حول محركات البحث على الشبكة تساعده في التجوال على الانترنت بحرية اكبر والحصول على ما يريد، وأيضاً اختيار الانسب من بينها لاحتياجاته، ونبدأ في هذا العدد بالتعرف على البنية التركيبية لمحركات البحث ومفهومها واستخداماتها وأساليب البحث المستخدمة. محركات البحث هي أدوات بحث تعمل من خلال استراتيجيات محددة «البحث البوليني» أو استراتيجيات مفتوحة «البحث باللغة الطبيعية»، وذلك للبحث في حقول Fields او وثائق نصية Text Documents والاكثر من ذلك انها يمكن ان تبحث عن اشياء. Objects «صور ورسوم وخرائط وأصوات» في بيئة محددة هي بيئة شبكة الانترنت، وذلك يعني انها تبحث في ملايين المواقع ومليارات الكلمات في وقت محدد، وتتميز بسرعة الاستجابة وعادة ما تكون اجاباتها اما مواقع على الانترنت تتوافر فيها كل المصطلحات التي تم البحث عنها او بعضها او مواقع محددة سلفاً من خلال ما يعرف بقائمة أو دليل البحث Search Directory. كذلك فإن محركات البحث تعتبر النتاج الطبيعي لتطور المتصفحات Browsers على شبكة الانترنت، فقد كان لابد من توافر وسائل وأدوات تمكن من البحث على مواقع الانترنت بسرعة وسهولة وفي ذات الوقت بشكل غير معقد، وان يتألف معها عدد كبير من المتعاملين على الشبكة. وقد تطورت هذه المحركات بحيث اصبحت تقام عليها مؤسسات بأكملها تبلغ استثماراتها ملايين الدولارات، وتشهد هذه المؤسسات العديد من الظواهر التي ترتبط باقتصاديات السوق كالشراكة Partnership والتحالفات الاستراتيجية والاندماجات وغيرها من ظواهر الصناعة الحديثة المرتبطة بعالم المعلومات. وقد ارتبط ظهور محركات البحث بظهور متصفحات شبكة الانترنت، كما ارتبط بمعضلة كبيرة كانت تواجه الباحثين من قبل هذه المعضلة تشبه إلى حد كبير معضلة البحث في فهارس مكتبة عملاقة، فكيف يكون الحال اذا كنا نبحث عن عنوان كتاب معين في ذات الوقت الذي لا يتوافر فيه فهرس عنوان بالمكتبة أو كيف يكون الموقف عند الرغبة في البحث عن الاوعية والكتب التي تناولت قضية معينة او موضوعاً معيناً، حيث لا يتوافر فهرس للموضوعات في المكتبة، وبالطبع فالأمر اكثر خطورة على شبكة الانترنت فأنت تبحث في ملايين المواقع عن شيء محدد او كما يقول المثل العامي «البحث عن ابرة في كوم من القش». لقد اصبح الموقف اعقد من ذلك فأحياناً نضطر للبحث عن شخص معين على الانترنت عن رقم هاتف معين عن بلدة محددة انها اسئلة واستفسارات من النوع البسيط لكنها في ظل عدم وجود أدوات تنظم هذا الكم الرهيب من الصفحات على الانترنت، فإن البحث في هذه الحالة يصبح نوعاً من العبث الذي لا طائل من ورائه. لقد استغرق بناء هذه المحركات العديد من السنوات على شبكة الانترنت، ومن الناحية الفنية فهي برامج آلية صممت للعمل في بيئة الانترنت سميت باسم محركات البحث أو أدوات البحث، وهي في الحقيقة نظم لإدارة قواعد البيانات تم تطويرها لإدارة البيانات، وقد طورت بصفة خاصة للعمل على الانترنت «1»، وهي وسيلة البحث عن المعلومات على الانترنت، وعلى ذلك فإن مصممي متصفحات الوب على الانترنت قد طوروا مواجهات للوب تمكن مستخدمي المتصفحات من الاتصال بمحركات البحث، أي انه من الناحية الفنية لكي يتم البحث على الانترنت فإن هناك ثلاثة انواع من الاتصالات تتم لكي يمكن استخدام الأدوات المتاحة في محرك البحث حتى نتمكن من البحث على شكل «1» طرق الاتصالات على شبكة الانترنت للوصول إلى محرك البحث. قد تكون صفحة أولى Home page أو تستخدم كأداة من صفحة أولى لموقع على الانترنت مثل مايكروسوفت أو قناة CNN للأخبار برنامج محمل على الحاسب ينطلق كلما تم الاتصال «اتصال هاتفي قد لا يتم في حالة وجود خط مؤجر Leased Line مفتوح بصفة دائمة على الانترنت». الحاسب 2 ـ بنية محرك البحث على الانترنت Strucre of Search Engine لقد سبقت الاشارة إلى ان محرك البحث عبارة عن برنامج program أو نظام لإدارة قواعد البيانات، هذا النظام مكون من ثلاثة اجزاء تعمل في تناسق بهدف التمكين من البحث على الانترنت.. هذه الاجزاء هي: 1 ـ الزاحف او العنكبوت Crawler or Spider وهو جزء من البرنامج ينطلق لزيارة صفحات الشبكة العنكبوتية على فترات منتظمة متكررة، قد تكون نصف شهرية أو شهرية، وهو يتتبع الصفحات ذات الصلة «المربوطة» Linked بالموقع الأم، ويتتبع كذلك أي تغيرات يمكن ان تكون قد تمت، وبالتالي فهو يمكننا من ربط كل الصفحات الفرعية بالصفحة الام للموقع، ومن ثم ننتقل إلى الجزء الثاني من برنامج محرك البحث وهو الكشاف أو الفهرس. 2 ـ الفهرس أو الكشاف Catalog or index كل مرة يتم فيها زيارة أي موقع على الانترنت من قبل الزاحف او العنكبوت، يقوم فيها هذا الاخير ببناء قائمة شبه آلية. يجمع المصطلحات التي وردت في الصفحات التي تمت زيارتها، وعلى ذلك فهذه القائمة هي اشبه بمكنز آلي «قاموس ذو بناء معين» يتم تحديثه في كل مرة يقوم فيها الزاحف بزيارة المواقع على الانترنت، واذا حدث أي تغيير بين الزيارة الأولى والثانية للزاحف أو نشأت صفحات جديدة، فإن هذه التغييرات لن تكون محسوسة «لن يتم تكشيفها وفهرستها» إلا مع انتهاء الزيارة الثانية للموقع، حيث تتم اضافة المصطلحات الواردة بهذه الصفحات الجديدة أو التي تم تغييرها إلى هذا الكشاف «قائمة بالمصطلحات المستخرجة من المواقع مرتبة هجائياً» أو هذا الفهرس، ومن ثم ننتقل إلى الجزء الثالث من محرك البحث. 3 ـ برنامج محرك البحث Search Engine Software وهو الذي يقوم بالبحث في الكشاف الذي تم انشاؤه للبحث بين ملايين الصفحات المسجلة في الكشاف، لكي يعثر على المواقع المتطابقة مع ما تم طلبه وأيضاً يقوم بوضع هذه الصفحات في شكل طبقي Ranking «1» ويمكن من خلال الشكل التالي التعرف على هذه الاجزاء الثلاثة: «شكل 2» بنية محرك البحث على شبكة الانترنت. أسباب اختلاف النتائج من محرك لآخر لكن يبقى السؤال اذا كانت بنية محركات البحث المتوافرة على الانترنت واحدة فما هو السبب وراء اختلاف النتائج من محرك إلى آخر!! وللاجابة عن هذا السؤال يمكن القول ان السبب الرئيسي في ذلك يعود إلى مجموعة من العناصر يمكن الاشارة اليها بشكل مبدئي في هذه المقدمة فيما يلي: 1 ـ الموقع Location كمكان مخصص للموقع على الانترنت. 2 ـ مدى تردد Frequency الزاحف على زيارة الموقع. 3 ـ قد تكون هناك سياسة لعرض المواقع، وذلك من قبل الشركة المالكة للمحرك «هذه السياسة غير معلنة في أغلب الاحيان لعامة مستخدمي المحرك». كما يمكن الاشارة إلى ان العنصر الأول هو الاكثر أهمية وتأثيراً في قضية عرض الاشارات للمواقع كنتيجة للبحث في موضوع معين أو في مواقع معينة في احد محركات البحث المتناثرة على الانترنت. والذي يحدث هنا اننا حين نبحث ـ في المكتبات على سبيل المثال ـ عن كلمة مفتاحية ما فإننا نبحث اولاً في العنوان الخاص بالكتب او المقالات، وهذا هو ما يفعله محرك البحث بالضبط اذ يعتمد مدى ترتيب الموقع بين اقرانه على مدى ظهور الكلمة المبحوث عنها في عنوان الموقع «1». على ذلك فإن الكلمة التي ظهرت في عنوان موقع ما تضع هذا الموقع في مقدمة المواقع التي تم البحث فيها والعثور على المصطلح في العنوان، يلي ذلك البحث في اقرب جزء من عنوان الصفحة كأقرب فقرة او اقرب مجموعة فقرات إلى العنوان، وعلى ذلك فإن ترتيب نتائج البحث في المواقع يعتمد على مدى قرب او بعد المصطلح في الصفحة أو الموقع الذي تم البحث فيه والعنصر الثاني المؤثر في ترتيب الموقع في نتائج البحث هو مدى تردد وظهور المصطلح الذي تم البحث عنه بالنسبة لترددات المصطلحات الاخرى في صفحات الموقع، ويمكن ان نطلق على هذين العنصرين مجتمعين منهج التردد على الموقع Location Frequency method2. وبصفة عامة فإن متوسط عدد الصفحات التي يقوم أي محرك بحث على الانترنت بفحصها دورياً يتراوح ما بين 3 ـ 15 مليون صفحة «ولا نقول موقع»، وتتراوح فترات تحديث البيانات التي يقوم المحرك بجمعها عن كل موقع ما بين دقائق إلى شهرين، وربما كان محرك البحث انفوسيك Infoseek «الباحث عن المعلومات»، وقد كان هو المحرك الوحيد صاحب اقصر مدة تحديث للبيانات. أهمية محركات البحث ربما تعود اهمية محركات البحث إلى انها تكاد تكون اهم وسيلة للبحث على شبكة الانترنت، ولكن يمكن القول بشكل عام ان عملية البحث على الانترنت اقرب في مضمونها إلى البحث في المكتبات عن معلومات معينة.. فإذا سلمنا بذلك فإن استخدام استراتيجيات بحث معينة وتوسيعها وتضييقها يضعنا جميعاً في خندق واحد يتطلب منا الدقة في اختيار المحرك الذي سنبدأ البحث منه. يتطلب هذا الوضع تأهيل هؤلاء المتعاملين مع المعلومات للتعامل مع محركا البحث، ومن هنا تأتي اهمية محركات البحث بالنسبة لمستخدمي الانترنت. وعلى ذلك يمكن القول إن أهمية محركات البحث تكمن في: 1 ـ توسيع دائرة المؤسسات التي يمكن ان تجذب خريجي الجامعات للعمل بها خارج اطار المؤسسات التقليدية. 2 ـ تلبية احتياجات المستفيد من المعلومات في المجتمع الافتراضي بالتعرف على سمات وخصائص هذه المحركات. 3 ـ التعرف على الخصائص البحثية لكل محرك وبالتالي معرفة متى يمكن استخدام محرك معين في موقف معين. 4 ـ تطوير المقررات الدراسية بالجامعات بحيث تحتوي على الموضوعات ذات العلاقة بالانترنت لتلبي الموقف العالمي الجديد. 5 ـ الحصول على اجابات سريعة وواضحة على كل الاسئلة التي يمكن ان يتوجه بها أي شخص إلى الانترنت وبالتحديد إلى محرك بحث بعينه. الأساليب المستخدمة للبحث تعتمد محركات البحث على مجموعة محددة من أساليب البحث فيها يمكن اجمالها فيما يلي: 1 ـ استخدام اللغة الطبيعية Natural Query language 2 ـ استخدام المعاملات البوليانية Boolean Operators 3 ـ استخدام معاملات التقريب Proximity Operators 4 ـ البحث باستخدام الجمل Phrase Searching 5 ـ البحث باستخدام مكانز Thesaurus 6 ـ البحث باستخدام المفهوم Concept searching 7 ـ البحث باستخدام البتر Truncation 8 ـ البحث بأسلوب المطابقة الكاملة Exact match 9 ـ البحث بأسلوب المطابقة الاحتمالية Fuzzy match 10 ـ استخدام المعاملات الرقمية Numeric Operators 11 ـ استخدام معامل المدى Range Operatoes 12 ـ البحث في حقول محددة Fielded searches 13 ـ البحث باستخدام أمثلة Query by examples 14 ـ استخدام الارشادات التي تظهر مع البحث في إعادة البحث Advisors اضافة إلى ذلك تتمتع بعض المحركات بخصائص بحث محددة مما يعني ان لكل محرك بحث على الانترنت شخصيته المتفردة التي يجب الالمام بها، حيث يصعب ان يقدم محرك بحث على الانترنت نفس النتيجة وتوجد مراجع اخرى للاستزادة. 1 Platt, Nina Website Search engines. November. 1996 the piper letter: Databases, Features and special reports. www.piperinfo.com/p103/search. html Last updated: Thu. Feb. 1997,20 ertrieved and printed:22-12-1998. 1 n: www.searchenginewatch.com- how search engines work in web site tited: search en- gine watch o webmasters/work.html. Retrieved&printed: 10/18/1998 1 - How search engines rank web pages.Ibid. p.l.2Ibid