مدارات

موت اللغات.. هل نلوم الإنترنت

ت + ت - الحجم الطبيعي

لمشاهدة الغرافيك بالحجم الطبيعي اضغط هنا

 

اللغات حيثما كان تحتضر، وتشير التقديرات إلى أن لغة واحدة على الأقل تسير على طريق الانقراض كل 14 يوماً، وذلك بالرغم من ارتفاع مستوى دعم الإنترنت لعدد من اللغات. لكن هل يسرّع غياب التنوع اللغوي عبر الإنترنت موت اللغة، أو أنه يعكس ببساطة ما يحدث في العالم غير المتصل بالشبكة؟يوجد حالياً حوالي سبعة آلاف لغة قيد الاستخدام، 90% منها محكي من قبل أقل من 100 ألف شخص. ويصل عدد الأشخاص الذين يتحدثون اللغات التي تحتل المراتب العشرة الأولى إلى مئات الملايين في حين يبلغ عدد الناطقين باللغات التي تشكل الثلث الأخير من القائمة ألفاً أو أقل.

وتعطي بعض الدراسات انطباعاً متفائلاً بحضور اللغة العربية على الإنترنت، لكن دراسةً للأمم المتحدة أظهرت خجلاً ملحوظاً للعربية مقارنةً بسواها. وإن كان البعض يعزو صعوبة الحضور لطبيعة اللغة العربية من حيث حروفها ومفرداتها، فإن اليابانية والصينية والتركية، سجلت تقدماً وقوةً في المحتوى على الساحة الرقمية.

وتوجد في المنطقة الوسطى الضبابية بضع مئات من اللغات متحدثوها بالملايين، وتحظى مع ذلك بمستويات غير متناسقة من الدعم عبر الإنترنت. وتشكل اللغة السويدية التي ينطق بها 9.6 ملايين متحدث، ثالث أكبر لغات موقع ويكيبيديا، حيث يوجد ما يزيد على ثلاثة ملايين مقال، كما أنها تحظى بدعم الترجمة عبر مواقع «غوغل للترجمة» و«بينغ للترجمة»، و«فيسبوك» و«سيري»، وتعليقات موقع «يوتيوب» وإلى ما هنالك. أما لغة الأوريا، وهي اللغة الرسمية لولاية أوديشا الهندية فيتحدث بها حوالي 38 مليون شخص، ولا تسجل أي ظهور على موقع «غوغل للترجمة»، كذلك لغة الأورومو، ومتحدثوها 34 مليون شخص، والمنتشرة بمعظمها في إثيوبيا، فلا يظهر لها إلا 772 مقالاً على موقع ويكيبيديا.

فلماذا تحظى إذاً كل من اللغات اليونانية والسويسرية والهنغارية والسويدية والتي يتراوح عدد الناطقين بها بين 8 و13 مليوناً بدعم «غوغل للترجمة»، وحضور قوي على ويكيبيديا، في حين تشهد لغات ذات حجم مماثل أو أكبر كالبوجورية الهندية (51 مليوناً) والفولانية الإفريقية ضموراً تكنولوجياً؟

يعود السبب بجانب منه إلى أن اليونانية والسويسرية والهنغارية والسويدية تقع من ضمن اللغات الرسمية الـ 24 للاتحاد الأوروبي، بما يعني أن طائفة من المترجمين البشر ينكبون على ترجمة عدد من وثائق البرلمان الأوروبي سنوياً. وتشكل الملفات الخاضعة للترجمة البشرية قاعدة ضخمة لما يسميه اللغويون بالمجموع الموازي، أي الكتلة الضخمة من النصوص الموازية، المترجمة جملة بجملة إلى عدد من اللغات. أما محركات الترجمة الآلية فتستخدم المجموع الموازي لتصور التطابقات المنتظمة بين اللغات. وتحتاج هذه الترجمة لتكون فاعلة، مجموعاً موازياً ضخماً لكل لغة، يحتوي على نحو مثالي ليس على المحاضر البرلمانية وحسب، بل على التقارير الإخبارية، والروايات، ونصوص الأفلام، إلخ...

إلى جانب الاتحاد الأوروبي، تمتلك اللغات المذكورة مصادر لغوية غنية، مبتكرة بشرياً على امتداد قرون من الزمن. كما أنها لغات دول قومية بأكملها، حيث التسجيلات المرئية والصوتية القومية التي يمكن استخدامها كأسس لنماذج للتصنيع الصوتي. ويملك الناطقون بتلك اللغات نوعاً من الدخل المتاح الذي يجعل شركات الإعلام تقوم بترجمة الروايات الشهيرة والأفلام الأجنبية والعروض التلفزيونية. إنها لغات قائمة في بلدان تتصور شركات التكنولوجيا أن عملاءها قد يكونون مقيمين هناك أو يخططون لزيارتها في العطل بما يعني جدوى إضفاء الطابع المحلي على الواجهات البيانية وإضافتها إلى خيارات الترجمة.

المصادر اللغوية لا تظهر ببساطة، بل يوجد مَن يقرر ابتكارها عبر الاستعانة بأشخاص معنيين. ويستغرق خلق المحتوى الموازي والمصادر اللغوية الأخرى سنوات عدة، وبكلفة تصل إلى ملايين الدولارات. لا يزال فهم كيفية تمثيل التنوع اللغوي على النحو الأمثل عبر الإنترنت يجسّد واحداً من التحديات الكبرى. وتشير تقديرات موقع فيسبوك إلى أن جعل الإنترنت مفيداً لـ 80% من سكان العالم لا يتطلب إلا محتوى متوفر بـ 92 لغة. لكن سيكون من غير الصائب، أو غير المجدي بالأحرى أن تدعم الإنترنت كل اللغات الحية المحكية في العالم.

اللغات حيثما كان تحتضر، وتشير التقديرات إلى أن لغة واحدة على الأقل تسير على طريق الانقراض كل 14 يوماً، وذلك بالرغم من ارتفاع مستوى دعم الإنترنت لعدد من اللغات. لكن هل يسرّع غياب التنوع اللغوي عبر الإنترنت موت اللغة، أو أنه يعكس ببساطة ما يحدث في العالم غير المتصل بالشبكة؟يوجد حالياً حوالي سبعة آلاف لغة قيد الاستخدام، 90% منها محكي من قبل أقل من 100 ألف شخص. ويصل عدد الأشخاص الذين يتحدثون اللغات التي تحتل المراتب العشرة الأولى إلى مئات الملايين في حين يبلغ عدد الناطقين باللغات التي تشكل الثلث الأخير من القائمة ألفاً أو أقل.

وتعطي بعض الدراسات انطباعاً متفائلاً بحضور اللغة العربية على الإنترنت، لكن دراسةً للأمم المتحدة أظهرت خجلاً ملحوظاً للعربية مقارنةً بسواها. وإن كان البعض يعزو صعوبة الحضور لطبيعة اللغة العربية من حيث حروفها ومفرداتها، فإن اليابانية والصينية والتركية، سجلت تقدماً وقوةً في المحتوى على الساحة الرقمية.

وتوجد في المنطقة الوسطى الضبابية بضع مئات من اللغات متحدثوها بالملايين، وتحظى مع ذلك بمستويات غير متناسقة من الدعم عبر الإنترنت. وتشكل اللغة السويدية التي ينطق بها 9.6 ملايين متحدث، ثالث أكبر لغات موقع ويكيبيديا، حيث يوجد ما يزيد على ثلاثة ملايين مقال، كما أنها تحظى بدعم الترجمة عبر مواقع «غوغل للترجمة» و«بينغ للترجمة»، و«فيسبوك» و«سيري»، وتعليقات موقع «يوتيوب» وإلى ما هنالك. أما لغة الأوريا، وهي اللغة الرسمية لولاية أوديشا الهندية فيتحدث بها حوالي 38 مليون شخص، ولا تسجل أي ظهور على موقع «غوغل للترجمة»، كذلك لغة الأورومو، ومتحدثوها 34 مليون شخص، والمنتشرة بمعظمها في إثيوبيا، فلا يظهر لها إلا 772 مقالاً على موقع ويكيبيديا.

فلماذا تحظى إذاً كل من اللغات اليونانية والسويسرية والهنغارية والسويدية والتي يتراوح عدد الناطقين بها بين 8 و13 مليوناً بدعم «غوغل للترجمة»، وحضور قوي على ويكيبيديا، في حين تشهد لغات ذات حجم مماثل أو أكبر كالبوجورية الهندية (51 مليوناً) والفولانية الإفريقية ضموراً تكنولوجياً؟

يعود السبب بجانب منه إلى أن اليونانية والسويسرية والهنغارية والسويدية تقع من ضمن اللغات الرسمية الـ 24 للاتحاد الأوروبي، بما يعني أن طائفة من المترجمين البشر ينكبون على ترجمة عدد من وثائق البرلمان الأوروبي سنوياً. وتشكل الملفات الخاضعة للترجمة البشرية قاعدة ضخمة لما يسميه اللغويون بالمجموع الموازي، أي الكتلة الضخمة من النصوص الموازية، المترجمة جملة بجملة إلى عدد من اللغات. أما محركات الترجمة الآلية فتستخدم المجموع الموازي لتصور التطابقات المنتظمة بين اللغات. وتحتاج هذه الترجمة لتكون فاعلة، مجموعاً موازياً ضخماً لكل لغة، يحتوي على نحو مثالي ليس على المحاضر البرلمانية وحسب، بل على التقارير الإخبارية، والروايات، ونصوص الأفلام، إلخ...

إلى جانب الاتحاد الأوروبي، تمتلك اللغات المذكورة مصادر لغوية غنية، مبتكرة بشرياً على امتداد قرون من الزمن. كما أنها لغات دول قومية بأكملها، حيث التسجيلات المرئية والصوتية القومية التي يمكن استخدامها كأسس لنماذج للتصنيع الصوتي. ويملك الناطقون بتلك اللغات نوعاً من الدخل المتاح الذي يجعل شركات الإعلام تقوم بترجمة الروايات الشهيرة والأفلام الأجنبية والعروض التلفزيونية. إنها لغات قائمة في بلدان تتصور شركات التكنولوجيا أن عملاءها قد يكونون مقيمين هناك أو يخططون لزيارتها في العطل بما يعني جدوى إضفاء الطابع المحلي على الواجهات البيانية وإضافتها إلى خيارات الترجمة.

المصادر اللغوية لا تظهر ببساطة، بل يوجد مَن يقرر ابتكارها عبر الاستعانة بأشخاص معنيين. ويستغرق خلق المحتوى الموازي والمصادر اللغوية الأخرى سنوات عدة، وبكلفة تصل إلى ملايين الدولارات. لا يزال فهم كيفية تمثيل التنوع اللغوي على النحو الأمثل عبر الإنترنت يجسّد واحداً من التحديات الكبرى. وتشير تقديرات موقع فيسبوك إلى أن جعل الإنترنت مفيداً لـ 80% من سكان العالم لا يتطلب إلا محتوى متوفر بـ 92 لغة. لكن سيكون من غير الصائب، أو غير المجدي بالأحرى أن تدعم الإنترنت كل اللغات الحية المحكية في العالم.

 

الشبكة العنكبوتية لا توصل بين الآلات، بل بين البشر.

تيم بيرنيرز لي (عالم كمبيوتر بريطاني، مخترع الشبكة العنكبوتية العالمية)

 

95 % من اللغات المستخدمة اليوم لن تحقق جذباً على الإنترنت.

أندراس كوراني(دكتور مجري متخصص في اللغويات الحاسوبية)

 

إن كان الإعلام الرقمي مرتكزاً بقوة على غير الأميين فإن العالم الرقمي ليس صديقاً لمستخدمي اللغات الأصلية.

 إيني لوتر (المديرة التنفيذية لمعهد اللغات الأصلية)

 

سيطرة اللغة الإنجليزية

بالرغم من تنوع اللغات المتزايد عبر الإنترنت، لا تزال اللغة الإنجليزية المسيطرة. فمن بين المواقع الإلكترونية العشرة ملايين الأكثر شهرة، يقع 55.2% باللغة الإنجليزية. ونرى بعض اللغات الأخرى التي تتسم بنوع من الأهمية أيضاً كالفرنسية واليابانية والروسية والإسبانية، والتي تتراوح نسبتها بين 4% و5.8%.

 

 

3.2000.000.000

يتبلور انحياز الإنترنت للغرب في أبهى صوره لدى النظر في اللغة الهندية، تلك اللغة الأم لأكثر من 310 ملايين شخص في العالم. على الرغم من كونها رابع أكثر اللغات الإنسانية الحية المحكية، فإن أقل من 0.1 بالمئة من المواقع العشرة ملايين الأشهر تظهر باللغة الهندية. ولا تعتبر المشكلة الهندية فريدة من نوعها أو استثنائية، فاللغة الصينية تستخدم بشكل يتراوح بين 2.4 و2.8 بالمئة من المواقع الإلكترونية، على الرغم من أن الناطقين بها تقدر أعدادهم بـ 1.2 مليار شخص.

ولا تقتصر الإشكالية على الكلمات بل على الرموز المستعملة لكتابة الكلمات عبر الإنترنت، فالعديد من مستخدمي الإنترنت المقدر عددهم بحوالي 3.2 مليارات مستخدم لا يستطيعون قراءة أو فهم نص مكتوب باللغة اللاتينية، مما يعني أن موقع «دبليو دبليو دبليو دوت فيسبوك دوت كوم» بأحرفه اللاتينية لا معنى له أو يصعب تذكره بالنسبة لهؤلاء. ومع أن الأمر يبدو تافهاً، لكن توفر أسماء النطاقات باللغة اللاتينية فقط يرجح كفة ميزان القوة لصالح الاقتصادات القديمة القوية وحسب.

 

حتمية فقدان اللغات

يشير مسار التاريخ إلى أن فقدان اللغات، كما تغيّرها، أمر لا مفر منه. ويبقى مع ذلك فهم الأسباب معقداً. ويصنف موقع «إثنولوج»، المعني بإحصاء أعداد المتحدثين بكل اللغات الإنسانية الحية، 1519 لغة حية حالياً ضمن قائمة المعرضة للاندثار، و915 في طور الاحتضار.

يشير مسار التاريخ إلى أن فقدان اللغات، كما تغيّرها، أمر لا مفر منه. ويبقى مع ذلك فهم الأسباب معقداً. ويصنف موقع «إثنولوج»، المعني بإحصاء أعداد المتحدثين بكل اللغات الإنسانية الحية، 1519 لغة حية حالياً ضمن قائمة المعرضة للاندثار، و915 في طور الاحتضار.

 

صفحة متخصصة تصدر عن قسم الترجمة

Email