من الذي يقرر أي الوظائف سيتسبب الذكاء الاصطناعي في اختفائها؟

جون بيرن ميردوخ - سارة أوكونور
سبق أن كتبنا - بنظرةٍ متشككة - عن كيفية إعداد الاقتصاديين لتقديراتهم المثيرة للجدل حول الوظائف «المعرضة» لتأثير الذكاء الاصطناعي.

واليوم، نتعمق أكثر في نقطة مهمة أخرى: من - أو بالأحرى، ما الذي يقرر فعلياً ما إذا كان الذكاء الاصطناعي قادراً على أداء مهمة معينة؟ وما مدى اتساق هذه التقييمات؟.

بداية، يرى جون بيرن ميردوخ أنه خلال العام أو العامين الماضيين، تم إصدار عشرات الدراسات التي تصدرت عناوين الأخبار، حاملة ادعاءات حول ما إذا كنا على وشك فقدان وظائف ذوي الياقات البيضاء، وما إذا كان الذكاء الاصطناعي يستحوذ بالفعل على وظائف الخريجين، وما إلى ذلك.

وبعيداً عن مثل هذه العناوين، من المهم التوقف عند تفصلية مهمة للغاية، غالباً ما يتم تجاهلها، وهي أن مؤشر التعرض المهني الأكثر استخداماً وانتشاراً، والذي يعود أصله إلى دراسة أجراها باحثون في «أوبن أيه آي» عام 2024، لتحديد مدى قدرة الذكاء الاصطناعي على إنجاز مهمة معينة - ككتابة تقرير، أو تفسير صورة، أو إعطاء تعليمات لموظف، وما إلى ذلك – جرى تطويره بواسطة الذكاء الاصطناعي نفسه. وتحديداً بواسطة «شات جي بي تي»، الذي أطلقته «أوبن إيه آي» نفسها.

إن إسناد مهمة تصنيف مستويات التعرض لآلاف المهام إلى نماذج لغوية ضخمة، قد يكون أمراً منطقياً، لكن يبقى السؤال المهم، والذي لم يخضع لبحث كافٍ حتى الآن، وهو ما إذا كانت نماذج الذكاء الاصطناعي المختلفة تُجري التقييمات نفسها.

وقد توصلت دراسة جديدة أجرتها ميشيل يين من جامعة نورث وسترن، إلى أن الإجابة غالباً ما تكون «لا» قاطعة.

واستخدمت ميشيل يين جميع الوظائف البالغ عددها 705 وظائف المصنفة في نظام الترميز المهني الأمريكي، وقامت بتقييم مدى إمكانية تعرضها للأتمتة بواسطة الذكاء الاصطناعي، عبر استخدام أربعة نماذج مختلفة - النموذج الأصلي لـ«شات جي بي تي»، بالإضافة إلى نماذج أحدث من شركات «أوبن إيه آي» و«أنثروبيك» و«جوجل»، مع اتباع نفس منهجية دراسة «أوبن إيه آي» الأصلية، أي تحديد ما إذا كان من الممكن تسريع مهام هذه الوظائف بشكل ملحوظ، باستخدام أدوات الذكاء الاصطناعي الحالية الموجهة للمستهلكين.

وقد وجدت يين تبايناً ملحوظاً في التقديرات، حيث تراوحت نسبة الوظائف المعرضة للخطر بين أقل من 15 %، وفقاً لتقييم «جيميني»، وصولاً إلى نسبة 50 % وفقاً لتقييم برنامج «كلود». وتبرز هذه الفجوات بشكل خاص في بعض المهن، لا سيما وظائف ذوي الياقات البيضاء، وهو أمر غير مفاجئ بالمرة.

وعلى سبيل المثال، في دراسة «أوبن إيه آي» لعام 2024، قُدِّر تعرض الاقتصاديين للأتمتة بنسبة 10 % باستخدام «شات جي بي تي-4»، بينما قدّرها «شات جي بي تي-5»، الأحدث، بأكثر من 50 %، وبلغت النسبة 80 % وفقاً لتقييم «كلود».

وتأتي هذه التباينات لتترك بطبيعة الحال آثاراً بالغة على فهمنا لمدى تأثير الذكاء الاصطناعي على سوق العمل، وكيفية هذا التأثير. فباستخدام النتائج الأصلية لتقييم التعرض المهني، نجد أن للذكاء الاصطناعي تأثيراً سلبياً طفيفاً في التوظيف.

أما باستخدام تقييمات جيميني، فينعكس هذا التأثير إلى تأثير إيجابي طفيف، حيث تشهد الوظائف الأكثر تعرضاً نمواً في التوظيف.

وكما تشير ميشيل يين، فإن هذه النتائج المتباينة تماماً، جاءت رغم استخدام البيانات والمنهجية نفسيهما، وفقط مع اختلاف نموذج الذكاء الاصطناعي المستخدم في تقييم التعرض فقط. وفي الواقع، فإن لهذه المشكلة حلاً بسيطاً نسبياً: ينبغي إجراء تحليلات لتأثيرات التعرض النظري للذكاء الاصطناعي في الواقع العملي باستخدام تقييمات نماذج مختلفة للتعرض.

وكما تشير يين، فإن التباينات في النتائج قد تكون مفيدة، إذ تدل على أن النتائج تعكس في الواقع خصائص نماذج الذكاء الاصطناعي، لا سوق العمل.

من جانبها، ترى سارة أوكونور، أن الحديث عن أبحاث استبدال الوظائف بالذكاء الاصطناعي برمته، أشبه بحالة كلما تعمقت فيها، ازدادت الصورة غموضاً.

وتوضح: لن أعيد هنا سرد جميع الأسباب التي تجعلني أعتقد أن هذه المقاييس لـ «التعرض» للذكاء الاصطناعي، يجب التعامل معها، لكن دراسة يين المثيرة للاهتمام دفعتني إلى التفكير في سؤال أوسع: هل يوجد «تأثير مماثل لاختلاف النموذج» في مجالات أخرى تُستخدم فيها نماذج التعلم الآلي لاتخاذ توصيات أو قرارات مصيرية؟.

وتنص قواعد اللائحة العامة لحماية البيانات (GDPR) في الاتحاد الأوروبي، على أن للأفراد الحق في الإصرار على «مراجعة بشرية» لبعض القرارات الآلية التي تؤثر فيهم بشكل كبير، مثل الموافقة على قرض لهم، أو ما إذا كان طلب توظيفهم سيصل إلى المرحلة التالية.

لكنني أتساءل عما إذا كان الناس - في المستقبل - سيبدأون أيضاً في الإصرار على الحصول على «رأي ثانٍ وثالث من الذكاء الاصطناعي»، على سبيل المثال، من خلال تمرير طلب توظيفهم عبر نظام يعتمد على نموذج أساسي مختلف، لمعرفة ما إذا كان سيتم التوصل إلى قرار مختلف.

بالتأكيد، لن يكون الأمر بهذه البساطة، كأن نقول: «إذا كان هذا القرار يعتمد على نموذج «أوين إيه آي»، فيُرجى الآن تطبيقه على نموذج من «جوجل»، وآخر من «أنثروبيك». وبدايةً، فإن جميع أنظمة «الذكاء الاصطناعي» لا تعتمد على نماذج التعلم غير الحتمية. فالعديد منها يستخدم مجموعات نماذج خاصة، مصممة لغرض محدد.

وعلى سبيل المثال، يستخدم «هاير فيو»، وهي من أكبر مزودي برامج التوظيف الآلي، عدداً من النماذج المختلفة، سواءً من جهات خارجية أو خاصة، لتحويل مقابلات الفيديو إلى نصوص، وتحليل هذه النصوص، ومنح المتقدمين للوظائف درجات «كفاءة» بناءً على معايير مختلفة، مثل «القدرة على التكيف» أو «حل المشكلات».

لكن قد تكون هذه فكرة مثيرة للاهتمام، وأعتقد أنها، على الأقل، تُعزز الحاجة إلى مطالبة الشركات بأقصى قدر من الشفافية حول ما يجري «خلف الكواليس»، عندما يُستخدم الذكاء الاصطناعي في اتخاذ قرارات تؤثر في حياة الناس.

ومن الواضح أن النماذج الأحدث التي جربتها ميشيل يين، كانت أكثر تفاؤلاً بشأن عدد المهام التي يمكن أتمتتها.

فهل يعود ذلك إلى أن هذه النماذج الأحدث، تتمتع بالفعل بقدرات أكبر في نطاق أوسع من المهام؟ وبالتالي - من باب التساؤل - هل تُعدّ تقديراتها الأعلى لمدى التعرض للذكاء الاصطناعي معلومات مفيدة حقاً؟.

ويتفق جون بيرن ميردوخ على أن النماذج الأحدث أكثر تفاؤلاً بقدرات الذكاء الاصطناعي.

وفي المتوسط، قيّم نموذج «شات جي بي تي-5»، المهام والوظائف بأنها أكثر عرضةً للذكاء الاصطناعي بمرتين تقريباً، مقارنةً بسابقه في الدراسة الأصلية، وكان «كلود4.5» - وهو أحدث النماذج المختبرة، الأكثر تفاؤلاً على الإطلاق.

وتعزو يين جزءاً من ذلك إلى أن النماذج الأحدث «تعرف» قدراتها الموسعة، وأن لديها معلومات حول قدرات الذكاء الاصطناعي الناشئة، التي لم تكن موجودة في بيانات تدريب «شات جي بي تي -4». وهناك ملاحظتان في هذا السياق:

أولاً: النموذج الذي تتطابق تقييمات مهامه مع الاستخدام الفعلي للذكاء الاصطناعي هو الأقدم -«شات جي بي تي-4»، وقد يعود ذلك إلى أن تقييمات النماذج بطبيعتها استشرافية، وربما عند النظر إلى الماضي، ستكون الدرجات التي قدمتها نماذج عام 2026 أكثر ملاءمةً لاستخدام عام 2028.

ثانياً: وهو الأهم، أن بعض ذلك يبدو مرتبطاً باختلافات أوسع في تفسير مسألة ما يمكن للذكاء الاصطناعي القيام به.

إن «كلود» واثقٌ جداً من قدرة أدوات الذكاء الاصطناعي على إدارة ومراقبة العمال البشريين في نطاق واسع من الوظائف، حيث يصنف وظائف من الرؤساء التنفيذيين إلى مشرفي المصانع على أنها عالية التعرض.

لكن عندما يصنف نظام «جيميني» الوظائف نفسها على أنها منخفضة التعرّض، فمن الواضح أنهم «يفكرون» في المسألة نفسها بطرق مختلفة تماماً.