استخدام (gen AI) قد يضيف 35 مليار دولار سنوياً إلى اقتصادات الخليج
أفرز تطور الذكاء الاصطناعي ظهور النماذج اللغوية الكبيرة (LLMs) ضمن ما بات يطلق عليه الذكاء الاصطناعي التوليدي (gen AI)، والتي أصبحت بفضل المقاييس الهندسية غير المسبوقة واتساع بيانات التدريب، قادرة على توليد نصوص تشبه تلك البشرية، وعلى الدردشة وأداء مهام لغوية معقدة تتطلب المعرفة المجردة والاستدلال.
لكن، في موازاة هذه القدرات الفائقة، طُرحت مجموعة من التحديات، مثل التضليل والهلوسة والتحيّز، فضلاً عن تأثير البعد الثقافي واللغوي، فظهر توجه نحو خلق نماذج إقليمية ومحلية، برز منها عربياً مشروع «جيس» (Jais) الإماراتي.
قدّرت شركة «ماكينزي» للأبحاث أن تطبيق الذكاء الاصطناعي التوليدي في 63 حالة استخدام، يمكن أن يحقق قيمة اقتصادية سنوية تتراوح بين 2.6 تريليون دولار و4.4 تريليون دولار على مستوى العالم؛ فيما أشارت إلى أن استخدام الذكاء الاصطناعي التوليدي يمكن أن يضيف ما بين 21 مليار دولار و35 ملياراً سنوياً إلى اقتصادات دول الخليج، إضافة إلى 150 مليار دولار يمكن أن توفرها تقنيات الذكاء الاصطناعي الأخرى.
لوضع ذلك في منظور أوضح، يمكن أن تبلغ مساهمة الذكاء الاصطناعي التوليدي في الناتج المحلي الإجمالي غير النفطي لدول الخليج ما يتراوح بين 1.7% و2.8%.
هذه الإمكانات المحتملة التي يُتوقع أن يطلقها الذكاء الاصطناعي التوليدي عبر مختلف قطاعات الاقتصاد، دفعت إلى زيادة كبيرة في الاستثمارات والشراكات في منطقة الخليج، سواء من قبل الحكومات الحريصة على وضع اقتصاداتها ضمن الصدارة عالمياً في المجال التكنولوجي، أو الشركات الخاصة.
وقد قطعت كل من الإمارات والسعودية بشكل خاص خطوات جديرة بالاهتمام في هذا الصدد، لا سيما أن الإمارات استطاعت أخيراً الحصول على وحدات معالجة الرسومات والشرائح عالية الأداء من شركة «إنفيديا» (Nvidia)، فيما تواصل تطوير نموذجيها للذكاء الاصطناعي التوليدي الرائدين في المنطقة «جيس» و«فالكون».
على عكس معظم برامج الذكاء الاصطناعي التوليدي التي طورتها شركات التكنولوجيا الغربية وتدربت على محتوى الإنترنت، الذي هو في المقام الأول باللغة الإنجليزية، فإن نموذج «جيس» الإماراتي مُدرّب أيضاً وبشكل كبير على المحتوى المنتج بالعربية.
ففي ظل هيمنة المحتوى الإنجليزي على الفضاء الرقمي، ظهرت إلى العلن جهود عدة لإنشاء نماذج لغوية كبيرة «إقليمية»، لديها قدرة أكبر على فهم السياق والقيم المتعلقة بالثقافات واللغات واللهجات المتنوعة، كما هو الحال في إسبانيا والهند ومناطق أخرى ذات خصوصية لغوية وثقافية.
في المنطقة العربية، التي يقترب عدد سكانها من نصف مليار نسمة، والتي لم يتم تمثيلها بشكل كافٍ في نماذج الذكاء الاصطناعي التوليدي التي جرى تطويرها حتى الآن، ظهرت الحاجة إلى سد الفجوة وتلبية احتياجات الاقتصاد الرقمي سريع النمو، ما يتطلب تدريب النماذج على اللغة العربية، حتى يتمكن الناس ليس فقط من التواصل مع الآلات بلغتهم الأصلية، بل لتتمكن الآلات أيضاً من فهم سياق طلبات المستخدم بشكل أفضل وتوليد مخرجات ذات جودة أعلى.
يقول عامر مشتاق، مدير البرامج الإقليمية وهندسة الحلول في شركة «سنوفليك» (Snowflake): «هناك العديد من النماذج الأساسية للذكاء التوليدي يتم إنشاؤها من قبل شركات تكنولوجيا مختلفة، (تشات جي بي تي) هو أحد الأمثلة فيما (لاما) مثال آخر، حيث يتطلب إنشاء نموذج قدراً هائلاً من الموارد، وهي عملية بحث وتطوير طويلة للغاية».
يضيف مشتاق في حديث لـ«إرم بزنس»: «هذه النماذج الأساسية جيدة في أداء مهام معينة، لكنها ربما لا تجيد التعامل مع أنواع مختلفة من اللغات، أو لا تتمتع بفهم أفضل لمجموعات البيانات الإقليمية المتاحة». ويقول: «الآن بدأنا نشهد توجهات محلية أو إقليمية عبر إنشاء جهات مختلفة لنماذجها الخاصة، (جيس) مثال على ذلك، وهناك نماذج يجري إنشاؤها في السعودية أيضاً بالاستناد إلى البيانات المحلية».
في أغسطس 2023، أطلق مركز «إنسبشن» (Inception)، وهو مركز الذكاء الاصطناعي التابع لمجموعة «جي 42» (G42) الإماراتية، الإصدار مفتوح المصدر من نموذج «جيس» للغة العربية -والذي حمل هذا الاسم تيمناً بأعلى قمة جبلية في دولة الإمارات- وذلك بالتعاون مع «جامعة محمد بن زايد للذكاء الاصطناعي»، أول جامعة للدراسات العليا متخصّصة في بحوث الذكاء الاصطناعي على مستوى العالم، وشركة «سيريبراس» (Cerebras).
ويعد «جيس» نموذج اللغة العربية الأعلى جودة على مستوى العالم، إذ يستند إلى 13 مليار مؤشر، وتم تدريبه على مجموعة بيانات جرى تطويرها حديثاً تضم 395 مليار رمز باللغتين العربية والإنجليزية.
وضمن سعيها لتوسيع الوصول إلى تقنيات الذكاء الاصطناعي، أطلقت أبوظبي قبل أيام من خلال معهد الابتكار التكنولوجي التابع لمجلس أبحاث التكنولوجيا المتطوِّرة، نموذج «فالكون 3»، الإصدار الأحدث ضمن سلسلة النماذج اللغوية الكبيرة مفتوحة المصدر، والذي يعد أحد أفضل النماذج عالمياً محققاً المركز الأول على قائمة منصة (Hugging Face) العالمية.
«مثل هذا التوجه يؤدي إلى تمكين الشركات العاملة محلياً وإقليمياً.. باتوا الآن قادرين على الاستفادة من هذه النماذج التي أصبحت أكثر دقة لأنها مدربة على مجموعة بيانات محددة وليست عامة، وتتحدث بلغتهم»، بحسب ما أشار إليه مدير البرامج الإقليمية وهندسة الحلول في شركة «سنوفليك».
وأضاف: «نموذج (جيس) يجري استخدامه لأنواع مختلفة من المهام. وفي (سنوفليك) نتيح هذا النموذج كجزء من عرض (Cortex) الخاص بنا، والذي نقدّم عبره عدداً من النماذج الأساسية التي تعد رائدة في المجال».
لفت مشتاق إلى أن المستخدمين يشعرون براحة أكبر عند التواصل مع التكنولوجيا بلغتهم الأم؛ ما يفتح المجال أمام جميع الناطقين باللغة العربية، بدلاً من اللجوء إلى «تشات جي بي تي» للحصول على معلومات تستند إلى اللغة الإنجليزية، أو إلى أي لغة أخرى.
وأكد على أن «نموذج (جيس) مبني على بيانات محلية وإقليمية، ويدعم اللغة العربية بشكل أصيل، ويخلق عدداً من الفرص لأي شخص. فعلى سبيل المثال، إن أردت أن تتعلم اللغة العربية، يمكنك استخدام نموذج (جيس) والتفاعل معه وممارسة مهاراتك. كما يمكنك طلب تلخيص مستندات باللغة العربية واقتراح تسلسل الأحداث التي تجري في المنطقة.. لذا، فإن الاحتمالات لا حصر لها».
بالتالي، بحسب المسؤول في «سنوفليك»، فإن النماذج الإقليمية مثل «جيس» تسد الفجوات في النماذج الأساسية للذكاء الاصطناعي التوليدي التي ستظل موجودة «لكنها ليست بارعة في كل شيء».
ويرى أن «جيس» والنماذج الإقليمية ستكون لها مكانة مستقبلاً، حيث ستقوم بسد الفجوة من حيث جودة الإنتاج، ومن حيث تقليل الهلوسة التي تحدث مع النماذج اللغوية الكبيرة، لإعطاء نتائج أكثر دقة للمستخدمين.
كما أشار إلى أن «البيانات موجودة في كل مكان حولنا، وفي كل ما نقوم به، حتى على وسائل التواصل الاجتماعي. فمع كل نقرة تقوم بها وكل عملية شراء، هناك بيانات تُخلق».
وأضاف أنه على المستوى الحكومي «نشهد مبادرات للبيانات المفتوحة داخل دول مجلس التعاون الخليجي، خصوصاً في الإمارات والسعودية، إذ يتم تشجيع المنظمات على نشر البيانات لصالح المجتمع، وبالتالي هناك الكثير من البيانات المتاحة».
لكن، على الرغم من توافر البيانات الضرورية لتدريب النماذج اللغوية الكبيرة، إلا أن حضور اللغة العربية رقمياً لا يزال باهتاً، بالمقارنة مع اللغات الرئيسة الأخرى. فبينما تحظى اللغة العربية بأهمية عالمية؛ نظراً لكونها سادس أكبر لغة لجهة عدد الناطقين وفق أحدث بيانات «ستاتيستا» (Statista) و«إثنولوغ» (Ethnologue)، لا يمثل المحتوى العربي على الإنترنت سوى أقل من 1% مقابل نحو 50% للغة الإنجليزية المهيمنة وفق الأرقام المحدثة على (W3Techs) المتخصص في بيانات الإنترنت.
غير أنه مع وجود مبادرات عربية عدة لتعزيز حضور اللغة العربية على شبكة الإنترنت، وزيادة القدرة على الوصول إلى التكنولوجيا في المنطقة، قد تحظى اللغة العربية بحصة أكبر من الإنترنت العالمي؛ ما يوسع من آفاق أدوات الذكاء الاصطناعي التوليدي المحلية.
من بين المبادرات التي تعمل على الاستفادة من المحتوى العربي والمساهمة في تعزيزه بالاستعانة بالذكاء الاصطناعي، مشروع «لسان إي آي» (Lisan AI)، الذي تقوم فكرته على تدقيق النصوص اللغوية.
انطلق المشروع من دبي قبل أربع سنوات -أي قبل ظهور أغلب أدوات الذكاء الاصطناعي الشهيرة- خُصّصت ثلاث سنوات منها لتطوير البنية التحتية للغة العربية في ظل قلة حلول الذكاء الاصطناعي العربية مقارنة بتلك الإنجليزية، بحسب ما أوضحته سارة القصير، مسؤولة تطوير الأعمال والشراكات في مؤسسة «لسان» للذكاء الاصطناعي التي لها تواجد أيضاً في كل من السعودية وقطر ومصر.
قالت القصير: «قمنا بسحب المحتوى العربي على الإنترنت كاملاً، أي ما يعادل 27 مليار رمز، إلى جانب محتوى عدة معاجم للغة العربية، حيث نعتمد عليها في استخدام المصطلحات وكتابة المحتوى».
وتابعت: «طوّرنا عدداً من النماذج اللغوية المتخصصة في مجال التدقيق اللغوي، ووضعنا 12 صنفاً من الأخطاء المختلفة في اللغة العربية مثل الإملاء، والدلالة، والصرف، والأسلوب، والتنسيق وحتى أسماء الأعلام والاقتباسات من القرآن الكريم».
وأضافت: «ما يميز المنصة هو القدرة على تمييز المعاني والدلالات الثقافية واستخدام المصطلحات والخطابات المحددة لكل دولة».
تستهدف «لسان إي آي» العمل مع جهات وقطاعات عدة بحاجة إلى تطوير المحتوى العربي، من ضمنها المؤسسات التعليمية ووسائل الإعلام، إلى جانب التعاون مع الجهات الحكومية. وقد دخلت المنصة في شراكات مع مؤسسة «أبوظبي للإعلام»، والمجلس الوطني الاتحادي في الإمارات، و(layout international)، فضلاً عن جهات حكومية في السعودية مثل هيئة الحكومة الرقمية وشركة الكهرباء وغيرها، بحسب ما أوضحته القصير.