
رقمنة
في الوقت الذي يغزو فيه الذكاء الاصطناعي مفاصل الحياة الرقمية، تواجه اللغة العربية تحديا وجوديا يتمثل في ضعف حضورها الرقمي، الذي لا يتجاوز 3 % من المحتوى العالمي.
ويؤكد خبراء في الشأن التقني أنه مع اعتماد المحركات الذكية مثل “ChatGPT” و”جيمناي” وغيرها من تطبيقات ومنصات الذكاء الاصطناعي على البيانات المتاحة لتدريب خوارزمياتها، بات تعزيز المحتوى العربي ضرورة لا تحتمل التأجيل .
وأوضح الخبراء أن الذكاء الاصطناعي يتغذى على البيانات، ونقص المحتوى العربي عالي الجودة يؤدي إلى مخرجات ركيكة أو مشبعة بالتحيزات الغربية، داعين إلى بذل جهود مشتركة من الجميع: حكومات ومؤسسات تعليمية ومستخدمين وصناع محتوى لتعزيز المحتوى العربي على الإنترنت بشكل عام وعبر منصات الذكاء الاصطناعي ودعم الثقافة العربية عبر هذه المنصات الرقمية.
وأشاروا إلى أهمية دعم والاستثمار في صناعة المحتوى العربي على الإنترنت وعبر منصات الذكاء الاصطناعي ودعم الشباب الأردني في هذا المضمار، وخصوصا أن الأردنيين اليوم يساهمون بصناعة أكثر من 70 % من المحتوى العربي الرقمي وفقا لتقديرات غير رسمية في بلد يُقدَّر فيه عدد مستخدمي الإنترنت بنحو 11 مليون مستخدم.
الخبير في مضمار الأعمال الإلكترونية الأستاذ الدكتور أحمد غندور يعرف المحتوى العربي الرقمي بأنه كل معرفة أو خدمة أو تفاعل يُنتَج ويُتداول باللغة العربية عبر الفضاء الرقمي.
فهو النص والصوت والصورة والبيانات والتطبيقات والنظم الذكية، وهو المقال والخبر والفيديو والدورة التعليمية والخدمة الحكومية وقاعدة البيانات والنموذج اللغوي.
ويرى غندور أن المحتوى العربي الرقمي لا يعني الترجمة ولا الترفيه وحدهما، بل يعني أن تكون العربية لغة إنتاج ومعرفة وقيمة في العصر الرقمي.
ويرى غندور أن المشكلة أن هذا المحتوى ضعيف قياسا بعدد المتحدثين بالعربية وحضورهم الرقمي. النسبة محدودة والجودة غير مستقرة. الغالب استهلاك لا إنتاج. نقل لا ابتكار. رأي بلا بيانات. تعليم بلا معايير.
وقال غندور: “إن هذا الضعف ليس لغويا، هو ضعف منظومة: لا سياسات واضحة، لا حوافز إنتاج، لا تمويل مستدام، لا ربط بسوق العمل ولا بالاقتصاد الرقمي. فالأكاديمي يكتب بغير العربية لأن الترقية تكافئ ذلك، والإعلام يطارد السرعة لا العمق، وصانع المحتوى يعمل بلا حماية ولا دخل مستقر. المنصات تكافئ لغات بعينها. النتيجة بيئة طاردة للإنتاج العربي الجاد”.
وأضاف: “يُعد المحتوى العربي ضعيفا لأنه خارج الاقتصاد الرقمي. لا يُعامل كأصل معرفي، لا يُقاس أثره، لا تُحمى ملكيته، لا تُدار بياناته. لذلك يبقى مشتتا فرديا وقصير العمر. ما لم يدخل في منظومة قيمة فلن يستدام”.
وأكد غندور أن الذكاء الاصطناعي يغيّر المعادلة إذا استُخدم كأداة إنتاج لا كترجمة آلية، وتدريب النماذج على العربية الفصيحة واللهجات، وبناء مجموعات بيانات عربية نظيفة، ودعم نماذج لغوية عربية مفتوحة أو وطنية، وربط الذكاء الاصطناعي بالتعليم والإعلام والخدمات، مبينا أن المضي بالعمل على ما سبق فذلك سيسهم في خلق محتوى عربي رصين وذي جودة.”
ولفت إلى أن المسؤولية مشتركة وواضحة في هذا المجال، فالدولة تضع الإطار والسياسات وتفتح البيانات وتدعم البنية وتحمي الملكية الرقمية، والجامعات تنتج معرفة عربية قابلة لإعادة الاستخدام وتُدخل النشر العربي ضمن التقييم، والإعلام يحول المعرفة إلى مادة مفهومة قابلة للتداول دون تسطيح، والقطاع الخاص يمول ويطوّر منصات وأدوات ويخلق نماذج ربح، والفرد ينتقل من الاستهلاك إلى الإنتاج.
وأضاف قائلا: “ هل هو تحدٍ؟ نعم، لكنه تحدٍ مؤسسي لا لغوي، والآليات معروفة إذا وُجد القرار: سياسات نشر عربية، تمويل تنافسي قائم على الجودة والأثر، منصات بيانات عربية، تشريعات ملكية رقمية، إدماج الذكاء الاصطناعي في الإنتاج لا الاستهلاك”.
ويرى ممثل قطاع الاتصالات وتكنولوجيا المعلومات في غرفة تجارة الأردن المهندس هيثم الرواجبة أن المحتوى العربي على الإنترنت أغلبه استهلاكي (آراء، ترفيه، نقل أخبار)، كما أن هناك ضعفا في المحتوى العربي العلمي، والتقني، والمعرفي الموثوق، يرافق ذلك عوامل تسهم في ضعف هذا المحتوى منها الاعتماد على الترجمة أكثر من الإنتاج، إلى جانب كون اللغة العربية معقدة تقنيا وأدواتها الرقمية ضعيفة، مع عدم وجود عائد مادي واضح يشجع الإنتاج الجاد، فضلا عن قلة إنتاج المحتوى الرقمي المفتوح من قبل الجامعات والمؤسسات.
وعن آليات ومقترحات لتعزيز المحتوى العربي الرقمي، قال الرواجبة إن هناك العديد من الطرق منها تشجيع إنتاج المعرفة لا إعادة نشرها، مع التركيز وبذل جهود في دعم المحتوى العلمي، والتقني، والتعليمي.
واقترح الرواجبة أيضا إنشاء منصات عربية للمحتوى المتخصص، وربط المحتوى بالعائد الاقتصادي، وتحسين جودة الكتابة، والتوثيق، والمصادر، لافتا إلى أن كل هذا الجهد المتكامل سيعزز من المحتوى العربي الرقمي مع ضرورة الانتباه اليوم إلى توجيه جزء كبير من هذا الجهد لأنظمة وتطبيقات الذكاء الاصطناعي التي تتعلم اليوم من البيانات وما نزوده لها.
وبخصوص الذكاء الاصطناعي، قال الرواجبة إنه من المهم تطويعه لتعزيز المحتوى العربي الرقمي؛ لأن الذكاء الاصطناعي يتعلم من البيانات، ويقرر ما يظهر وما يختفي، مشيرا إلى أنه إذا ما خلت بياناته من اللغة العربية، فإن اللغة العربية ستكون هامشية في تطبيقاته وأنظمته، وستكون لغة هامشية؛ حيث إن معظم أنظمة الذكاء الاصطناعي تفكر بلغة أجنبية وتترجم للعربية.
وقال الرواجبة: “علينا اليوم أن نركز في إنتاج محتوى عربي عبر أنظمة الذكاء الاصطناعي يكون محتوى منظما، موثوقا، قابلا للمعالجة الآلية، كما علينا العمل على بناء قواعد بيانات عربية مفتوحة، وتطوير نماذج ذكاء اصطناعي تفهم الفصحى، واللهجات، والسياق الثقافي، فضلا عن أهمية توحيد المصطلحات التقنية والعلمية مع إشراك الجامعات ومراكز البحث”.
وأكد الرواجبة أهمية إدخال التراث العربي في بيانات التدريب (لا تقتصر على الأرشفة)، وشرح النصوص التراثية بلغة معاصرة، وربط القيم (الأخلاق، التعايش، والاعتدال) داخل البيانات نفسها، مع تقديم السياق الثقافي والديني بدون تطرف أو تشويه، وإنتاج محتوى أصيل نابع من المجتمع العربي، وليس مترجما.
واستعرض الخبير في مجال التقنية والاتصالات وصفي الصفدي الأرقام الخاصة بالمحتوى العربي الرقمي واستخدام الإنترنت، وقال إنه بينما يتحدث أكثر من 450 مليون إنسان اللغة العربية حول العالم، لا يزال حضور هذه اللغة العريقة على شبكة الإنترنت يثير تساؤلات حادة حول “العدالة الرقمية”.
ففي الوقت الذي تقود فيه الأردن المنطقة كمركز إقليمي للابتكار، يواجه المحتوى العربي تحدي الانتقال من “الكم الاستهلاكي” إلى “الكيف المعرفي”.
وبين الصفدي أن أحدث البيانات التقنية لعام 2026 تشير إلى أن اللغة العربية تحتل المرتبة الخامسة عالميا من حيث عدد المتحدثين، إلا أن حصتها من المحتوى العالمي ما تزال تتأرجح بين 3.5 % و4.8 %.
هذه الفجوة تعني أن المستخدم العربي يضطر في كثير من الأحيان للاعتماد على مصادر أجنبية للحصول على معلومات دقيقة في العلوم والتكنولوجيا والطب، مما يخلق تبعية معرفية رقمية.
وأوضح الصفدي أن الذكاء الاصطناعي لاعب أساسي في إنتاج المحتوى العربي، لافتا إلى أن التحدي يكمن في محورين: أولهما الهوية الثقافية (النماذج العالمية قد تنتج محتوى عربيا بلغة صحيحة ولكن بروح غريبة عن قيمنا)، وثانيهما الموثوقية (خطر انتشار “التزييف العميق” للمعلومات التاريخية أو الدينية).
وقال إنه للانتقال بالمحتوى العربي من الهامش إلى المركز، فيجب العمل على تحفيز “الاستثمار في المحتوى” ومعاملة صناعة المحتوى كقطاع اقتصادي حيوي وليس مجرد “ترفيه”، والعمل على إصلاح المنظومة التعليمية عبر دمج “التربية الإعلامية والرقمية” في المناهج منذ الصغر، وتطوير البنية التحتية للـ NLP: دعم الأبحاث التقنية التي تسهل فهم الذكاء الاصطناعي للهجات العربية المختلفة.
ومن جانبه، قال الخبير في مجال الذكاء الاصطناعي والتحول الرقمي، المهندس هاني البطش، إن تعزيز المحتوى العربي على الإنترنت “لم يعد مسألة ثقافية فقط، بل أصبح قضية سيادية رقمية ترتبط بالهوية، والاقتصاد المعرفي، ومكانة اللغة العربية في عصر الذكاء الاصطناعي”.
وقال البطش: “إن السؤال لم يعد: هل ننتج محتوى عربيا؟ بل: أي محتوى؟ ولمن؟ وبأي منطق تقني؟”.
وأشار البطش إلى أننا اليوم نعيش عصر سيطرة للذكاء الاصطناعي وانتشار متزايد لاستخدام تطبيقاته المختلفة، وهذه التطبيقات تتعلم الآن، وبالتالي فإن من لا يُعلِّم لغته وثقافته اليوم، سيُستبعد غدا.
وحول مقترحاته لتعزيز المحتوى العربي، قال البطش إنه يحتاج إلى الانتقال من الكم إلى القيمة، فالعالم لا يعاني نقصا في النصوص العربية، بل في المحتوى العميق، الموثوق، القابل للاستخدام من قبل الإنسان والآلة.
وأكد أهمية تحويل المعرفة العربية إلى بيانات منظمة، مبينا أن الذكاء الاصطناعي لا يفهم المقالات فقط، بل يفهم البيانات المهيكلة، والمراجع، والسياقات.
وشدد على أهمية دعم المحتوى المتخصص: (علمي، تقني، قانوني، طبي، اقتصادي) لأن هذا النوع هو الذي يغذي نماذج الذكاء الاصطناعي ويحدد جودة مخرجاتها، وتشجيع الإنتاج المتعدد الوسائط: نص، صوت، فيديو، وبيانات مفتوحة، بما يتناسب مع أنماط الاستهلاك الحديثة.
ويرى البطش أن مسألة تعزيز المحتوى العربي هي “مسؤولية تشاركية” لا يمكن اختزالها في جهة واحدة، وهي تشمل الحكومات من خلال سياسات بيانات مفتوحة، ودعم المحتوى العربي الرقمي، وربط اللغة العربية بإستراتيجيات الذكاء الاصطناعي الوطنية، والجامعات ومراكز البحث، من خلال إنتاج محتوى معرفي عربي عالي الجودة، وتحديثه، وربطه بالتقنيات الناشئة، فضلا عن مسؤولية شركات التقنية والمنصات عبر الاستثمار في نماذج لغوية عربية عادلة وغير منحازة، ودعم صناع المحتوى المحليين.
ولفت إلى مسؤولية أيضا ملقاة على عاتق صنّاع المحتوى والخبراء من خلال الانتقال من الرأي السريع إلى المعرفة المؤثرة والمستدامة، ومسؤولية المجتمع من خلال الاستخدام الواعي، والتقييم، والمساءلة.
وأكد البطش أهمية تعزيز محتوى الذكاء الاصطناعي العربي، وذلك من خلال بناء نماذج لغوية عربية أصلية (Native Arabic Models) لا تكتفي بالترجمة، بل تفهم السياق، واللهجات، والبنية الثقافية، ومن خلال إدخال التراث العربي كمصدر بيانات ذكية: الأدب، والفقه، والتاريخ، والفلسفة، والشعر، لكن بعد تنقيته، وتوثيقه، وربطه بالسياق المعاصر.
وأشار البطش إلى مفهوم حوكمة القيم في البيانات، مبينا أن الذكاء الاصطناعي يعكس القيم التي نغذيه بها؛ فإما أن نعكس قيمنا العربية الأصيلة، أو نترك غيرنا يُعرّفنا رقميا، مؤكدا في الوقت ذاته أهمية تطوير معايير أخلاقية عربية للذكاء الاصطناعي: تحترم اللغة، والخصوصية، والتنوع الثقافي، دون الانغلاق عن العالم.
ولخص قائلا: “إن المحتوى العربي في عصر الذكاء الاصطناعي لم يعد مجرد “نشر”، بل بناء ذاكرة رقمية حضارية، إما أن نكون مشاركين في تشكيل عقل الآلة بلغتنا وقيمنا، أو نكون مستهلكين لذكاء لا يشبهنا ولا يفهمنا، هذه ليست معركة لغة، بل معركة هوية ومعرفة ومستقبل”.




