المحتوى الرقمي العربي

المحتوى الرقمي العربي

تزداد أهمية وجود اللغة العربية على الشبكات الحاسوبية مع توجه المجتمع نحو مجتمع المعلومات, ونحو الاقتصاد المبني على المعرفة. ويصطلح عالمياً على هذا الوجود بكلمة المحتوى, فكيف يمكن أن نزيده?

يعبر المحتوى عن وجود المعرفة بشكل رقمي (digital) على الحواسيب وعلى الشبكات الداخلية (intranet) والعالمية (extranet) والإنترنت (internet). ويغطي المحتوى مجالات شتى مثل النشر, والأعمال, والمكتبات, والإدارة الحكومية (e-gov), والعلم والتكنولوجيا, والصحة والثقافة, والتراث, والسياحة والتسلية, ومعلومات عن المنظمات غير الحكومية والإقليمية وغير ذلك من المجالات. ويتطور المحتوى عالمياً لكل لغة من اللغات الأساسية في العالم وخاصة المحتوى الموضوع على الإنترنت (online content). وسنعرض في هذا البحث وضع محتوى هذه اللغات. تصنف المعلومات الموجودة كمحتوى للغة من اللغات في أصناف مثل معرفة ماذا, ومعرفة كيف, ومعرفة من, ومعرفة لماذا. من جهة أخرى يمر المحتوى بمراحل محددة في عملية إيجاده وهي مراحل توليده, ثم تحويله إلى الشكل الرقمي, وحيازته وخزنه ضمن الحواسيب (acquisition), ثم معالجته (processing), وبعدهما عرضه أو طباعته (display), وأخيراً نشره واستعماله أو استخدامه في عملية التنمية الاقتصادية والاجتماعية. ولنمو المحتوى الرقمي العربي فوائد وعائدات على المجتمع والاقتصاد العربي, كما يؤثر في الثقافة العربية واللغة العربية والتقارب العربي.

هناك مؤشرات لقياس المحتوى في لغة من اللغات, وهذه المؤشرات تتبلور عالمياً بغية تقويم التوجه نحو مجتمع المعلومات لأمة من الأمم, وبغية مقارنة التقدم النسبي لمختلف الأمم في هذا المجال. من هذه المؤشرات عدد الصفحات باللغة العربية على الإنترنت (pages), وعدد المواقع باللغة العربية (sites), ومدى استعمال هذه المواقع والمعلومات (hits), وكذلك تقييس استعمال هذه اللغة (standards). وكذلك وجود محركات بحث (search engines) وأدلة (directories) باللغة العربية, ومن المؤشرات أيضاً عائدات الدعاية باللغة العربية في المواقع العربية.

ستتعرض الدراسة أيضاً إلى آليات زيادة المحتوى الرقمي العربي سواءً كانت offline content أو online content. وهذه الآليات تقسم إلى قسمين: تقنية وغير تقنية, ونذكر منها نظم تعرف الحروف العربية (OCR) أو الترجمة الآلية من الإنجليزية إلى العربية وبالعكس, وبرمجيات النشر على الشبكة باللغة العربية (web publishing), وإصدار التشريعات المحفزة لزيادة المحتوى الرقمي العربي, والحاضنات لشركات المعرفة العربية incubators, وتعليم المعلوميات والاتصالات بالعربية وخاصة في برمجيات الشبكات (web ware), والبحث والتطوير في مجالات معالجة اللغات الطبيعية ((Natural (Language Processing) [NLP], وتطوير الأدوات البرمجية لتسهيل التعامل مع اللغة العربية في كل مراحل إيجاد المحتوى من التوليد حتى الاستعمال مروراً بالحيازة والمعالجة والعرض والنشر.

مجتمع المعلومات

لقد أدخلت التطورات المتسارعة في تكنولوجيا المعلومات والاتصالات تغيرات مهمة في عملية التنمية الاقتصادية والاجتماعية, فكانت عاملاً أساسياً في نمو الاقتصاد نحو ما يسمى بالاقتصاد المبني على المعرفة أو الاقتصاد الجديد, وعاملاً أساسياً في توجه المجتمع نحو ما يسمى بمجتمع المعلومات. إن المعرفة أخذت تلعب دوراً أكبر في حياتنا اليوم, وأصبحت تتجسد بشكل رقمي في الحواسيب ضمن قواعد المعطيات وقواعد المعرفة (database knowledge) وعلى الشبكات وأهمها شبكة الإنترنت. إن وعاء المعرفة هو اللغة, وبالتالي فإن المعلومات تجسدت بشكل رقمي وفق لغات العالم المختلفة. إن مجمل ما يوجد من معلومات في لغة ما بشكل رقمي مخزون في الحواسيب (offline) أو موضوع على الشبكات الحاسوبية (online) أو على الأقراص والأشرطة المغناطيسية هو ما نصطلح عليه بالمحتوى. فمحتوى اللغة العربية الموجود على الإنترنت يمثل كل المعلومات المتوافرة على الإنترنت بشكل رقمي وفي شتى مجالات المعرفة والحياة. يزداد المحتوى بكل اللغات بتسارع هائل سنوياً وبمعدلات أسية, . تنبع أهمية المحتوى في لغةٍ ما من فوائدها وعائداتها على مجتمع تلك اللغة. فهناك فوائد إدارية وخدماتية من المحتوى المتعلق بالحكومة الإلكترونية, وفوائد اقتصادية من المحتوى المتعلق بالتجارة الإلكترونية وخاصة فوائد التجارة الداخلية على مستوى كل دولة والتجارة البينية بين الدول العربية في حالة اللغة العربية على سبيل المثال, وهناك فوائد تتعلق بتكوين الأطر البشرية في حالة المحتوى التعليمي والتدريبي أو ما يسمى e-learning, وهناك فوائد علمية وتكنولوجية من وجود المحتوى العلمي والتكنولوجي, وفوائد ثقافية من وجود المحتوى الثقافي والتراثي وهكذا.

تزداد أهمية المحتوى وعائداته مع ازدياد المستخدمين للإنترنت وللحاسوب, وتقاس هذه الفائدة بعدد هؤلاء المستخدمين المتكلمين للغة المحتوى المعني, فكلما ازداد عدد متكلمي لغة المحتوى المدروس ازدادت عائدات ذلك المحتوى, ويعرف هذا المبدأ لدى الاقتصاديين بمبدأ (عائدات التشبيك) (networkAeffects) أو (network externalities).

لقد وصل عدد مستعملي الإنترنت في يوليو 2002 إلى 560 مليون مستخدم في العالم تصل نسبة متكلمي غير اللغة الإنجليزية فيهم إلى 59.8% أي أن نسبة المستعملين ممن تعتبر الإنجليزية لغة الأم لهم هي 40.2% وهذا يدل على تزايد وأهمية إيجاد المحتوى بغير اللغة الإنجليزية. إن إيجاد المحتوى باللغات الوطنية يعدُّ من العوامل المقللة لما يسمى بظاهرة الهوة الرقمية (digital divide).

ويزداد المحتوى على الإنترنت بمعدلات أسية وأحد مؤشرات قياس المحتوى هو عدد الصفحات على الإنترنت (web page). لقد وصل عدد الصفحات في يوليو 2002 إلى حوالي 313 بليون صفحة في كل اللغات. تتصدر اللغة الإنجليزية اللغات الأخرى حيث تشكل ما نسبته 68.4% من الصفحات, تليها اللغة اليابانية فالألمانية فالصينية. وليست اللغة العربية بين اللغات العشر ذات المحتوى الأعلى على الإنترنت, بالرغم من أنها تأتي عالمياً ضمن اللغات الست الأولى من حيث عدد متكلميها, كما أنها إحدى لغات الأمم المتحدة الرسمية الستة.

تبين العديد من الإحصائيات أن أكثر الذين لهم مواقع على الانترنت يضعون مايزيد عن 57% من صفحاتهم بلغاتهم الأم.

المحتوى العربي.. أين?

ينتشر المحتوى الرقمي العربي على الإنترنت كانتشار أي لغة أخرى على مختلف مجالات الاقتصاد والاجتماع والثقافة وغيرها. وندرج أدناه أمثلة حول بعض هذه المجالات, التي يؤمل أن يزداد المحتوى الرقمي العربي فيها:

  • الأعمال: مواقع الشركات, دليل الشركات, دليل المصدرين, دليل المصانع, البنوك,
  • النشر: الجرائد, المجلات, الدوريات العلمية, الإذاعات, التلفزيونات.....
  • الحكومة الإلكترونية: البوابة الحكومية, مواقع الوزارات والمؤسسات العامة,
  • العلم والتكنولوجيا: الجامعات, مراكز البحوث, الجامعات الافتراضية, ....
  • المكتبات: نص, صوت, صور, فلم, الكتاب الإلكتروني, ....
  • الصحة: العيادات, المستشفيات, الطبابة عن بعد, ...
  • المنظمات: غير الحكومية, الإقليمية, الدولية, ...
  • الثقافة: المتاحف, بوابات الثقافة والفكر والموسيقى والأدب, والرسم و...
  • التراث: التراث العربي, التراث الإسلامي, (adabwafan) و (Alwaraq)...
  • السياحة: المواقع السياحية التاريخية والطبيعية, والفنادق, والمطاعم, والنقل, ...
  • التسلية: ألعاب أطفال, أفلام, ...

إن تنشيط زيادة المحتوى في كل من هذه المجالات يحتاج إلى مبادراتٍ من قبل الحكومات العربية, تستهدف كل مبادرة منها زيادة المحتوى في مجال من المجالات. وهذه المبادرات يجب أن تشتمل على النواحي القانونية والمؤسساتية والبشرية والمالية والدعائية والتنظيمية والإدارية.

أنواع المحتوى

إن المحتوى الذي يغطي المجالات المذكورة أعلاه يمكن أن يصنف في أربعة أنواعٍ عامة هي: معرفة ماذا, معرفة لماذا, معرفة كيف, معرفة مَن, تعكس المعرفة مدى السيطرة على الأشكال المختلفة للمعلومات ويمكن تسمية تصنيف المعرفة هذا في أربع تسميات هي أ- معرفة المعلومة ب- معرفة العلة ج - معرفة الكيفية د- معرفة أهل الاختصاص

وتعمل تكنولوجيا المعلومات الآن على ترميز هذه الأنواع من المعرفة وبالتالي تحويلها إلى سلع تؤثر(بشكل أكثر مباشرة مما مضى) في الاقتصاد والمال والمنعة الوطنية.

لكن توفير المعرفة وتحويلها إلى معلومات جعل من تكنولوجيا المعلومات IT أداة هائلة في وضع المعرفة في متناول العالم, وخاصة أن شبكات المعلومات مثل الإنترنت وغيرها تجعل المسافات قصيرة والزمن مختصرًا والتكلفة بسيطة والتداول سهلاً. إن هذا الترميز للمعرفة وتخزينها رقمياً انطلاقاً من توفرها كمعلومات على شكل كتب ومجلات وأوراق عمل ومراجع وفهارس وصور وصوت وأفلام ورسومات, إضافة لتسهيل نقلها عبر الشبكات الرقمية العالمية يجعلها أداة للتنمية الاقتصادية والثقافية والأمنية ذات دور فعال للغاية, وهذا ما يقربنا من ( مجتمع المعلومات) الذي يولد وينقل ويستعمل المعرفة لخدمته في كل المجالات.

إن توفير المعرفة وتحويلها إلى معلومات رقمية يجعلها تتحول إلى سلعة تزداد أنواعها يوماً فيوما ويزداد دورها في الاقتصاد العالمي الذي يتجه نحو (اقتصاد المعرفة).

هناك مراحل محددة للتداول مع المحتوى الرقمي العربي بدءاً من توليده وانتهاءً باستعماله أو استثماره, وكل مرحلة من هذه المراحل تحتاج إلى جهود وأدوات ومشاريع خاصة بها. وسنذكر باختصار هذه المراحل فيما يلي:

(1) مرحلة توليد المحتوى الجديد: وهي مرحلة إبداعية تعكس نشاط الأمة وإنتاجها الفكري والثقافي والعلمي والتكنولوجي. يولد المحتوى الجديد في لغة من اللغات من نشاطات الأمة في البحث والدراسة والتطوير. وتعتمد عملية توليد المحتوى العربي على عوامل عدة منها تمويل البحث العلمي, وحرية الفكر والتعبير عنه, ووجود الطلب على الإبداع والتجديد. إن التعبير أصبح في عصرنا الحالي يجري بشكل رقمي يخزن في الحاسوب مباشرةً, فالكتب والدراسات والبحوث والثقافة والأدب تكتب حالياً مباشرة بشكل رقمي قابلٍ للنشر الرقمي ولوضعه على الإنترنت مباشرة. وهذا ما بدأت تمارسه الكثير من دور النشر العربي حالياً.

(2) مرحلة تحويل المحتوى الموجود أو القديم إلى الشكل الرقمي go digital):) وهي مرحلة تتطلب إدخال معارف الأمة السابقة من كتب ووثائق وفن ومعلومات وغير ذلك إلى الشكل الرقمي, وخزنها في الحاسوب أو على وسائط الخزن الرقمية كالقرص الليزري CD Rom, أو القرص المغناطيسي diskette, ويشهد العالم العربي الكثير من المشاريع في هذا المجال مثل: www.Alwaraq.com.

(3) مرحلة تخزين المحتوى وتبويبه ومعالجته: يجري في هذه المرحلة المهمة تبويب المعلومات المخزنة ضمن أشكال تسهل البحث فيها, وتسهل استخلاص المعلومات اللازمة منها. تستعمل في ذلك العديد من الأدوات البرمجية كقواعد المعطيات Databases, وقواعد المعرفة Knowledge base, والنظم الخبيرة expert system, وبرمجيات الفهرسة الآلية (indexing), وبرمجيات معالجات اللغات الطبيعية Natural Language Processing (NLP), مثل: برمجيات البحث search عن الكلمة أو الوثيقة أو المعنى, ومثل: برمجيات فهم النصوص, وبرمجيات تحليل النصوص, وبرمجيات الترجمة الآلية. ويندرج هذا أيضاً على الكلام العربي مثل برمجيات تعرف الكلام speech recognition وبرمجيات فهم الكلام وترجمته, وبرمجيات تركيب الكلام speech synthesis وغيرها.

إن التعامل باللغة العربية مع كل هذه الأدوات هو تعامل كثيف اللغة language intensive, ويعتمد على اللغة وخواصها, والكثير منها لا بد من تطويره من جديد من أجل اللغة العربية خاصة. وللنجاح في هذه المرحلة لا بد للدول العربية من اعتماد مبادرات على مستوى الدولة والقطاع الخاص لدعم البحوث والتطوير فيها, ولتشجيع قيام الشركات الخاصة بها, ولتوفير البيئة المناسبة لنموها. لقد قامت في العالم العربي العديد من النشاطات الخاصة في هذه المرحلة, من أهمها نشاطات شركة صخر ونشاطات شركــة مايكروسوفت, ولكن المطلوب لا يزال هائلاً والجهود المبذولة في العالم العربي لا تزال مشتتة, بالرغم من أهمية هذه النشاطات وعائداتها الاقتصادية الكبيرة الواعدة والتي بدأت تشكل ما يسمى بـ (الصناعات كثيفة اللغة) language intensive industry .

(4) مرحلة عرض المحتوى أو طباعته: وهي مرحلة تتعلق بالتعامل مع الحرف العربي وأشكال طباعته أو إظهاره أو نقله عبر شبكات الحواسيب وعبر الإنترنت, وهي مرحلة تحتاج إلى جهد في تقييس استعمال حروف اللغة العربية (standards) وقد قامت جهود عربية عديدة في هذه المجالات ولا تزال قائمة, ولكنها بطيئة وضعيفة: نشاطات المنظمة العربية للتقييس سابقاً ASMO, والآن AIDMO, و ALECSO.

(5) مرحلة نشر المحتوى العربي: أهم ما في هذه المرحلة هو وضع المحتوى العربي الرقمي لكل المجالات التي أتينا على ذكرها على الإنترنت, وفهرسته (indexing) في محركات البحث على الإنترنت (search engines). النشاط العربي في هذا المجال لا يزال ضعيفاً وخاصة في مجال اللغة العربية ومحركات البحث.

(6) مرحلة استخدام واستعمال المحتوى: يعتمد نجاح هذه المرحلة على جودة المحتوى وعلاقته وفائدته للمستثمر (relevant), كما يعتمد على زيادة معدل النفاذ العربي للإنترنت (access), بما في ذلك نفاذ الصناعيين والتجار والطلاب والمواطنين والمثقفين, أي كل شرائح المجتمع. كما يعتمد نجاح هذه المرحلة على أسعار الحواسيب وأسعار الاشتراك بالإنترنت والهاتف وتوافرها أي على البنية التحتية لتكنولوجيا المعلومات والاتصالات.

ماذا نستفيد?

إن زيادة المحتوى الرقمي العربي سيعود بفوائد كبيرة سواءً من الناحية الاقتصادية أو الاجتماعية أو الثقافية, فهو أولاً سيسمح بالانتقال في النفاذ إلى المعرفة من نخبة صغيرة في المجتمع تتكلم الإنجليزية أو الفرنسية إلى قوى المجتمع العاملة بأسرها, وهو عامل مهم جداً في الاقتصاد الجديد وفي مجتمع المعلومات القادم. والفائدة الثانية ستكون في تنشيط تعليم وتعلم وتدريب المجتمع العربي لاستعمال التقانات الجديدة الفعالة كالإنترنت عبر e-learning وكالكتاب الإلكتروني e-book, والتدريب عن بُعد وغيره. وفائدة ثالثة ستتحقق عبر زيادة التجارة المحلية e-commerce والتجارة البينية العربية. أما الفائدة الرابعة فستتأتى عبر تطبيق الحكومة الإلكترونية e-government التي يتوخى أن تؤدي إلى الإدارة الشفافة والفعالة والحكم الرشيد. والفائدة الخامسة ستتحقق من خلال التشبيك لمختلف النشاطات الاقتصادية والاجتماعية العربية (networking) كتشبيك مراكز البحوث والجامعات والصناعات عبر بوابات عربية تنشأ لهذا الغرض (portals). ولسنا هنا بصدد ذكر كل الفوائد ولكن أتينا على بعضها, وهذه الفوائد لن تتحقق إذا لم ينم الطلب عليها وفق مبادرات وطنية وعربية من الحكومات والقطاع الخاص والمنظمات غير الحكومية والمجتمع المدني (demand pull).

قياس المحتوى الرقمي

لقد بدأت تعتمد عالمياً بعض المؤشرات لقياس ومقارنة المحتوى لمختلف اللغات, وسنذكر بعض هذه المؤشرات بشكل مختصر, علماً بأن تحصيل قيم هذه المؤشرات ومتابعتها يُعدّ عملاً جديداً في العالم العربي ويحتاج إلى جهود ومبادرات من الحكومة والقطاع الخاص ومن المنظمات الإقليمية والدولية حتى يجري اعتمادها وقياسها. من هذه المؤشرات ما يلي:

  • عدد الصفحات باللغة العربية
  • عدد المواقع باللغة العربية وفي الدول العربية Web sites
  • فائدة المحتوى للدول العربية local relevance
  • مدى تغطية المجتمعات النائية communities coverage
  • مدى تقييس استعمال اللغة على الشبكات standards
  • وجود محركات بحث وأدلة باللغة العربية directories and search engines
  • عائدات الدعاية باللغة العربية في المواقع العربية

وقد سبق أن ذكرنا قيم بعض هذه المؤشرات كعدد الصفحات web pages في كل اللغات والذي يساوي 313 بليون صفحة, وعدد الصفحات للغات العشر الأولى على الإنترنت.

إن من المحتوى ما هو على الشبكة online content ومنه ما هو ليس على الشبكة offline content, وزيادة المحتوى أياً كان يحتاج إلى توفير أو دعم آليات ضرورية لتحقيق هذه الزيادة سنعددها فيما يلي:

  • تعرف الحروف العربية OCR Machine Translation الترجمة بمساعدة الحاسوب من الإنجليزية إلى العربية.
  • التحول نحو الرقمية go digital (مبادرات وطنية).
  • النشر على الإنترنت Web publishing (web ware).
  • تقييس استعمالات اللغة العربية في المعلوميات والاتصالات.
  • إصدار تشريعات محفزة لقيام صناعات في المحتوى العربي (Arabic content industries).
  • حاضنات شركات المعرفة العربية (language intensive industries).
  • تعليم المعلوميات والاتصالات (بالعربية) وخاصة web ware.
  • دعم مالي لمشاريع زيادة المحتوى الرقمي العربي (حوافز ضريبية, صناديق...).
  • بحث وتطوير في مجالات NLP, speech, لسانيات حسابية.
  • تطوير الأدوات البرمجية لتسهيل التعامل مع اللغة العربية في كل مراحل تداول المحتوى من التوليد إلى الاستثمار أو الاستخدام.

إن المحتوى الرقمي العربي أصبح ضرورة ملحة مع التوجه نحو الاقتصاد المبني على المعرفة ونحو مجتمع المعلومات, ونوصي بتبني مبادرات على مستوى كل دولة عربية وعلى المستوى القومي, تهدف هذه المبادرات لتحقيق الآليات التي أتينا على ذكرها في هذه الدراسة, وإلى إيجاد الحلول للعقبات التقنية التي تعترض نمو هذا المحتوى.

 

محمد مراياتي

أعلى الصفحة | الصفحة الرئيسية
اعلانات