آلات البحث على الإنترنت: تبحث لك أم عنك?

آلات البحث على الإنترنت: تبحث لك أم عنك?
        

          تحتل الإنترنت مكانة متميزة في قائمة البحث وتداول المنتج المعرفي البشري بعد أن ابتلعت أذرعها جل النشاط الإنساني فأودعته في مواقعها المنتشرة في نسيج الشبكات المعلوماتية الذي يلف الكرة الأرضية من جميع الاتجاهات.

          لقد أورثت كثرة المواقع المنتشرة على الشبكة الماموثية الإنسان المعاصر حيرة هائلة بعد أن بلغ عدد الصفحات الفريدة على شبكة الإنترنت حوالي 1.4 مليار صفحة, بينما بلغ عدد الصفحات المتكررة على مواقعها حوالي 220 مليون صفحة.

          ولم يعد الإنسان قادرا على الإبحار في فضائها المعرفي دون استخدام آلات البحث Search Engines التي تمهد الطريق أمام المستخدم عبر مجموعة هائلة من قواعد البيانات التي تختزنها عن المواقع المتوافرة على الشبكة, وتوظيف أدوات بحث متقدمة يمكن أن تصاغ من خلاله أسس المنطق البولياني الذي يمنح المستخدم فرصة التنقير بين المواقع التي لا يحصرها عدد.

          لقد أودع المستخدمون اصطلاحاتهم التي يفتشون عنها داخل نسيج الشبكة في نظم حواسيبهم المنزلية والمنظماتية دون أن يلتفتوا إلى العملاء الإلكترونيين الأذكياء الذين يلتقطون الكلمات المفتاحية فيودعونها في قواعد بيانات الحواسيب المضيفة ثم تعمد الشركات العملاقة التي تطرح آلات البحث بالمجان لمستخدمي الشبكة ويباشرون عملية تحليل يستقرئون من خلالها أطر البحث لدى المستخدمين أفرادا أو مؤسسات.

          ولكي تنجلي أمامنا ماهية عمل آلات البحث, والموازنة بين قدراتها في عمليات التنقيب عن المعلومات, والإمكانات المتاحة لاستثمار بياناتها في متابعة التطور الحاصل في أنماط البث الموضوعي, وميل النشاط المجتمعي, وتوفير مستلزمات تلبية حاجاته, ثم التفكير بحماية منظومتنا المعلوماتية والفكرية من تسلل الآخر الذي يتربص بكل نقرة ننقرها على لوحة المفاتيح, ويسجل كل حرف وكلمة نبحث عنها. من أجل كل هذه الأمور مجتمعة أجريت هذه الدراسة لكي نفتح بابا جديدا أمام الكوادر المعلوماتية العربية لتدشين نشاط معلوماتي جديد يوفر لنا قدرات استشراف مستقبلنا, وضمان أمنه.

آلات البحث: الخصائص وآلية العمل

          تتألف الشبكة العنكبوتية العالمية من بضع عشرات الملايين من مضيفات الويب WEB Servers وبضعة مليارات من صفحات الويب المترابطة فيما بينها بواسطة نسيج متشابك بهيكلة بالغة التعقيد والتشعب فيما بينها. وتتميز كل صحيفة ويب بعنوان فريد يطلق عليه اصطلاح محدد الموقع النظامي URL الذي يحدد موقعه الدقيق في غابات مواقع الويب اللامتناهية.

          وتكمن الصعوبة الأساسية أمام المستخدم (الذي ينشد موقعا, أو موضوعا بعينه) في صعوبة معرفة العنوان الذي يضم المعلومات التي تخدم أغراضه لكثرة المواقع التي قاربت بضعة مليارات, وعدم توافر معلومات كافية لديه عن هوية صفحات الويب التي تضم ما يريد.

          مرت تقنيات آلة البحث بتطورات هائلة خلال الفترة من 1994 إلى 2000 بعد النمو المتسارع في أعداد مواقع الويب على شبكة الإنترنت. وعند بدايات عام 1994 ظهرت أول آلة البحث World Wide Web Worm والتي ضمت فهارس لحوالي 000ر110 صفحة ويب ووثيقة متاحة على الشبكة. وفي بداية عام 1997 ادعت الجهة التي ابتكرت آلة البحث Web Crawler بأنها قد نجحت في فهرست حوالي مليونين إلى 100 مليون صفحة من وثائق الويب. وفي نهايته ادعت شركة آلة البحث Altavista بأنها بدأت تلبي أكثر من 200 مليون استعلام عن مواقع الويب يوميا.

          إن التزايد المستمر في نمو عدد صفحات الويب, وكثرة طلبات الاستعلام عن مواقعها بواسطة مستخدمي الشبكة الذين يزدادون كثرة يومًا بعد يوم صارت تشكل تحديا للشركات التي تعمل في مضمار آلات البحث. فتزايدت أعدادها, وتنوعت الآليات المستخدمة في إنجاز مهامها التي باتت تزداد تعقيدا باستمرار. يبدو واضحا من جدول (1) حجم الطلب الكبير على آلات البحث المختلفة المطروحة على الإنترنت.

          وتوجد أكثر من آلة بحث تتميز كل منها بخصائص إيجابية في قطاع محدد, وتعاني بضع ثغرات في قطاعات أخرى, بيد أن مركز الصدارة تحتله آلتا البحث Google, Yahoo بسبب ازدياد حجم القاعدتين الجماهيرية والمتخصصة التي تفضل استخدامهما على غيرهما.

          بصورة عامة تبرز أكثر من خاصية تقنية لضمان حسن أداء آلة البحث في توفير الاستعلام الدقيق والسريع الذي يبغي المستخدم الوصول إليه أثناء عملية التنقير عن مواقع الويب. وتشمل هذه الخصائص:

          - القدرة على جمع واستيعاب جميع الوثائق المطروحة حديثا على مواقع الويب مع تحديثها باستمرار.

          - ينبغي أن تكون المساحة المخصصة لخزن المعلومات كافية لاحتواء فهارس مليارات الوثائق, والوثائق ذاتها في كثير من الأحيان.

          - ينبغي أن يكون نظام الفهرسة الآلي قادرا على معالجة سعات ضخمة من البيانات (100صs of Giga Bytes) بسرعة عالية, وكفاءة متميزة.

          - يجب أن تجرى الاستعلامات Queries بسرعة فائقة, وبمعدلات تتراوح بين بضع مئات إلى بضعة ألوف في الثانية الواحدة.

أدوات متابعة نشاط المستخدم

          تتوافر مجموعة من الأدوات المعلوماتية التي توفر لإدارة النظام المعلوماتي إمكان متابعة أنشطة الزبائن العاملين ضمن حدود النظام. وتستثمر بيانات هذه الأدوات في صياغة السياسة المعلوماتية للمنظمة, والوقوف على حاجات المستخدمين في ضوء أنماط الأنشطة التي يمارسونها داخل النظام وخارجه.

          بالإضافة إلى هذه الأدوات توجد أدوات أخرى يمكن أن يوجهها قراصنة المعلومات باتجاه يؤدي إلى اختراق حدود الصلاحيات التي يمنحها النظام للجهات المسئولة عن هذه الأنشطة مما يعرض المعلومات الشخصية التي تستقر في نظم المعلومات المنظماتية, أو الحواسيب الشخصية للنشر والإعلان غير المشروع, والذي قد يحمل آثارا وخيمة على المستخدمين.

          وسنحاول أن نعالج مسألة الأدوات ذات الصلة المباشرة بآلة البحث, وندع الأنواع الأخرى التي تقع في دائرة الأمن المعلوماتي للنظام.

الكعك Cookies :

          إذا كنت تستخدم إحدى أدوات البحث, فينبغي أن ترضى بالكعك المعلوماتي الذي يأتيك منها?. بصورة عامة فإن ملفات الكعك هي عبارة عن ملفات نصية Text Files يتم خزنها بواسطة مضيف الويب Web Server على القرص الصلب للمستخدم. وتحتوي هذه الملفات على قائمة نصوص تضم معلومات خصبة يمكن للمضيف أن يقوم باستثمارها وتعديلها بمراحل لاحقة. تختزن الفئة الأمينة من هذا النوع قائمة تفصيلية عن أهم خيارات المستخدم, واللغة التي يفضلها, ونسق المعلومات المعروضة, ومعلومات الدخول للنظام المعلوماتي, وآثار انتقالات المستخدم على الإنترنت والتي يمكن أن تستثمر كدليل يمكن للمضيف تقديم أفضل الخدمات الممكنة لزبائنه من خلاله. أما الفئات غير الأمينة من الكعك فتقوم (ودون علم المستخدم) بتتبع جميع الانتقالات المعلوماتية التي يمارسها في الفضاء المعلوماتي خطوة فخطوة. فتدون جميع المواقع التي تقوم بزيارتها, والكلمات المفتاحية التي تستخدمها في آلات البحث, والبريد الإلكتروني الوارد والصادر من صندوقك لفترات طويلة مما يوفر للجهة المنافسة فرصة ثمينة لمعرفة ما يدور بذهنك, والتلصص على جميع تحركاتك وأنشطتك العلمية والاقتصادية, والصناعية!

          لقد أصبحت هذه الملفات بالنسبة لآلة البحث Google (على سبيل المثال) ترتبط بوثيقة شخصية للمستخدم يطلق عليها اصطلاح هوية مستخدم جوجول GUID. وتدعي الشركة المذكورة بأن هوية مستخدم جوجول يوفر لها معلومات كافية عن مجاميع المستخدمين التي تستثمر الإمكانات التي توفرها آلة البحث, وطبيعة الحاجات التي قد ينجم عنها تبني آليات جديدة في تصميم الموقع, أو الخدمات المتوافرة عليه.

          ونود الإشارة إلى أن هوية مستخدم جوجول لا صلة مباشرة لها بالمعلومات الشخصية للمستخدم وهويته التقليدية (لا يحتوي على اسمك الثلاثي, أو عنوان عملك, أو رقم هاتفك الشخصي,...الخ.). ولكنها تعد نقطة ارتباط للحاسوب الذي تعمل عليه ( أو النسق المعلوماتي الذي توظفه في عملك) مع آلة البحث وجميع المواقع التي قد قمت أو ستقوم بزيارتها في المستقبل, شريطة أن تحتفظ بملف الكعك نفسه الموجود على حاسوبك الشخصي. وعلى هذا الأساس يتوافر لدى شركة Google إمكان تشكيل نمط اهتماماتك في ضوء المعلومات المختزنة في قواعد بيانات المضيفات لديه وبعمق زمني قد يصل الى بضع سنوات!

          وجدول (2) يظهر قائمة باهتمامات المواطن الأمريكي من خلال تتبع الكلمات المفتاحية السائدة خلال الأسبوع الأول من شهر مايو 2004.

برمجيات المراقبة والتلصص: Spyware

          كثرت خلال السنين الأخيرة البرمجيات المطروحة في سوق البرمجيات العالمية, والتي تتخصص بأنشطة مراقبة الحواسيب الشخصية, وشبكات المعلومات والتلصص على جميع الأنشطة الدائرة فيها. وتعد من أدوات التجسس على آليات البحث Spyware جميع فئات البرمجيات التي تقوم بإدامة مراقبة وتدوين جميع الكلمات المفتاحية ( في الوقت الحقيقي Real-Time) التي يوظفها المستخدم للوصول إلى المواقع والبيانات التي تخدم أغراضه البحثية, أو مهامه الوظيفية المختلفة. تقوم هذه البرمجيات بإيداع ملفات في حاسوبك الشخصي تعمل (في خلفية النظام) على نقل جميع الأنشطة المعلوماتية التي تمارسها في حاسوبك الشخصي, وطبيعة الأنساق المعرفية التي تنقب عنها أثناء عملك على الإنترنت, أو المواقع التجارية التي تزورها لكي توفر لأكثر من جهة خارطة واضحة لمعالم تفكيرك الذاتي.

          لا يمكن تصنيف جميع هذه البرمجيات في الجانب السيئ لأن بعضها تم اعتماده لإجراء دراسات سوقية مستفيضة لتحديد حاجات المستخدم, وهوية الأشخاص الذين يزورون مواقع الويب المختلفة, بغرض الارتقاء في طبيعة الخدمات المعروضة على الشبكة, وضمان زيادة حجم الأرباح المتحققة. من جانب آخر هناك نسبة كبيرة من هذه البرمجيات يتم توظيفها بواسطة قراصنة معلومات يعملون لحسابهم أو لحساب شركات منافسة تسعى إلى إيجاد ثغرات في النظم المعلوماتية, أو الوقوف على طبيعة السياسة المالية للشركة المنافسة.

          ويبدو واضحا مما ذكر وجود أكثر من إمكانية للوقوف على طبيعة الحركة الاقتصادية, والمسائل السياسية الساخنة التي تدور في ذهن المستخدم, وما طبيعة الموضوعات التي تجلب اهتمام الرجال أو النساء, وغيرها من الأمور التي توفر للجهة التي تستثمر هذه البيانات أكثر من فرصة لسيادة السوق الاقتصادي, أو التلاعب بأحاسيس الجماهير, أو تحديد معالم أنشطة البحث العلمي, والخطوط الأولية لأنشطة البحث العلمي التي تصبح جلية عندما نعاين أنماط الكلمات المفتاحية المستخدمة في آلة البحث.

محلّل المرور المعلوماتي Traffic Analyzer:

          تستخدم أدوات تحليل المرور المعلوماتي لمتابعة عمل آلات البحث بدقة, والكلمات المفتاحية المستخدمة فيها, مع تحديد طبيعة ارتباطاتها بحجم المرور المعلوماتي في موقع من المواقع. وتستثمر هذه البيانات لبيان أهم العقد المعلوماتية التي يقبل عليها زوار الموقع, والتي تعد مؤشرا نحو نجاح الصفحة في اجتذاب الزبائن, أو تسويق منتجات محددة.

          وعلى هذا الأساس تقوم الجهة التي تدعم موقعا محددا بتحديد موقعها في ساحة مواقع الإنترنت, مع القدرة على مراقبة الجهات المنافسة, وتحديد عوامل نجاحها في الدائرة الاقتصادية أو التقنية في ضوء المتغيرات التي تظهرها آليات تحليل أنماط البيانات, ومستويات الكلمات المفتاحية التي يكثر المستخدمون من استعمالها عند التعامل مع آلات البحث المختلفة, مما يقلل من حجم الإنفاقات المخصصة على الارتقاء بأنشطة التسويق ودعم الزبائن.

خاتمة نقدية

          يتوافر عدد هائل من آلات البحث المجانية التي تطرحها جهات متعددة على شبكة الإنترنت. وتوفر آلات البحث بيئة سهلة للمستخدم العادي والمتخصص للوصول إلى المواقع التي تستأثر باهتماماته في قطاعات التجارة والأعمال, والصناعة, والعلوم, والتربية, وغيرها من مساحات النشاط الإنساني.

          وقد ساد شعور بالألفة بين جميع الذين يمارسون مهنة الإبحار بين مواقع الإنترنت, وأقاموا علاقات متينة بمواقع آلات البحث المختلفة التي يوظفونها كعميل ذكي ينقر لهم عما يبغون الوصول إليه, فظهرت خدمة البريد الإلكتروني التي توفرها مجاناَ هذه المواقع, وحزم الأخبار السياسية, ومعلومات متفرقة تهيئ للمستخدم إمكانية تشكيل صورة متكاملة عما يدور في العالم الرقمي الذي بات يستوطن جميع بقاع النشاط الإنساني.

          بيد أن ما لم يفكر به المستخدم التقليدي, أو تنتبه إليه المؤسسات التي تنهض بأعباء أنشطة الحكومات الإلكترونية, أو مراكز المعلومات الوطنية هو الدور السري الذي تقوم به آلات البحث في توفير خارطة تفصيلية لأنشطة البحث التي تمارسها المنظمة الرقمية, أو الأفراد الذين يستخدمون هذه الآلات بصورة روتينية للوصول إلى وثيقة محددة, أو التنقير عن خبر جديد, أو توفير المصادر الكافية للبدء بالعمل على بحث جديد على مستوى الأفراد, أو المستوى المؤسساتي, وصولا الى المستوى الذي يتعلق بأنشطة وطنية لا نريد غيرنا الوقوف على ماهية الحدود التي نفكر بها على مستوى إستراتيجية التخطيط العلمي أو الاقتصادي على سبيل المثال.

          وقد وفرت شركات تجهيز آلات البحث في مضيفاتها أكثر من أداة معلوماتية تراقب عن كثب أنشطة مستخدمي آلة البحث. فبدأ هذا النشاط لتحديد حجم الأنشطة التي تتحمل أعباءها آلة البحث, ولتحديد عدد المستفيدين منها, والتأكد من نجاح موقع من المواقع بشد اهتمام المبحرين داخل حدود شبكة الإنترنت غير المتناهية. ثم تطورت الأدوات المعلوماتية التي تتعامل مع هذه المسائل, فأصبحت أكثر ذكاء ودراية بتحديد هوية المستخدم, وازداد حسها الأمني فتوغلت برفق إلى جميع الحواسيب المرتبطة بالموقع, ونجحت في تسجيل قوائم تفصيلية بكل كبيرة وصغيرة يمارسها المستخدم (فردا كان أو مؤسسة). لقد تحولت عملية البحث البريئة إلى سجل موثق يؤشر إلى جميع الكلمات المفتاحية التي أدخلها المستخدم للبحث عما ينشده من مواقع الشبكة, وبدا العميل الذكي قادرا على تتبع جميع بصمات وآثار المستخدم, مع التوثيق الدقيق لجميع الكلمات المفتاحية, والوثائق التي تم سحبها من مواقع الشبكة, الأمر الذي يوفر لنا مخططًا تفصيليًا لنشوء الأفكار لدى المستخدم, وكيفية تطور مناهج البحث العلمي حول مسألة معينة لديه, وأنماط الحلول ونسق المفاهيم التي يستخدمها في التعامل مع المسألة.

          لقد أصبحت هذه السجلات (التي تشابه الأبجدية المسمارية) خير دليل وإثبات على وجود نشاط علمي, أو تجاري, أو اقتصادي تمارسه جهة من الجهات, مع تحديد تخوم الحلول المطروحة التي يطرحها فكر المستخدم في ضوء المواقع الكثيرة التي يتنقل بينها, والتطور الحاصل في بنية وجذور الكلمات المفتاحية التي يستخدمها عبر مرحلة محددة من مراحل عمله.

          من أجل هذا ينبغي على مستخدمي الإنترنت في وطننا العربي أن يكونوا أكثر تيقظا عند إدخال الكلمات المفتاحية, وأن تتوجه المنظمات الحكومية, ومؤسسات البحث العلمي العربية صوب تبني آليات بحث جديدة, والإقلاع عن استخدام آليات البحث المشاعة التي قد يستخدمها الغير لمعرفة ما يجول بخواطرنا إزاء مسائل ينبغي أن تكون لك لا عليك?

جدول (1): قائمة بأهم آلات البحث المتوافرة على شبكة الإنترنت وعدد المستخدمين

آلة البحث

نسبة الاستخدام

عدد المستخدمين

Google 35.11%  112 مليوناً
Yahoo 32.79%  105 ملايين
MSN 12.00%  39 مليوناً
AOL 9.0% 29 مليوناً
Overture 5.60% 18 مليوناً
AltaVista 1.74% 6 ملايين
Lycos 1.57% 5 ملايين
Netscape 1.10% 4 ملايين
HotBot 0.10% أقل من مليون


جدول (2): جولة في نخبة من استعلامات بيئة Google بالولايات المتحدة في الأسبوع الأول من شهر مايو 2004.

ت أعلى نسب مفردات
استعلام للمستخدمين
 أدنى نسب مفردات
استعلام للمستخدمين
أكثر مواقع الأخبار التي اهتم بها المستخدمون  أكثر مواقع التجارة الإلكترونية المستخدمة
1 kentucky derby earth day iraq  walmart
2 olsen twins jennifer garner india   home depot
3 cinco de mayo nfl draft haiti  best buy
4 melania knauss pat tillman china target
5 mean girls kill bill martha stewart circuit city
6 harry potter sharon mitchell george w bush sears
7 mothers day princess diana john kerry lowes
8 sasser worm columbine howard stern costco
9 the simpsons queen mary 2 kobe bryant ikea
10 snakehead fish michael jackson

american idol

office depot


 

حسن مظفر الرزو   

أعلى الصفحة | الصفحة الرئيسية
اعلانات