WEBVIEW: برنامج لمُراقبة تصفح الإنترنت باستخدام تقنية TAIGA

المصدر الأصلي للمقالة: http://cs.brown.edu/~spr/research/webview.html

نظرة عامة

WebView هو عبارة عن عرضٍ شامل ودقيق للمواقع الذي يتم تصفحها خلال فترة مُعينة. وهو مُصمم لمُراقبة بيانات التصفح وهو يقوم بجمع البيانات حسب فئات مُحددة في عرض ذو شكل بسيط وسهل الفهم ومثير للاهتمام! في الوقت نفسه، فإن هذا التطبيق دليل على إمكانات نظام برمجة TAIGA.

لجعل هذا التطبيق ممتعًا وفعالًا فلابد أن يستخدمه الناس، وبالتالي فنحن نُشجعك على تنزيل هذا البرنامج وتثبيته وتشغيله على جهازك وبعد ذلك يُمكنك أن تُخبرنا عن رأيك وانطباعك عنه.

العرض

من وجهة نظر المُستخدمين، فإن برنامج (webview) هو برنامج نصي بسيط يُقدم عرضًا مُصنفًا لما يتصفحه الأشخاص حاليًا. ويظهر هذا العرض مثل العينة أدناه:

يتكون العرض من حلقات مُتحدة المركز وتُمثِّل كل منها فترة زمنية تتراوح بين دقيقة واحدة وتصل إلى عدة أيام. تنقسم كل حلقة إلى مناطق تعكس فئة واحدة من صفحات الويب. (نستخدم حاليًا تصنيف OpenDirectory لكن أي تصنيف سيكون فعالًا). يتم ترتيب الفئات بشكلٍ أبجدي وهي تدور في اتجاه مُعاكس لحركة عقارب الساعة من موضع الساعة 3 (وهو أمر منطقي لعلماء الرياضيات على الأقل). الألوان عشوائية، ولكن تم اختيارها لتوضيح الفرق بين الفئات المُجاورة المحتملة. يوجد داخل كل منطقة فئة خط متموج يرمز للمعلومات حول الصفحات التي يتم عرضها في هذه الفئة، ويتم تحديث العرض كل دقيقة أو نحو ذلك.

تُوفِّر الشاشة للمستخدم عدة أنواع من المعلومات. يتناسب مدى القوس لكل فئة مع عدد المشاهدات (المواقع التي يتم الدخول عليها من المُتصفح) بواسطة فئة مُعينة من المستخدمين خلال فترة زمنية مُحددة.

يشير لون المنطقة إلى الفئة؛ يعكس تشبع اللون العدد المُتزايد للمُشاهدات. وبالتالي، إذا كان عدد المشاهدات خلال هذه الفترة الزمنية قليل نسبيًا فإن لون المنطقة سيكون أخف.

الخط المُتموِّج يُشفَّر العدد النسبي لعناوين الـ URL المُميزة التي تم الدخول عليها خلال الفترة الزمنية. وبالتالي، إذا كانت جميع الصفحات التي تم عرضها لفئة واحدة من عنوان URL واحد فسوف يكون الخط مُسطحًا؛ وإذا كان كل منهما مميزًا فسوف يكون الخط مُتموجًا تمامًا. كما يتم استخدام سُمك الخط للتعبير عن العدد النسبي للمُستخدمين الذين يدخلون على مواقع تلك الفئة. فإذا كان مَن قام بالتصفح هو مستخدم واحد، فسوف يكون الخط رفيعًا جدًا؛ وإذا كان هذا التصفح يتم من قبل الكثير من المستخدمين، فسوف يكون الخط سميكًا.

أي أن الشاشة يُمكنها أن تُرمِّز للمعلومات في سطوع (تلاشي إلى أسود) وفي اتساع الخطوط أيضًا. لدى المستخدم أيضًا خيار تغيير خصائص العرض باستخدام مربعات الحوار ويشمل هذا الأمر تغيير الإحصائيات المرتبطة بكل خاصية رسومية، وتغيير الألوان المرتبطة بالفئات المختلفة، وفئات الخرائط، وتغيير الامتدادات المختلفة.

جمع المعلومات

لعرض بيانات حول التصفح فنحن نحتاج إلى جمع هذه البيانات أولًا؛ وهو ما يعني أن هذا البرنامج هو برنامج تجسس! فهو يُراقب سجلات التصفح الخاصة بك، ويقوم بالإبلاغ عن الصفحات التي تتصفحها، ويتم حفظ هذه البيانات وتصنيفها وتسجيل الفئات الخاصة بها على نظاق عام.

ومع ذلك، لا يُسجل البرنامج أي بيانات مالية أو معلومات شخصية أو أي شيء يُعرِّف عنك. ويتم تمثيل “المستخدمين” برمزٍ تعريفي عشوائي فريد يستخدم فقط لتحديد عدد المستخدمين. ويتم منح المُستخدمين هذه رموز التعريف بشكلٍ عشوائي ولا يُمكن تتبعها أو إعادتها مُجددًا إلى المصدر (على حد علمي). ويعمل برنامج التجسس فقط عندما يقوم بتشغيل المُتصفح وفقط للمستخدم الذي يقوم بتشغيله، ويتم توفير مصدر كامل إذا كنت لا تُصدق ما يحدث.

لاحظ أن هذا البرنامج يعمل على windows و linux و Mac OS/X وعلى مُتصفح safari و mozilla و IE و Opera في مجموعات مختلفة. إذا كنت ترغب في المساهمة في بيانات المشروع ولكنك لا تريد تشغيل خاصية التصوير في البرنامج، فنحن نُقدم برنامجًا نصيًا يعمل فقط على مراقبة سجل التصفح الخاص بك.

تصنيف

لا يحفظ النظام عناوين الـ URL أو رموز تعريف المستخدمين أبدًا. ولكنه حينما يتعرف على صفحة ما فإنه يقوم بإيجاد الفئة المناسبة لها ويحفظ بيانات هذه الصفحة في الفئة المُخصصة لها، ويتم هذه العملية بشكل دوري حول عدد الصفحات والمستخدمين وعناوين الـ URL لكل فئة. لا يقوم النظام بتنزيل صفحة أو الوصول إليها للعثور على فئتها. بدلاً من ذلك، فإنه يبحث عن الفئة باستخدام عنوان الـ URL فقط.

باستخدام نظام TAIGA فإننا نقوم بالعديد من المُصنفات، وحاليًا نحن نستخدم ثلاثة أنواع مختلفة؛ المُصنف الأول الذي نستخدمه هو خدمة Google على الويب ويُمكنك أن تستخدمه للبحث عن صفحة معينة والنظر في تصنيف Open Directory الذي تعرضه Google كجزء من النتيجة.

لكن هذا التصنيف محدود لأن Google لا يُريد منَّا الاتصال بخدمة الويب أكثر من 1000 مرة في اليوم ولأنهم لا يضعون دائمًا التصنيف حتى للصفحات الشائعة نسبيًا!

والبديل هو مشروع MeURLin والذي يقوم بتصنيف صفحات الويب واستخلاص النتائج (ولكنهم لم يُطورو مُتصفح الويب الخاص بهم بعد) فإنه يعتبر فعالًا للغاية رُغم أنه لا يُعطي درجات متفاوتة من الدقة وهو ما يجعله بطيئًا جدًا لاغراضنا.

أما المُصنَّف الثالث فهو يقرأ قاعدة بيانات دليل التصفح عند بدء التشغيل ويبني شجرة تصنيف لعناوين الـ URL. وبمجرد بناء الشجرة (التي تستغرق 15 دقيقة و2 جيجابايت من ذاكرة التخزين العشوائية) فإن البحث يكون سريعًا جدًا. في حين أن جميع المُصنفات الثلاثة متاحة، ونظام TAIGA لديه حُرية في اختيار الأفضل من بينهم خلال وقت مُعين ولكن في الغالب فإن الأكثر استخدامًا يكون النوع الأخير.

إذا كان لدى أي شخص مُصنِّف أفضل أو مُصنِّف يرغب في تجربته فيُمكنه أن يُخبرنا عنه وسوف أكون سعيدًا بدمجه بسرعة في هذا النظام! حيث يسمح Taiga بحفظ خدمته في مكتبة، أو على خادم يخص العميل، أو خدمة ويب.

تخزين البيانات

نحن نستخدم خصائص نظام الملفات العالمي في تطبيق TAIGA لتوفير أرشيف المعلومات الأولي، ويتم إلحاق النتائج المتراكمة من جمع المعلومات بشكلٍ دوري بملف البيانات الحالي. نظرًا لاحتمال أن يصبح هذا الملف كبيرًا إلى حدٍ ما، فإننا نحتفظ بمجموعة من ملفات البيانات حيث يتم ربط الملفات ببعضها البعض. كما أن هناك خادم منفصل لتحديد الملف الحالي خلال وقت بدء معين، ولإنشاء ملفات جديدة حينما تُصبح ملفات البيانات كبيرة جدًا، ولكي يتم ربط الملفات ببعضها البعض. ستبدأ هذه الخدمة تلقائيًا (إذا لم تكن قيد التشغيل بالفعل) على جهاز في جامعة براون.

شبكة الاتصال

يعتمد هذا التطبيق بالكامل على نظام اتصال TAIGA. فعندما تقوم بتشغيل خاصية المُصوِّر في المًتصفح الخاص بك سوف تكون متصلًا بنظام TAIGA على جهازك.

ويستخدم Taiga حزمة JXTA peer-to-peer للتواصل بين مختلف نُظُم التشغيل والخدمات. عند بدء التشغيل الأولي، من المُحتمل أن ترى مربع تكوين شبكة JXTA. إذا كانت الأمور بشكلٍ جيد فإن مُجرد الضغط على خيار “موافق” سيكون كافياً. وإذا كنت معتادًا على استخدام شبكة JXTA فلا تتردد في تخصيص وضبط الإعدادات المختلفة. حيث أنك إذا استخدمت نظام JXTA فإن تطبيق Webview سوف يكون قادرًا على العمل خلال جدران الحماية بمرونة فائقة. وإذا كنت ترغب في التسجيل على نظام TAIGA أثناء تشغيله على جهازك، فقم بتعيين متغير البيئة TAIGASHOW (على النوافذ) أو ضبط متغير البيئة TAIGALOG على اسم المسار الكامل لملف السجل المناسب.

أوراق

لم يتم كتابة أي شيء حول هذا المشروع حتى الآن. ونحن نقد أي تجربة لك مع التطبيق وكذلك فإننا نُرحب أيضًا بأي ملاحظة قد تكون لديك حول نكتب التقرير.

ردود الفعل

هذا البرنامج تجريبي (جدًا). لقد حاولنا القيام بمجموعة متنوعة من التجارب المُختلفة ولكن لدينا مجموعة محدودة فقط من الأنظمة المتاحة. هناك الكثير من الأشياء التي يجب علينا إصلاحها سواءً في نظام التشغيل أو في التطبيق أو في الشبكات التي تربط كل شيء.

نحن نريد إصلاح الأشياء ولكن لكي نتمكن من تحقيق ذلك فنحن نحتاج أولًا إلى معرفة ما لا يعمل (وربما ما الذي يعمل!). نُرحب بجميع التعليقات وتقارير الأخطاء والاقتراحات والتعليقات والإستفسارات وما إلى ذلك، ويُمكنك أن تُراسلنا عبر البريد الإلكتروني التالي: [email protected].

البرمجيات

إذا كنت تدرس علوم الكمبيوتر في جامعة براون فيُمكنك الحصول على أحدث إصدار على / home / spr / tryview (Y: \ home \ spr \ tryview على نظام الويندوز.

إذا كنت خارج شبكة جامعة براون، فيُمكنك الحصول على البرنامج من خادم بروتوكول نقل الملفات الخاص بنا بتنسيق (tar.gz) أو (zip).

عملية التثبيت بسيطة: قُم بتنزيل وتثبيت البرنامج، ثم قُم بتشغيله؛ فكل ما عليك هو تنفيذ سكربت runview (أو runview.bat على الويندوز) للحصول على العرض المرئي (وإذا كُنت تُريد تشغيل برنامج المُراقبة فكل ما عليك هو تشغيل سكربت runspy).

مرة أخرى. لتنزيل البرنامج:

قم بتنزيل webview.distrib.tar.gz

قم بتنزيل webview.distrib.zip

مشاهدة المزيد