يقول علماء كمبيوتر طوروا خوارزمية تقييم نوعية المقالات ويكيبيديا أن بأمكانها زيادة ثقة الزوار بالمقالات ومساعدة المحررين للتركيز على المقالات التي تحتاج إلى تحسين.

النتيجة هي العديد من المقالات عالية الجودة عن مجموعة واسعة من المواضيع بأكثر من 200 لغة . ولكن هناك أيضاً مواد ذات نوعية رديئة ومشكوك بصحتها .

يثير هذا سؤالاً مهماً لزوار الموقع: ما حجم مصداقية مادة ما في ويكيبيديا؟

نحصل اليوم على الجواب بفضل عمل Xiangju Qin و Pádraig Cunningham  في جامعة University College Dublin in Ireland. حيث وضعوا خوارزمية لتقييم نوعية صفحات ويكيبيديا على أساس تدخل المحررين والتعديلات التي قاموا بها.

” الفرضية هي أن الصفحات ذات التعليقات والمساهمات الكثيرة قد تكون ذات جودة عالية “

وفقاً لهذه المعلومات، ينبغي لزوار ويكيبيديا أن يكونوا  قادرين على الحكم على جودة أي مادة بدقة أكبر.

درست عدة مجموعات نوعية مقالات ويكيبيديا وكيفية قياس نوعيتها في الماضي. المميز في هذا العمل هو الجمع بين طرق قائمة بالفعل بطريقة جديدة.

بدأ Qin  و Cunningham  بوسيلة معيارية لقياس طول عمر “عملية التحرير”. الفكرة هي أن تحرير ذو جودة عالية أكثر عرضة للبقاء لمراجعات مستقبلية. حسبوا هذا من خلال الجمع بين حجم التحرير لكاتب معين وإلى متى يستمر هذا التعديل بعد التنقيحات الأخرى .

تغيير الحقائق المتعمد Vandalism  هي مشكلة شائعة في ويكيبيديا. لحل ذلك، تجاهل Qin و Cunningham  جميع المساهمات المجهولة وأخذوا متوسط ​​الجودة والتي تميل للحد من تأثير العديلات الطفيفة.

قاسوا  بعدها سلطة كل محرر. تعرف ويكيبيديا بوجود عدد صغير نسبياً من المحررين الذين يلعبون دوراً أساسياً في المجتمع. يساعد هؤلاء على الحفاظ على المعايير التحريرية المختلفة، ونشر هذه المعرفة في أنحاء المجتمع .

في هذا المجتمع ، يفترض Qin  و Cunningham  وجود ارتباط بين محررين إذا شاركا في تأليف مقال. لذلك لا شك بأن المحررين الخبراء يرتبطون على نحو أفضل بالشبكة.

هناك طرق مختلفة لقياس السلطة. نظر Qin  و Cunningham  إلى عدد من المحررين المرتبطين بمحرر معين. وقيموا نسبة أقصر الطرق عبر الشبكة والتي تمر عبر محرر معين. استخدموا خوازمية Pagerank لقياس السلطة. (Pagerank  هي خوارزمية غوغل حيث تعتبر صفحة الويب مهمة إذا كانت صفحات ويب أخرى هامة تشير لها)

أخيراً، جمع Qin  و Cunningham  بين هذه المقاييس من طول مدة التحرير والسلطة لإنتاج مقياس لجودة المادة .

أما لاختبار فعالية التقييم، استخدموا خوارزمية لتقييم جودة أكثر من 9000 من المواد التي تم تقييمها من قبل محرري ويكيبيديا. قالوا بأن طول مدة التحرير بحد ذاتها مؤشر جيد لنوعية مقال. لكن أخذ سلطة المحررين بعين الاعتبار يحسن التقييم عموماً.

“من المحتمل أن مقالات ذات المساهمات كبيرة من موثوقين أن تكون ذات جودة عالية، وتضمن المواد ذات الجودة العالية عموماً مزيداً من التواصل والتفاعل بين المساهمين”

هناك بعض القيود، بطبيعة الحال. يغير نوع شائع من تحرير، والمعروف باسم Revert ، مقال لنسخته السابقة ، وبالتالي يزيل التحرير تماماً. غالباً ما يستخدم هذا للتخلص من الفوضى . يعترف Qin و Cunningham أنه “في الوقت الحاضر، ليس لدينا طريقة للتعامل مع التعديلات الطفيفة التي لا تضيف محتوى جديد إلى صفحة” . لذلك هناك عمل ينبغي القيام به في المستقبل .

مع ذلك ، يمكن للنهج الجديد أن يكون أداة مفيدة لمحرر ويكيبيديا. يقترح Qin  و Cunningham  إلى أنه يمكن لهذا أن يساعد على تحديد المواد الجديدة ذات النوعية الجيدة نسبياً إضافة للمواد الحالية السيئة، وبالتالي يتطلب مزيداً من الاهتمام.

مع تراجع الموثقية للقوى التطوعية في ويكيبيديا، تفيد أدوات التحرير الآلي في تخفيف عبئ العمل عن القوى الحالية. السؤال الأوسع هو كيف يمكن تطوير هذه الأدوات وكيف تستخدم في هذا النوع من الخدمات القائمة على نشاط المتطوعين. 

البحث الكامل: تقييم نوعية صفحات ويكيبيديا باستخدام مدة تحرير المقال ومركزية المشاركين. Assessing The Quality of Wikipedia Pages Using Edit Longevity And Contributor Centrality  

من MIT Technology Review