खोज इंजनों पर सूचना द्वारपाल के रूप में तेजी से भरोसा किया जा रहा है, फिर भी खोज इंजन द्वारा रैंक के परिणामों के लिए उपयोग किए जाने वाले मानदंड उपयोगकर्ताओं के लिए अपारदर्शी है। उपयोगकर्ता यह सुनिश्चित कर सकते हैं कि खोज परिणाम गुणवत्ता की कीमत पर कुछ ब्याज हासिल करने के लिए उनके परिणामों को किसी तरह से पक्षपातपूर्ण या छेड़छाड़ नहीं किया जाए?
सरकारें नियमित रूप से मांग करती हैं कि खोज प्रदाता राजनीतिक रूप से अवांछनीय समझी जाने वाली वेबसाइटों की रैंकिंग को हटा दें या कम करें। व्यवसाय अपने राजस्व को बढ़ाने के लिए दूसरों पर कुछ परिणाम बढ़ाने के लिए प्रदाताओं को भुगतान कर सकते हैं। इससे पहले कि वे उपयोगकर्ताओं को वापस प्रेषित करें, फायरवॉल परिणाम के साथ मध्यस्थता कर सकता है।
यहां तक कि रैंकिंग एल्गोरिदम के लिए सहज रूप से बदलाव जो सतह पर नहीं हो सकता है पक्षपाती प्रतीत होता है, वास्तव में कुछ सामान्य विशेषता (वास्तविक गुणवत्ता से असंबंधित) साझा करने वाली वेबसाइटों को नुकसान पहुंचाने के लिए डिज़ाइन किया जा सकता है।
क्या खोज इंजन पूर्वाग्रह का पता लगाना संभव है, समय-समय पर परिणामों की निगरानी करना और मूल्यांकन करना कि क्या कुछ "छिपा हुआ चर" (शायद एक राजनीतिक संबद्धता) वेबसाइट रैंकिंग में बदलाव का एक ड्राइविंग कारक है?
एक डरपोक प्रदाता धीरे-धीरे समय के साथ लक्षित वेबसाइटों (और शायद यादृच्छिक वेबसाइटों के साथ-साथ उपयोगकर्ताओं को विचलित करने) की रैंकिंग कम कर सकता है। एक खोज के बिना एक प्रदाता कितना पूर्वाग्रह कर सकता है, इस पर क्या सीमाएं हैं? या फिर भारित रैंकिंग मानदंड का चयन करके हमेशा इस तरह के हस्तक्षेप को छिपाना संभव है जो संयोग से इच्छित परिणाम ("डेटा स्नूपिंग" के माध्यम से) पैदा करता है।
यदि रैंकिंग मानदंड को सार्वजनिक किया जाता है तो क्या इसका कोई परिवर्तन होता है? क्या हमें खोज इंजनों का उपयोग करने वाले मापदंडों को खोलने की आवश्यकता है?
यह मुझे उस परिणाम की याद दिलाता है, जो यह पता लगाता है कि सीडीओ जैसे जटिल वित्तीय उपकरण को विक्रेता द्वारा छेड़छाड़ किया गया है या नहीं, यह सघन-उपसमूह समस्या को हल करने के बराबर है:
http://www.cs.princeton.edu/~rongge/derivative.pdf
धन्यवाद!