हैकिंग रेकप्टा (उर्फ 'द पेनिस फ्लड')
अगली रणनीति का उपयोग यह देखने के लिए किया गया था कि क्या वे reCAPTCHA कार्यान्वयन में कोई दोष पा सकते हैं। एक चीज जो उन्होंने reCAPTCHA के बारे में खोजी थी, वह यह थी कि यह हमेशा डिकोडिंग के लिए एक उपयोगकर्ता को दो शब्द प्रस्तुत करता है - एक शब्द reCAPTCHA प्रणाली द्वारा जाना जाने वाला एक नियंत्रण शब्द है, जबकि दूसरा एक अज्ञात शब्द है (reCAPTCHA सही OCR त्रुटियों की सहायता के लिए मनुष्यों का उपयोग करता है)। विकिपीडिया प्रक्रिया का वर्णन करता है: “स्कैन किए गए पाठ को दो अलग-अलग ऑप्टिकल चरित्र पहचान कार्यक्रमों द्वारा विश्लेषण के अधीन किया जाता है; ऐसे मामलों में जहां कार्यक्रम असहमत हैं, प्रश्नवाचक शब्द को कैप्चा में बदल दिया जाता है। यह शब्द पहले से ज्ञात एक नियंत्रण शब्द के साथ प्रदर्शित होता है और इसे मानव द्वारा लेबल किया जाता है। जिन शब्दों को मानव न्यायाधीशों द्वारा लगातार एकल लेबल दिया जाता है, उन्हें नियंत्रण शब्दों के रूप में पुनर्नवीनीकरण किया जाता है। 2iasdo4 अनाम ने क्या महसूस किया कि यदि वे हमेशा अज्ञात स्कैन किए गए पाठ को एक ही शब्द के साथ लेबल करते हैं - और यदि उन्होंने हजारों बार ऐसा किया है और अंततः अज्ञात शब्दों का एक बड़ा प्रतिशत उनके शब्द के साथ गुमराह किया जाएगा। उन्हें बस कैप्चा में दो शब्दों को देखना था, 'आसान' के लिए उचित लेबल दर्ज करें (संभवतः ऐसा ही होगा जो दो ऑप्टिकल स्कैनर सहमत होंगे) और शब्द "लिंग" के लिए दर्ज करें यह मुश्किल है। यदि वे अक्सर ऐसा करते हैं, तो जल्द ही छवियों का एक महत्वपूर्ण प्रतिशत 'लिंग' के रूप में लेबल किया जाएगा और ऑटोवोट की क्षमता को बहाल किया जाएगा (एक पक्ष प्रभाव, जो बेनामी पर नहीं खोया गया था, यह धारणा थी कि आने वाले वर्षों के लिए पूरे पाठ में बेतरतीब ढंग से 'लिंग' शब्द के साथ कई डिजिटल किताबें होंगी। अद्यतन: मैंने बेन मौरर से पूछा।
अनुकूलन reCAPTCHA
जैसा कि ग्रंथों में 'लिंग' शब्द को छिड़कने की धारणा के रूप में, अनाम टीम को पता था कि घड़ी टिक रही थी, और यदि वे संदेश को पुनर्स्थापित करने जा रहे थे, तो उनके पास ऑटोवोटर्स के ऑनलाइन वापस आने का इंतजार करने का समय नहीं था - उन्हें मैन्युअल रूप से, कई बार, कई बार मतदान करना था। और इसलिए उन्हें जितनी जल्दी हो सके कैप्चा दर्ज करने में सक्षम होना चाहिए। उन्होंने दिशानिर्देशों का एक समूह विकसित किया, जो उन्हें जल्दी से तय करने की अनुमति देता है कि वे कौन से reCAPTCHA शब्दों को छोड़ सकते हैं। उदाहरण के लिए:
आपको 2 शब्द दिए जाएंगे: 1 असली, 1 नकली।
के लिए [REAL FAKE]
या [FAKE REAL]
, तुम बस में टाइप कर सकते हैं REAL
और यह स्वीकार किया जाना चाहिए।
यदि यह है [LOOKSREAL LOOKSREAL]
या [LOOKSFAKE LOOKSFAKE]
, यह आमतौर पर दोनों शब्दों में सिर्फ टाइप करने के लिए जल्दी है। कीमती समय तय न करें कि उनमें से कौन सा वास्तविक है।
एक नकली शब्द की पहचान करने के लिए उपस्थिति और शब्द के प्रकार दोनों का उपयोग करें। उनमें से सिर्फ एक पर भरोसा मत करो।
पूरा नियम यहाँ है: नकली कैप्चा ।