क्या कोई भी पाठ कैप्चा चुनौतियां हैं जो एआई को मूर्ख बना सकती हैं, लेकिन मानव नहीं?


10

क्या टेक्स्ट कैप्चा (ताकि व्यक्ति को सही पाठ टाइप करने की आवश्यकता है) को उत्पन्न करने की कोई आधुनिक तकनीक है जो कुछ दृश्य अवरोधन विधियों के साथ आसानी से AI को मूर्ख बना सकता है , लेकिन साथ ही साथ मानव उन्हें बिना किसी संघर्ष के हल कर सकता है?

उदाहरण के लिए मैं छवि में एम्बेडेड पाठ (फ्लैश या जावा, इमेज वर्गीकरण इत्यादि जैसे किसी भी बाहरी प्लग इन पर विचार किए बिना) को पहचानने की सादा क्षमता के बारे में बात कर रहा हूं और जो पाठ लिखा गया है या ऐसा ही कुछ है।

मुझे लगता है कि शोर, ढाल, घूमने वाले अक्षर या रंग बदलना कोई विश्वसनीय तरीका नहीं है, क्योंकि वे जल्दी से टूट सकते हैं।

कोई सुझाव या शोध किया गया है?


4
क्या यह पीछे की तरफ नहीं है? आमतौर पर कोई व्यक्ति पहले एक कैप्चा बनाता है जो उन्हें लगता है कि एक बॉट को बेवकूफ बना सकता है, जब अन्य लोग इसे स्वचालित रूप से हल करने पर काम करना शुरू करते हैं। आप जो भी नया सोचेंगे वह बहुत जल्दी अप्रचलित हो जाएगा।
er:

यह सोचने की कोशिश करें कि मनुष्य कंप्यूटर से बेहतर क्या कर सकते हैं। हम कारण और हम (देशी वक्ताओं) लगभग हर मुहावरे को जान पाएंगे। आगे के विचारों के लिए इसे देखें । मुझे लगता है कि जहां तक ​​पाठ जाता है, सबसे अच्छा यह होगा कि उपयोगकर्ता एनएलपी के साथ विश्लेषण करने के लिए एक घोषित भावना से मेल खाए या शायद कुछ व्यक्त करे। कंप्यूटर स्पष्ट, अच्छी तरह से संरचित वाक्यों का मसौदा तैयार करने में बहुत अच्छे नहीं हैं (लेकिन मुझे लगता है कि अधिकांश मनुष्य या तो महान नहीं हैं)।
जेक डी

आमतौर पर शाब्दिक कैप्चा का उपयोग यह कहने के लिए किया जाता है कि CATPCHA को पाठ के रूप में प्रस्तुत किया गया है, न कि यह कि आवश्यक उपयोगकर्ता इनपुट पाठ होना चाहिए। उदाहरण के लिए TextCaptcha
थरोट

जवाबों:


5

यह इस बारे में एक दिलचस्प सवाल है कि मनुष्य को क्या अनोखा बनाता है। ह्यूबर्ट ड्रेफस द्वारा व्हाट्स कम्प्यूटर्स कैंट डू नामक विषय पर एक अच्छी पुस्तक है ।

एक कार्य जिसे कंप्यूटर नहीं संभाल सकता है (अब कम से कम) महत्वपूर्ण चीजों की रैंकिंग कर रहा है। उदाहरण के लिए, कैप्चा आपको चीजों की एक यादृच्छिक सूची (छोटे एक, पांच या छह आइटम) को महत्व देने के लिए कहता है। इस विशेष अभ्यास के लिए एआई को मानवीय निर्णय के आधार पर निर्णय लेने (हमेशा तर्कसंगत नहीं) की आवश्यकता होती है।


5

एक विधि जो संभवतः काम कर सकती है वह ऑप्टिकल भ्रम का उपयोग कर रही है जैसे कि एक जहां एक दालान के नीचे दो लाइनें समान हैं लेकिन एक को मानव आंख तक लंबा लगता है, फिर उन्हें लाइन की स्थिति के लिए एक बहु विकल्प प्रश्न के साथ जोड़ा जा सकता है, जिसे हमारी आँखें लंबी दिखती हैं, लेकिन एक कंप्यूटर के लिए, अभी भी एक ही लाइन की लंबाई है। बेशक, आंखों पर आधारित विकलांगता वाले लोगों का मुद्दा हमेशा उन्हें पूरा करने में सक्षम नहीं होता है, लेकिन इसे समायोजित करने के लिए विभिन्न भ्रमों का इस्तेमाल किया जा सकता है।

उदाहरण


2

उपयोगकर्ता लेबल ने उन वस्तुओं को वीडियो में हाइलाइट किया है जिन्हें कला क्लासिफायर का एक राज्य हल नहीं कर सकता है

कला वीडियो क्लासिफायरियर की एक स्थिति बनाएं। Google के YouTube-8M वीडियो प्रशिक्षण डेटा पर भी इसे प्रशिक्षित कर सकते हैं। लेकिन आप इसे मूल वीडियो के साथ-साथ लगातार खिलाना चाहेंगे।

क्लासिफायर लेबल के रूप में कई वस्तुओं के रूप में यह कर सकते हैं। क्या यह अलग है कि यह किन वस्तुओं को वस्तुओं के रूप में पहचान सकता है लेकिन यह लेबल करने में असमर्थ है।

क्या यह आउटपुट वीडियो है जो वस्तुओं को रेखांकित करता है। अधिमानतः जीआईएफ, जिसे आसानी से रूपों में एम्बेड किया जा सकता है।

इनमें से 100 के लिए, 100 उपयोगकर्ताओं से पूछें कि वस्तु क्या है। यदि 90% उपयोगकर्ता किसी ऑब्जेक्ट के नाम पर सहमत हैं, तो उस वीडियो को कैप्चा-सेट में जोड़ें। इसे पूर्व प्रशिक्षित सेट कहें।

हर बार जब उपयोगकर्ता को प्रमाणित करने की आवश्यकता होती है, तो उन्हें पहले से प्रशिक्षित सेट से वीडियो में हाइलाइट की गई वस्तुओं में से एक दिखाएं । यदि छवि में 100 से कम दिखावे हैं, तो लेबल रिकॉर्ड करें और उपयोगकर्ता को पूर्व-प्रशिक्षित सेट से एक और एक दें। यदि वे इसे सही पाते हैं, तो उनके माध्यम से जाने दें, यदि नहीं, तो उन्हें प्रिटेंडेड सेट से दूसरा दें।

एक बार गैर-पूर्व-प्रशिक्षित वीडियो में 100 से अधिक दिखावे और 90% से अधिक कैप्चा-उपयोगकर्ता सहमत होते हैं, उस वीडियो को पोस्ट-प्रशिक्षित सेट में जोड़ें।

समय के साथ, पहले से प्रशिक्षित सेट को धीरे-धीरे हटा दें। पोस्ट-प्रशिक्षित सेट में प्रत्येक वीडियो पर समाप्ति की तारीखें डालें और समाप्ति के बाद उन्हें हटा दें, ताकि वे कई बार उपयोग न करें।

आदर्श रूप से, यह प्रक्रिया लगातार वीडियो क्लासिफायर में सुधार करती है, जिससे यह कला की स्थिति और अन्य क्लासिफायर से थोड़ा आगे रहती है। शायद यह कम सामान्य शब्दों और वस्तुओं और अधिक गूढ़ बातों का भी पक्ष ले सकता है, ताकि अन्य क्लासिफायर के खिलाफ इस क्लासिफायर का विशेषज्ञ हो।

छवि लेबलिंग के लिए भी ऐसा ही किया जा सकता है, लेकिन वीडियो क्लासिफायर की उपयोगिता संभवत: लंबे समय तक चलेगी, जो एआई में दी गई है।

कड़ाई से बोलते हुए, हालांकि, कुछ क्वांटम प्रवंचना से कम, कोई कैप्चा प्रणाली नहीं है जो एक दिन बाहरी एआई सिस्टम द्वारा हल नहीं होगी।

(संपादित करें: ओह, मैंने अभी आपको विशेष रूप से कहा "टेक्स्टुअल कैप्चा।" लेकिन तकनीकी रूप से, ऊपर वर्णित कैप्चा प्रणाली में इनपुट शाब्दिक है।)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.