शब्द को कम से कम पहचानने योग्य रूप में


13

मेरा लक्ष्य खिलाड़ी को एक तले हुए शब्द के साथ प्रस्तुत करना है जिसे मूल रूप में फिर से दर्ज किया जाना चाहिए:

OELHL -> हेलो

मुझे एक स्क्रैचिंग एल्गोरिथ्म चाहिए जो किसी भी शब्द (> 3or4 अक्षर, रिक्त स्थान शामिल कर सकता है) और इसे कम से कम पहचानने योग्य रूप में बदल देता है।

बेतरतीब ढंग से हर अक्षर के चारों ओर घूमते हुए, निश्चित रूप से काम करता है, मैंने देखा कि सभी फेरबदल समान नहीं हैं, कुछ दूसरों की तुलना में अधिक पहचानने योग्य हैं। मैं इस प्रश्न को पोस्ट कर रहा हूं यदि कोई व्यक्ति एक बेहतर एल्गोरिथ्म (शायद भाषाविज्ञान पर आधारित) जानता है कि ~~ कम से कम पहचानने योग्य रूप की गारंटी देता है।


3
शायद आप यह सुनिश्चित करने की कोशिश कर सकते हैं कि कोई भी पत्र अपनी मूल स्थिति में न रहे?
user1306322


3
" कम से कम पहचानने योग्य रूप " आप इसे कैसे परिभाषित करते हैं? किसके लिए पहचाने जाने योग्य?
निकोल बोलस

1
@ नाइकोल ने अपने फेरबदल के रूप में यह अनुमान लगाने में सबसे कठिन बना दिया कि आदेश दिया गया शब्द क्या है।
user26471

4
@nicolbolas मुझे लगता है कि सवाल का बिंदु यह पूछना है कि क्या इस तरह की समस्या के लिए सामान्य सर्वोत्तम प्रथाओं को बनाने के लिए कोई शोध या जो कुछ भी उन पंक्तियों के साथ हुआ है।
तेतरीद

जवाबों:


26

Wihle plpuoar "Cmairbgde Uirenvtisy" sduty का बहुत हिक था , trehe smoe resaerch itno tihs tpoic है।

तिह sduty सोहव्स taht arpapent lteter szie pyals a rloe। Wpckelgraihs का उपयोग रिश्तों को कटघरे में खड़ा करने के लिए रिश्वत देने के प्रयासों को कम करने का प्रयास करता है।

तो कैसे dlveeop tihs itno एक aglorithm? मैं तन्ह्रे त्रेहे हैं स्मो बैस्क स्टेप्स:

  1. असिन ले एज़ टू लेटर टू एक्टाह लेटर
  2. ग्वेन वॉर्डो के लिए:
    1. एक्वा लेटर्र पोजिओन के लिए szie vaule को रिमेंबर करें।
    2. Raniomdze अक्षरों को फ़ॉलोविंग संबंधी विरोधाभासों से मुक्त करते हैं:
    3. ताहिर रिटेकसिव पोटेंसी में रेमियान को फ्रिस्ट और लेसैट लेट्रल को न करें
    4. एनीड प्लैनिग लेर्टेट्स के लिए प्रयास किया जाता है जो कि थायर स्माइज़ी का "सोल" है।

तेहर ओथर स्ट्रेटीज हैं जिन्हें आप एम्प्लॉय कर सकते हैं, थुघ मैं ह्वाए नो रैसेरच टू बीसीक अप फोल्विंग, जसुत माय त्सथ:

  • ओटीग्रनल और मोडफीड व्रॉड के बीच लेविश्टेन डिसटेंस को अधिकतम करने के लिए एप्टीमेट। तिरस कोल्ड को फिर से शुरू करने के लिए डायफिकफ्ल्टी को अधिक से अधिक बढ़ाता है। (Pehraps उपयोग Seeuqnce Alimngent )
  • लेटेरर्स बेरोफ स्क्रैमिलबंग के ओडरर को उल्टा कर दें, तेहन मोवे एक्तेह लेटेर जसुत कुछ सैपिस अपनी ऑनिग्रील स्थिति बनाते हैं। (Mbyae slhgitly sclambred bacwkards व्रोड मरो विसरित है?)

अनुवाद की आवश्यकता है?


हालांकि लोकप्रिय "Cmabrigde Uinervtisy" अध्ययन एक धोखा था , इस विषय में कुछ शोध हुए हैं।

यह अध्ययन दर्शाता है कि स्पष्ट अक्षर आकार एक भूमिका निभाता है। विकेलग्राफ का उपयोग उस बिंदु को समझने के लिए अक्षरों के सेट के बीच संबंधों का वर्णन करने का प्रयास करता है जिस पर एक शब्द समझा जाता है।

तो इसे एक एल्गोरिथ्म में कैसे विकसित किया जाए? मुझे लगता है कि कुछ बुनियादी कदम हैं:

  1. प्रत्येक अक्षर के लिए एक आकार मान असाइन करें
  2. किसी दिए गए शब्द के लिए:
    1. प्रत्येक अक्षर स्थिति के लिए आकार मान याद रखें।
    2. निम्नलिखित प्रतिबंधों के साथ अक्षरों को यादृच्छिक करें:
    3. पहले और आखिरी पत्र को अपनी स्थिति में बने रहने की अनुमति न दें
    4. अक्षरों को उनके समान आकार के "स्लॉट" में रखने से बचने का प्रयास करें।

ऐसी अन्य रणनीतियाँ हैं, जिन्हें आप नियोजित कर सकते हैं, हालाँकि मेरे पास अपने विचारों का समर्थन करने के लिए कोई शोध नहीं है, बस मेरे विचार:

  • मूल और संशोधित शब्द के बीच लेवेंसहाइट दूरी को अधिकतम करने का प्रयास । यह शब्द को पहचानने के लिए कठिनाई को अधिकतम कर सकता है। (शायद अनुक्रम संरेखण का उपयोग करें )
  • स्क्रैच करने से पहले अक्षरों के क्रम को उल्टा करें, फिर प्रत्येक अक्षर को अपनी मूल स्थिति से कुछ ही स्थान पर ले जाएँ। (हो सकता है कि थोड़ा पीछे की ओर तले हुए शब्द अधिक कठिन हों?)

5
मैं +1 तक जा रहा था जब तक मैंने नहीं देखा कि आपने अनुवाद प्रदान किया है। ;)
ट्रेवर पॉवेल

1
एक उत्तर के लिए एक शैली का सबसे अच्छा अनुप्रयोग! :)
टिम होल्ट

मैंने इस साल इतनी मेहनत कभी नहीं की है।
ब्लू विजार्ड

2

यह एक सार्वभौमिक समाधान नहीं है, लेकिन अक्सर अगर कोई शब्द है जो एक हाथापाई के बजाय एक विपर्यय है, तो यह मूल शब्द को कठिन बनाता है। एक बार जब आपका मस्तिष्क मूल शब्द पर बंद हो जाता है, तो उस शब्द को आपके सिर से बाहर निकालना मुश्किल होता है।

यानी डिक्री -> रीकेड, इक्‍केडर की तुलना में कठिन हो सकता है -> रिकैड।

एक और बिंदु (हालांकि मुझे यकीन नहीं है कि इसे कैसे लागू किया जाए) अक्षरों के सामान्य जोड़े को निकालना है। यदि किसी विपर्यय में उत्तर में 'q' और 'u' हैं, तो आप उन्हें प्रश्न में अलग करना चाहते हैं। अन्य उदाहरणों में 'th', 'ing' आदि शामिल हो सकते हैं। इसके विपरीत यदि अक्षर 't' और 'h' उत्तर में हैं, लेकिन एक दूसरे के बगल में नहीं हैं, तो उन्हें प्रश्न में एक साथ रखना कठिन बना देता है; आपका मस्तिष्क स्वचालित रूप से उन में 'वें' के साथ शब्दों के बारे में सोचता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.