Google "क्या आपका मतलब है?" एल्गोरिथम काम?

436

मैं एक पोर्टफोलियो प्रबंधन उपकरण के लिए एक आंतरिक वेबसाइट विकसित कर रहा हूं। बहुत सारे पाठ डेटा, कंपनी के नाम आदि हैं। मैं वास्तव में कुछ खोज इंजन की क्षमता से बहुत प्रभावित हुआ हूं, "क्या आपका मतलब है: xxxx"।

मुझे समझदारी से एक उपयोगकर्ता क्वेरी लेने में सक्षम होना चाहिए और न केवल कच्चे खोज परिणामों के साथ, बल्कि "क्या आपका मतलब है?" प्रतिक्रिया जब एक उच्च संभावना वैकल्पिक उत्तर आदि है

[मैं ASP.NET में विकास कर रहा हूँ (VB - इसे मेरे खिलाफ मत पकड़ो!)]

अद्यतन: ठीक है, मैं लाखों 'अवैतनिक उपयोगकर्ताओं' के बिना इसकी नकल कैसे कर सकता हूं?

प्रत्येक 'ज्ञात' या 'सही' शब्द के लिए टाइप करें और लुकअप करें?
कुछ और अधिक सुरुचिपूर्ण विधि?

— एंड्रयू हैरी
स्रोत

1

यहां नॉरविग स्पेलिंग करेक्टर का VB.NET वर्जन है। यदि आपको बहुत देर नहीं हुई है तो आपको यह उपयोगी लग सकता है!

— राल्फ विगगम

7

आप एक "क्या आपका मतलब था"

— कर्ट मैककी

मैं एक गैर-qwerty कीबोर्ड (Colemak) पर टाइप करता हूं और यह फीचर आधा नहीं है। यह निश्चित रूप से दर्ज की गई गलती-सुधार जोड़े से सीखता है और इस प्रकार क्वर्टी के साथ जुड़ा हुआ है। साधारण वर्तनी परीक्षक मेरे कीबोर्ड के लिए ठीक काम करते हैं, जैसा कि अपेक्षित है - स्ट्रिंग संपादित दूरी लेआउट-अपरिवर्तनीय है।

— कर्नल पैनिक

366

यहाँ स्रोत से सीधे स्पष्टीकरण है (लगभग)

101 खोजें!

मिनट 22:03 पर

देखने योग्य!

मूल रूप से और Google के डगलस मेरिल पूर्व सीटीओ के अनुसार यह इस प्रकार है:

1) आप google में एक (गलत वर्तनी) शब्द लिखते हैं

2) आपको वह नहीं मिल रहा है जो आप चाहते थे (किसी भी परिणाम पर क्लिक न करें)

3) आप महसूस करते हैं कि आपने शब्द को गलत वर्तनी कर दिया है ताकि आप खोज बॉक्स में शब्द को फिर से लिखें।

4) आप जो चाहते हैं, वह पा लें (आप पहले लिंक में क्लिक करें)

यह पैटर्न लाखों गुना गुणा करता है, दिखाता है कि सबसे आम गलतियां क्या हैं और सबसे "सामान्य" सुधार क्या हैं।

इस तरह से Google लगभग तुरंत ही हर भाषा में वर्तनी सुधार प्रदान कर सकता है।

इसके अलावा इसका मतलब यह है कि अगर रात में हर कोई "निगथ" के रूप में रात को जादू करना शुरू कर देता है, तो Google इसके बजाय उस शब्द का सुझाव देगा।

संपादित करें

@ThomasRutter: डगलस ने इसे "सांख्यिकीय मशीन सीखने" के रूप में वर्णित किया है।

वे जानते हैं कि क्वेरी को कौन सही करता है, क्योंकि वे जानते हैं कि कौन सी क्वेरी किस उपयोगकर्ता से आती है (कुकीज़ का उपयोग करके)

यदि उपयोगकर्ता एक क्वेरी करते हैं, और केवल 10% उपयोगकर्ता परिणाम पर क्लिक करते हैं और 90% वापस जाते हैं और एक और क्वेरी टाइप करते हैं (सही शब्द के साथ) और इस बार 90% परिणाम पर क्लिक करते हैं, तो वे जानते हैं कि उन्होंने पाया है एक सुधार।

वे यह भी जान सकते हैं कि क्या वे दो अलग-अलग प्रश्नों के "संबंधित" हैं, क्योंकि उनके पास उनके द्वारा दिखाए गए सभी लिंक की जानकारी है।

इसके अलावा, वे अब वर्तनी जांच के संदर्भ में शामिल हैं, इसलिए वे संदर्भ के आधार पर अलग-अलग शब्द भी सुझा सकते हैं।

Google तरंग (@ 44m 06s) का यह डेमो देखें कि वर्तनी को स्वचालित रूप से ठीक करने के लिए संदर्भ को कैसे लिया जाता है।

यहाँ यह समझाया गया है कि प्राकृतिक भाषा प्रसंस्करण कैसे काम करता है।

और अंत में यहाँ एक भयानक डेमो है जो मिश्रण में स्वचालित मशीन अनुवाद (@ 1h 12m 47s) जोड़कर किया जा सकता है ।

_{मैंने वीडियो पर सीधे मिनट और सेकंड के एंकर को कंटेंट पर छोड़ दिया है, अगर वे काम नहीं करते हैं, तो पृष्ठ को फिर से लोड करने या हाथ से स्क्रॉल करने की कोशिश करें।}

— OscarRyz
स्रोत

हालांकि एल्गोरिथ्म कैसे काम करता है? Google "हम विभिन्न शर्तों के साथ अरबों खोजें कैसे प्राप्त करते हैं, और ये वो खोजें हैं" से लेकर "यह शब्द इसलिए इस शब्द की एक सामान्य वर्तनी होनी चाहिए"? उन्होंने इस समस्या को हल कर लिया है, लेकिन मुझे इसमें दिलचस्पी है। वे कैसे पता लगाते हैं कि दो खोजें एक ही उपयोगकर्ता से हैं, और कौन सा शब्द दूसरे का 'सुधार' है, और वे इसे अरबों खोजों पर कैसे एकत्रित करते हैं?

— थोमसट्रेटर

51

यदि सभी ने "रात" को मिस करना शुरू कर दिया ... मेरा मानना है कि वे पहले से ही "फ़्लिकर" की खोज कर रहे लोगों के साथ इसमें भाग गए थे।

— मैक्स लिबर्ट रॉबर्ट

42

किसी को कुछ मिस करने की समस्या पहले से ही बहुत अधिक गंभीर अर्थों में हो चुकी है: Google में 'फ्यूशिया' टाइप करने का प्रयास करें। Google कहता है "क्या आपका मतलब फ्यूशिया है?" सही वर्तनी, वास्तव में, "फुकिया" है, लेकिन कोई भी किसी कारण से इसे सही ढंग से नहीं लिख सकता है। Dictionary.com पर समस्या और भी बदतर है; यदि आप उनकी खोज में "फ्यूशिया" टाइप करते हैं, तो यह आपको "फ्यूशिया के लिए कोई परिणाम नहीं देता है। क्या आपका मतलब 'फ्यूशिया' है?" (यानी, क्या आपका मतलब है जो आपने अभी टाइप किया है?)

— डेज़ी सोफिया होल्मैन

8

मुझे विश्वास नहीं है कि वे केवल गलत वर्तनी डेटा का उपयोग करते हैं - निश्चित रूप से कुछ लेवेन्शिन दूरी या इसी तरह चल रही है - 'प्लैक' (और एक या अधिक अन्य शब्द) की खोज करें और यह हमेशा 'ब्लैक' के लिए सही हो जाता है, जो बहुत ही संभावना नहीं है / टाइपो

— प्लसप्लस

4

@ याकूब मुझे लगता है कि उन्होंने समस्या को ठीक कर दिया है क्योंकि मैंने 4 साल पहले वह टिप्पणी की थी। दरअसल, गूगल ने भी इस समस्या को ठीक कर दिया है। फ्यूशिया की खोज में फ्यूशिया के परिणाम स्वतः ही शामिल हो जाते हैं।

— डेजी सोफिया हॉलमैन

104

मुझे यह लेख कुछ समय पहले मिला था: पीटर नॉर्विग (Google इंक में अनुसंधान के निदेशक) द्वारा लिखित स्पेलिंग करेक्टर कैसे लिखें ।

यह "वर्तनी सुधार" विषय के बारे में एक दिलचस्प पढ़ा है। उदाहरण पायथन में हैं, लेकिन यह स्पष्ट और समझने में सरल है, और मुझे लगता है कि एल्गोरिथ्म को आसानी से अन्य भाषाओं में अनुवाद किया जा सकता है।

नीचे एल्गोरिथ्म का संक्षिप्त विवरण निम्नानुसार है। एल्गोरिथ्म में दो चरण होते हैं, तैयारी और शब्द जाँच।

चरण 1: तैयारी - शब्द डेटाबेस की स्थापना

सबसे अच्छा है अगर आप वास्तविक खोज शब्दों और उनकी घटना का उपयोग कर सकते हैं। यदि आपके पास नहीं है कि पाठ का एक बड़ा सेट इसके बजाय उपयोग किया जा सकता है। प्रत्येक शब्द की घटना (लोकप्रियता) की गणना करें।

चरण 2. वर्ड चेकिंग - उन शब्दों को ढूंढना जो चेक किए गए के समान हैं

इसी तरह का अर्थ है कि संपादित दूरी कम है (आमतौर पर 0-1 या 0-2)। संपादित दूरी एक शब्द को दूसरे में बदलने के लिए आवश्यक आवेषण / विलोप / परिवर्तन / स्वैप की न्यूनतम संख्या है।

पिछले चरण से सबसे लोकप्रिय शब्द चुनें और इसे सुधार के रूप में सुझाव दें (यदि शब्द के अलावा अन्य)।

— डेविड गुआलानो
स्रोत

6

@ डेविड: "" "उदाहरण अजगर में हैं, लेकिन यह स्पष्ट और समझने में सरल है" ":" मैं आपके उपयोग को नहीं समझता "लेकिन" ... मैं कहूंगा कि पायथन + नॉर्विग की लेखन शैली, "स्पष्ट" समझने के लिए सरल "अपेक्षित परिणाम है।

— जॉन मैकिन

20

"लेकिन" वहां था क्योंकि हैरी ने अपने प्रश्न में कहा था कि वह एक VB.NET डेवलपर है, इसलिए मैंने माना कि वह अजगर की भाषा के साथ आश्वस्त नहीं था।

— डेविड गुआलानो

56

"क्या आपका मतलब है" एल्गोरिथ्म के सिद्धांत के लिए आप सूचना पुनर्प्राप्ति के लिए परिचय के अध्याय 3 का उल्लेख कर सकते हैं। यह मुफ्त में ऑनलाइन उपलब्ध है । अनुभाग 3.3 (पृष्ठ 52) आपके प्रश्न का सटीक उत्तर देता है। और विशेष रूप से आपके अपडेट का जवाब देने के लिए आपको केवल शब्दों के शब्दकोश की आवश्यकता है और कुछ और नहीं (लाखों उपयोगकर्ताओं सहित)।

— सजरे दियारी
स्रोत

10

हम्म ... मैंने सोचा था कि Google ने कुछ गंभीर एनएलपी (प्राकृतिक भाषा प्रसंस्करण) करने के लिए डेटा (इंटरनेट) के अपने विशाल कोष का उपयोग किया।

उदाहरण के लिए, उनके पास पूरे इंटरनेट से इतना अधिक डेटा है कि वे तीन-शब्द अनुक्रम की संख्या की गणना कर सकते हैं (एक ट्रिगर के रूप में जाना जाता है )। इसलिए अगर उन्हें एक वाक्य दिखाई देता है जैसे: "गुलाबी फ्रुगर कॉन्सर्ट", तो वे देख सकते हैं कि इसमें कुछ हिट हैं, फिर उनके कॉरपस में "गुलाबी" कॉन्सर्ट की सबसे अधिक संभावना है।

वे जाहिरा तौर पर सिर्फ एक बदलाव करते हैं कि डेविड गुआलानो क्या कह रहे थे, हालांकि, उस लिंक को जरूर पढ़ें। Google निश्चित रूप से उन सभी वेब-पृष्ठों का उपयोग करता है, जिन्हें वह कॉर्पस के रूप में जानता है, ताकि उसका एल्गोरिथ्म विशेष रूप से प्रभावी हो।

— Claudiu
स्रोत

7

मेरा अनुमान है कि वे एक लेवेन्शेटिन दूरी एल्गोरिथ्म के संयोजन का उपयोग करते हैं और डेटा के द्रव्यमान जो वे चलाए गए खोजों के संबंध में एकत्र करते हैं। वे उन खोजों का एक समूह खींच सकते हैं जिनके पास दर्ज किए गए खोज स्ट्रिंग से सबसे कम लेवेंसहाइट दूरी है, फिर सबसे अधिक परिणामों के साथ एक को चुनें।

— जिम बर्गर
स्रोत

6

मान लें कि आपके पास कुल अरबों वेब पेजों के लायक शब्द संग्रहीत हैं। लेवेंसहिन की गणना के बिना पास के मैचों की तेजी से पुनर्प्राप्ति के लिए लेवेन्सहाइट दूरी को अनुक्रमित करने का कोई आसान तरीका नहीं है, जो हर शब्द के लिए कुछ अरबों की दूरी तय करता है। इसलिए लेवेंशेटिन की दूरी इस स्थिति में अधिक उपयोग की नहीं है, कम से कम पहले चरण में नहीं, जहां Google को मौजूदा शब्दों के अरबों से केवल उन शब्दों तक संकीर्ण होने की आवश्यकता है जो वर्तमान शब्द के गलत वर्तनी होने की संभावना है। यह निश्चित रूप से लेवेंसाइटिन को बाद के चरण के रूप में लागू कर सकता है, क्योंकि यह पहले से ही संभावित मैचों को प्राप्त कर चुका है।

— थोमसट्रेटर

6

आम तौर पर एक उत्पादन वर्तनी सुधारक एक वर्तनी सुझाव प्रदान करने के लिए कई तरीकों का उपयोग करता है। कुछ हैं:

वर्तनी सुधार की आवश्यकता है या नहीं यह निर्धारित करने के तरीके पर निर्णय लें। इनमें अपर्याप्त परिणाम शामिल हो सकते हैं, परिणाम जो विशिष्ट या सटीक पर्याप्त नहीं हैं (कुछ उपाय के अनुसार), आदि। फिर:
पाठ या शब्दकोश के एक बड़े निकाय का उपयोग करें, जहां सभी, या अधिकांश को सही ढंग से वर्तनी के लिए जाना जाता है। लिंगपाइप जैसी जगहों पर ये आसानी से ऑनलाइन मिल जाते हैं । फिर सबसे अच्छा सुझाव निर्धारित करने के लिए आप एक शब्द की तलाश करें जो कई उपायों के आधार पर निकटतम मैच है। सबसे सहज एक जैसा चरित्र है। अनुसंधान और प्रयोग के माध्यम से जो दिखाया गया है वह यह है कि दो या तीन चरित्र अनुक्रम मैच बेहतर काम करते हैं। (bigrams और चलाता है)। परिणामों को और बेहतर बनाने के लिए, शब्द के आरंभ या अंत में एक मैच पर एक उच्च स्कोर का वजन करें। प्रदर्शन कारणों के लिए, इन सभी शब्दों को ट्रिगर्स या बिगोग्राम्स के रूप में अनुक्रमित करें, ताकि जब आप लुकअप कर रहे हों, तो आप एन-ग्राम में कनवर्ट करें, और हैशटेबल या ट्राइ के माध्यम से देखें।
चरित्र स्थान के आधार पर संभावित कीबोर्ड गलतियों से संबंधित अनुमानों का उपयोग करें। ताकि "हेल्लो" "हेलो" हो, क्योंकि 'डब्ल्यू' 'ई' के करीब है।
शब्दों को अनुक्रमित करने और संभावित सुधार देखने के लिए एक ध्वन्यात्मक कुंजी (साउंडेक्स, मेटाफोन) का उपयोग करें। व्यवहार में, यह आमतौर पर एन-ग्राम इंडेक्सिंग का उपयोग करने की तुलना में बदतर परिणाम देता है, जैसा कि ऊपर वर्णित है।
प्रत्येक मामले में आपको एक सूची में से सबसे अच्छा सुधार चुनना होगा। यह एक दूरी की मीट्रिक हो सकती है जैसे कि लेवेन्शिन, कीबोर्ड मीट्रिक आदि।
बहु-शब्द वाक्यांश के लिए, केवल एक शब्द को गलत वर्तनी दी जा सकती है, जिस स्थिति में आप एक सर्वश्रेष्ठ मैच का निर्धारण करने में संदर्भ के रूप में शेष शब्दों का उपयोग कर सकते हैं।

— eulerfx
स्रोत

6

Levenshtein दूरी का उपयोग करें , फिर शब्दों को अनुक्रमित करने के लिए एक मीट्रिक ट्री (या पतला पेड़) बनाएं। फिर 1-निकटतम पड़ोसी क्वेरी चलाएँ, और आपको परिणाम मिला।

— निकोलस डोरिएर
स्रोत

4

Google स्पष्ट रूप से सर्वोत्तम परिणामों के साथ प्रश्नों का सुझाव देता है, न कि उन लोगों के साथ जो सही ढंग से वर्तनी हैं। लेकिन इस मामले में, शायद एक वर्तनी-सुधारक अधिक संभव होगा, निश्चित रूप से आप प्रत्येक क्वेरी के लिए कुछ मूल्य संग्रहीत कर सकते हैं, कुछ मीट्रिक के आधार पर कि यह कितने अच्छे परिणाम देता है।

इसलिए,

आपको एक शब्दकोश की आवश्यकता है (अंग्रेजी या आपके डेटा पर आधारित)
एक शब्द ट्रेले उत्पन्न करें और अपने शब्दकोश का उपयोग करके बदलाव के लिए संभावनाओं की गणना करें।
अपने ट्रेलिस का उपयोग करके न्यूनतम त्रुटि दूरी की गणना करने के लिए एक डिकोडर जोड़ें। निश्चित रूप से आपको दूरी की गणना करते समय सम्मिलन और विलोपन का ध्यान रखना चाहिए। मज़े की बात यह है कि QWERTY कीबोर्ड दूरी को अधिकतम करता है यदि आप एक दूसरे के करीब चाबियाँ मारते हैं (सीए कार घुमाएगा, कै बिल्ली चालू होगा)
उस शब्द को वापस करें जिसमें न्यूनतम दूरी हो।
फिर आप अपने क्वेरी डेटाबेस से तुलना कर सकते हैं और जांच सकते हैं कि अन्य करीबी मैचों के लिए बेहतर परिणाम है या नहीं।

— Geee
स्रोत

4

यहाँ मुझे सबसे अच्छा जवाब मिला , वर्तनी सुधारक को Google के अनुसंधान निदेशक पीटर नॉरविग द्वारा कार्यान्वित और वर्णित किया गया।

यदि आप इसके पीछे के सिद्धांत के बारे में अधिक पढ़ना चाहते हैं, तो आप उनके पुस्तक अध्याय को पढ़ सकते हैं ।

इस एल्गोरिथ्म का विचार सांख्यिकीय मशीन सीखने पर आधारित है।

— अजीज आल्टो
स्रोत

3

मैंने कुछ साल पहले इस पर कुछ देखा था, इसलिए तब से बदल गया हो सकता है, लेकिन जाहिर है कि उन्होंने इसे उसी समय के उपयोगकर्ताओं के लिए अपने लॉग का विश्लेषण करके शुरू किया था, जो बहुत कम समय में बहुत ही समान प्रश्न प्रस्तुत करते थे, और उपयोगकर्ताओं द्वारा कैसे सही किया गया था, इसके आधार पर मशीन सीखने का इस्तेमाल किया खुद को।

— seanb
स्रोत

3

एक अनुमान के रूप में ... यह कर सकता था

शब्दों के लिए खोजें
यदि यह नहीं पाया जाता है तो कुछ एल्गोरिथ्म का उपयोग करके शब्द को "अनुमान" लगाने की कोशिश करें।

एआई से कुछ हो सकता है जैसे होपफील्ड नेटवर्क या बैक प्रोपोगेशन नेटवर्क, या कुछ और "उंगलियों के निशान की पहचान", टूटे हुए डेटा को पुनर्स्थापित करना, या पहले से ही बताए गए डेविड के रूप में सुधारों की वर्तनी ...

— पॉल कपुस्टिन
स्रोत

2

सरल। उनके पास टन डेटा है। उनके पास हर संभव अवधि के लिए आँकड़े हैं, यह कितनी बार क्वेरी की जाती है, और इसके विभिन्न रूपों के कारण आमतौर पर उपयोगकर्ता क्लिक करते हैं ... इसलिए, जब वे देखते हैं कि आप एक खोज शब्द के लिए लगातार गलत वर्तनी टाइप करते हैं, तो वे आगे बढ़ते हैं और प्रस्ताव करते हैं। अधिक सामान्य उत्तर।

वास्तव में, अगर गलत वर्तनी सबसे अधिक बार खोजे गए शब्द के प्रभाव में है, तो एलगोरिथम इसे सही के लिए ले जाएगा।

— schonarth
स्रोत

1

किसी ने भी संदेह नहीं किया है कि Google के पास ऐसा करने के लिए सभी आवश्यक डेटा हैं, लेकिन सवाल यह था कि Google उचित समय में, इतने डेटा के साथ ऐसा करने के लिए एल्गोरिदम के साथ कैसे आया है। उनके पास एक दिन में खोज के राजपत्र होते हैं - वे आसानी से कैसे पहचानते हैं कि क्या खोज शब्द दूसरे की 'वर्तनी सुधार' है? Google क्या कारक तय करता है कि एक शब्द दूसरे की गलत वर्तनी है? ये कार्यान्वयन विवरण हैं जो ब्याज के होंगे।

— थोमसट्रेटर

2

आपके प्रश्न के बारे में टन के डेटा के बिना व्यवहार की नकल कैसे करें - Google द्वारा एकत्र किए गए टन डेटा का उपयोग क्यों नहीं करें? HTML शब्द गलत वर्तनी वाले शब्द के लिए डाउनलोड करें और HTML में "क्या आपका मतलब है:" खोजें।

मुझे लगता है कि आजकल मैशप कहा जाता है :-)

— टॉमस पेट्रिसक
स्रोत

जब तक Google आपके बॉट को खुरचने से रोकता है? - या Google भी इन दिनों नोटिस नहीं करेगा?

— एंड्रयू हैरी

मुझे नहीं लगता कि अगर रेक्स / सेकंड बहुत अधिक नहीं हैं तो वे नोटिस करेंगे।

— मौरिसियो शेफ़र

2

उपरोक्त उत्तरों के अलावा, यदि आप किसी चीज को अपने आप से जल्दी से लागू करना चाहते हैं, तो यहां एक सुझाव है -

कलन विधि

आप GitHub पर इस एल्गोरिथ्म के कार्यान्वयन और विस्तृत दस्तावेज पा सकते हैं ।

एक तुलनित्र के साथ एक प्राथमिकता कतार बनाएँ।
टरने सर्च ट्री बनाएं और उनकी आवृत्तियों के साथ सभी अंग्रेजी शब्दों ( नॉरविग पोस्ट से ) डालें ।
TST को ट्रेस करना शुरू करें और TST में आने वाले प्रत्येक शब्द के लिए, इनपुट लेवर्ड से इसकी लेवेन्शिन दूरी ( LD ) की गणना करें
यदि LD ue 3 है तो इसे प्राथमिकता कतार में रखें।
अंतिम समय पर प्राथमिकता कतार और प्रदर्शन से 10 शब्द निकालें।

— amarjeetAnand
स्रोत

1

आपका मतलब वर्तनी जाँचक है? अगर यह पूरे वाक्यांश के बजाय एक वर्तनी परीक्षक है तो मुझे वर्तनी जाँच के बारे में एक लिंक मिल गया है जहाँ एल्गोरिथम को अजगर में विकसित किया गया है। चेक इस लिंक

इस बीच, मैं प्रोजेक्ट पर भी काम कर रहा हूं जिसमें पाठ का उपयोग करके डेटाबेस खोजना शामिल है। मुझे लगता है कि इससे आपकी समस्या दूर हो जाएगी

— जिमित पटेल
स्रोत

1

यह एक पुराना सवाल है, और मुझे आश्चर्य है कि किसी ने भी अपाचे सोलर का उपयोग करते हुए ओपी का सुझाव नहीं दिया।

अपाचे सोलर एक पूर्ण पाठ खोज इंजन है जो कई अन्य कार्यक्षमता के अलावा वर्तनी जांच या क्वेरी सुझाव भी प्रदान करता है। से प्रलेखन :

डिफ़ॉल्ट रूप से, ल्यूसिन स्पेल चेकर्स स्ट्रिंग दूरी की गणना से स्कोर द्वारा पहले और दूसरे को सूचकांक में सुझाव की आवृत्ति (यदि उपलब्ध हो) द्वारा सॉर्ट करते हैं।

— जोसेप वाल्स
स्रोत

0

एक विशिष्ट डेटा संरचना है - टर्नरी खोज पेड़ - जो स्वाभाविक रूप से आंशिक मैचों और निकट-पड़ोसी मैचों का समर्थन करता है।

-1

यह पता लगाने का सबसे आसान तरीका Google डायनेमिक प्रोग्रामिंग है।

यह एक एल्गोरिथ्म है जिसे सूचना पुनर्प्राप्ति से उधार लिया गया है और यह देखने के लिए आधुनिक दिन जैव सूचना विज्ञान में बहुत अधिक उपयोग किया जाता है कि यह देखने के लिए कि दो जीन क्रम कितने अनुकरणीय हैं।

इष्टतम समाधान गतिशील प्रोग्रामिंग और पुनरावृत्ति का उपयोग करता है।

यह बहुत सारे समाधानों के साथ एक बहुत ही हल की गई समस्या है। जब तक आपको कुछ ओपन सोर्स कोड नहीं मिल जाता है, तब तक Google के आसपास रहें।

— ewakened
स्रोत