यहाँ स्रोत से सीधे स्पष्टीकरण है (लगभग)
मिनट 22:03 पर
देखने योग्य!
मूल रूप से और Google के डगलस मेरिल पूर्व सीटीओ के अनुसार यह इस प्रकार है:
1) आप google में एक (गलत वर्तनी) शब्द लिखते हैं
2) आपको वह नहीं मिल रहा है जो आप चाहते थे (किसी भी परिणाम पर क्लिक न करें)
3) आप महसूस करते हैं कि आपने शब्द को गलत वर्तनी कर दिया है ताकि आप खोज बॉक्स में शब्द को फिर से लिखें।
4) आप जो चाहते हैं, वह पा लें (आप पहले लिंक में क्लिक करें)
यह पैटर्न लाखों गुना गुणा करता है, दिखाता है कि सबसे आम गलतियां क्या हैं और सबसे "सामान्य" सुधार क्या हैं।
इस तरह से Google लगभग तुरंत ही हर भाषा में वर्तनी सुधार प्रदान कर सकता है।
इसके अलावा इसका मतलब यह है कि अगर रात में हर कोई "निगथ" के रूप में रात को जादू करना शुरू कर देता है, तो Google इसके बजाय उस शब्द का सुझाव देगा।
संपादित करें
@ThomasRutter: डगलस ने इसे "सांख्यिकीय मशीन सीखने" के रूप में वर्णित किया है।
वे जानते हैं कि क्वेरी को कौन सही करता है, क्योंकि वे जानते हैं कि कौन सी क्वेरी किस उपयोगकर्ता से आती है (कुकीज़ का उपयोग करके)
यदि उपयोगकर्ता एक क्वेरी करते हैं, और केवल 10% उपयोगकर्ता परिणाम पर क्लिक करते हैं और 90% वापस जाते हैं और एक और क्वेरी टाइप करते हैं (सही शब्द के साथ) और इस बार 90% परिणाम पर क्लिक करते हैं, तो वे जानते हैं कि उन्होंने पाया है एक सुधार।
वे यह भी जान सकते हैं कि क्या वे दो अलग-अलग प्रश्नों के "संबंधित" हैं, क्योंकि उनके पास उनके द्वारा दिखाए गए सभी लिंक की जानकारी है।
इसके अलावा, वे अब वर्तनी जांच के संदर्भ में शामिल हैं, इसलिए वे संदर्भ के आधार पर अलग-अलग शब्द भी सुझा सकते हैं।
Google तरंग (@ 44m 06s) का यह डेमो देखें कि वर्तनी को स्वचालित रूप से ठीक करने के लिए संदर्भ को कैसे लिया जाता है।
यहाँ यह समझाया गया है कि प्राकृतिक भाषा प्रसंस्करण कैसे काम करता है।
और अंत में यहाँ एक भयानक डेमो है जो मिश्रण में स्वचालित मशीन अनुवाद (@ 1h 12m 47s) जोड़कर किया जा सकता है ।
मैंने वीडियो पर सीधे मिनट और सेकंड के एंकर को कंटेंट पर छोड़ दिया है, अगर वे काम नहीं करते हैं, तो पृष्ठ को फिर से लोड करने या हाथ से स्क्रॉल करने की कोशिश करें।