"गैर-पैथोलॉजिकल डेटा" का क्या अर्थ है?


14

मैंने कौरसेरा पर एक एल्गोरिदम क्लास ली। हैश टेबल के बारे में वीडियो में प्रोफेसर ने कहा कि

यह सच है कि गैर-पैथोलॉजिकल डेटा के लिए, आपको ठीक से कार्यान्वित हैश तालिका में निरंतर समय संचालन मिलेगा।

"गैर-पैथोलॉजिकल डेटा" का क्या अर्थ है? क्या आप कुछ उदाहरण दे सकते हैं?

जवाबों:


15

पैथोलॉजिकल डेटा को डेटा माना जाता है जो आपकी इच्छित गणना के लिए चीजों को किसी तरह से गलत बनाता है। जब वास्तविक उपयोग में यह काफी दुर्लभ है, तो इसे रोगविज्ञानी कहा जा सकता है, ताकि ज्यादातर समय चीजें ठीक रहें। इसे कभी-कभी गणितीय रूप से अधिक सटीक बनाया जा सकता है (उदाहरण के लिए संभावनाओं के साथ), लेकिन अक्सर अनौपचारिक में पैथोलॉजिकल शब्द का उपयोग।

उदाहरण के लिए, टमाटर का सलाद और केचप उत्कृष्ट भोजन हैं, पैथोलॉजिकल लोगों को छोड़कर, मतलब उन लोगों को जो टमाटर से एलर्जी हैं। यह वास्तव में कुछ मामलों में मार सकता है। लेकिन टमाटर से एलर्जी वाले लोग बहुत कम होते हैं, ताकि पैथोलॉजिकल मामलों को छोड़कर टमाटर के व्यंजन को उत्कृष्ट माना जाता है।

हे(n2)हे(nएलजीn)हे(nएलजीn)हे(एलजीn)हे(n) मर्ज सॉर्ट के लिए।

हे(n2)


1
एक तरफ एक तरफ के रूप में, यह भी महत्वपूर्ण हो सकता है कि मर्जर्ट स्थिर है जबकि एस्कॉर्ट नहीं है।
व्रजगिन

11

पैथोलॉजिकल डेटा वह डेटा है जो एल्गोरिदम को खराब करेगा। हैश टेबल के लिए, पैथोलॉजिकल डेटा डेटा है जो टकराव का कारण बनता है। यह निश्चित रूप से उपयोग किए जा रहे हैश फ़ंक्शन पर निर्भर करता है।

उदाहरण के लिए, यदि आपका हैश फ़ंक्शन वर्णों को एक साथ जोड़ता है hash("abcd") = 'a' + 'b' + 'c' + 'd':। तब पैथोलॉजिकल डेटा ऐसा दिखता है:

{"abcd", "dcba", "cbda", ...}"abcd"हैश का कोई भी क्रमांकन उसी स्थिति में होगा जिससे आप एक लिंक की गई सूची के साथ समाप्त हो जाएंगे जिसे आप पहली बार में टालने की कोशिश कर रहे थे।

गैर-पैथोलॉजिकल डेटा वह डेटा है जो पैथोलॉजिकल नहीं है।


-1

इसके बारे में सोचने का एक और तरीका: हैश कीज़ अलग "डिब्बे" की तरह होती हैं जिनमें डेटा होता है। एक उम्मीद / उम्मीद करेगा कि डेटा सभी डिब्बे के बीच समान रूप से वितरित किया जाता है, "संतुलित"। नॉनपैथोलॉजिकल डेटा के लिए प्रत्येक बिन में लगभग समान डेटा होता है। यदि डेटा पैथोलॉजिकल (पीटी कुंजी हैशिंग एल्गोरिथ्म) है, तो यह कम डिब्बे में सभी "बवासीर" है, और कुछ डिब्बे बहुत कम हैं। यह अक्षम है क्योंकि लुकअप समय बढ़ने पर (और दक्षता घट जाती है / एक अनसुलझी सूची को देखने के लिए परिवर्तित हो जाती है) जब डिब्बे बड़े होते हैं। ध्यान दें कि केवल प्रमुख हैशिंग एल्गोरिथ्म को बदलने से डेटा "पैथोलॉजिकल" से "नॉन पैथोलॉजिकल" या इसके विपरीत हो सकता है, इसलिए हैशिंग एल्गोरिथ्म का महत्व।

कई अन्य एल्गोरिदम भी हैं जिनके लिए "पैथोलॉजिकल बनाम नॉनपैथोलॉजिकल" का अंतर लागू किया जा सकता है, मूल रूप से "पैथोलॉजिकल" डेटा एल्गोरिथ्म को बदतर स्थिति में प्रदर्शन करता है (जैसे अवधारणा का उपयोग एल्गोरिदम को सॉर्ट करने के साथ भी किया जाता है)। जैसा कि आप इसकी एक सांख्यिकीय अवधारणा देख सकते हैं। उसी समस्या के लिए, डेटा जो एक एल्गोरिथ्म के लिए "पैथोलॉजिकल" है, दूसरे के लिए "पैथोलॉजिकल" नहीं हो सकता है। आदि।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.