अद्यतन: समस्या की जड़ यह है कि समय जटिलता प्राप्त करने के लिए, व्यक्ति को संग्रहण के क्रम में आवश्यकता होती है ।O(nlog(n))O(n)
नहीं, समय की जटिलता (देखें (1)) तत्व को सभी बीच चुनने के लिए कम सैद्धांतिक बाध्य है। संभव ।O(nlog(n))k t h n ( n - 1 )kthn(n−1)2|xi−xj|:1≤i<j≤n
आप स्थान प्राप्त कर सकते हैं , लेकिन केवल में सभी संयोजनों की जाँच करके । ।O(1)xi−xjO(n2)
अच्छी खबर यह है कि आप उपयोग कर सकते है पैमाने के आकलनकर्ता, समारोह में लागू (एक उन्नत संस्करण है और कुछ समय तुलना के लिए 2) और (3) को देखने के ()
में पैकेज । Univariate अनुमानक दो-चरण (अर्थात पुनः भारित) पैमाने का अनुमानक है। इसमें 95 प्रतिशत गॉसियन दक्षता, 50 प्रतिशत ब्रेकडाउन पॉइंट, और समय और स्थान की जटिलता है (साथ ही इसे आसानी से 'ऑनलाइन' बनाया जा सकता है, बार-बार उपयोग में आधी कम्प्यूटेशनल लागतों को हटा दिया जाता है - हालांकि आप इस विकल्प को लागू करने के लिए कोड में खोदना होगा , यह करने के लिए सीधा है)।ττ हे ( एन ) हे ( 1 )scaleTau2()RrobustbaseτO(n)O(1)R
- X + Y में चयन और रैंकिंग की जटिलता और सॉर्ट किए गए कॉलम जीएन फ्रेडरिकसन और डीबी जॉनसन, जर्नल ऑफ कंप्यूटर एंड सिस्टम साइंसेज वॉल्यूम 24, अंक 2, अप्रैल 1982, पृष्ठ 197-208 के साथ मैट्रिक।
- योहाई, वी। और ज़मार, आर (1988)। एक कुशल पैमाने को कम करने के माध्यम से प्रतिगमन के उच्च विखंडन बिंदु अनुमान। जर्नल ऑफ़ द अमेरिकन स्टेटिस्टिकल एसोसिएशन 83 406–413।
- मैरोना, आर। और ज़मार, आर। (2002)। उच्च-आयामी डेटा सेट के लिए स्थान और फैलाव का तेज अनुमान। टेक्नोमेट्रिक्स 44 307–317
इसका उपयोग करने के लिए संपादित करें
- फायर अप
R(यह मुफ़्त है और यहाँ से डाउनलोड किया जा सकता है )
- टाइप करके पैकेज स्थापित करें:
install.packages("robustbase")
- टाइप करके पैकेज लोड करें:
library("robustbase")
- अपनी डेटा फ़ाइल लोड करें और फ़ंक्शन चलाएँ:
mydatavector <- read.table("address to my file in text format", header=T)
scaleTau2(mydatavector)