अद्यतन: समस्या की जड़ यह है कि समय जटिलता प्राप्त करने के लिए, व्यक्ति को संग्रहण के क्रम में आवश्यकता होती है ।O(nlog(n))O(n)
नहीं, समय की जटिलता (देखें (1)) तत्व को सभी बीच चुनने के लिए कम सैद्धांतिक बाध्य है। संभव ।O(nlog(n))k t h n ( n - 1 )kthn(n−1)2|xi−xj|:1≤i<j≤n
आप स्थान प्राप्त कर सकते हैं , लेकिन केवल में सभी संयोजनों की जाँच करके । ।O(1)xi−xjO(n2)
अच्छी खबर यह है कि आप उपयोग कर सकते है पैमाने के आकलनकर्ता, समारोह में लागू (एक उन्नत संस्करण है और कुछ समय तुलना के लिए 2) और (3) को देखने के ()
में पैकेज । Univariate अनुमानक दो-चरण (अर्थात पुनः भारित) पैमाने का अनुमानक है। इसमें 95 प्रतिशत गॉसियन दक्षता, 50 प्रतिशत ब्रेकडाउन पॉइंट, और समय और स्थान की जटिलता है (साथ ही इसे आसानी से 'ऑनलाइन' बनाया जा सकता है, बार-बार उपयोग में आधी कम्प्यूटेशनल लागतों को हटा दिया जाता है - हालांकि आप इस विकल्प को लागू करने के लिए कोड में खोदना होगा , यह करने के लिए सीधा है)।ττ हे ( एन ) हे ( 1 )scaleTau2()
R
robustbase
τO(n)O(1)R
- X + Y में चयन और रैंकिंग की जटिलता और सॉर्ट किए गए कॉलम जीएन फ्रेडरिकसन और डीबी जॉनसन, जर्नल ऑफ कंप्यूटर एंड सिस्टम साइंसेज वॉल्यूम 24, अंक 2, अप्रैल 1982, पृष्ठ 197-208 के साथ मैट्रिक।
- योहाई, वी। और ज़मार, आर (1988)। एक कुशल पैमाने को कम करने के माध्यम से प्रतिगमन के उच्च विखंडन बिंदु अनुमान। जर्नल ऑफ़ द अमेरिकन स्टेटिस्टिकल एसोसिएशन 83 406–413।
- मैरोना, आर। और ज़मार, आर। (2002)। उच्च-आयामी डेटा सेट के लिए स्थान और फैलाव का तेज अनुमान। टेक्नोमेट्रिक्स 44 307–317
इसका उपयोग करने के लिए संपादित करें
- फायर अप
R
(यह मुफ़्त है और यहाँ से डाउनलोड किया जा सकता है )
- टाइप करके पैकेज स्थापित करें:
install.packages("robustbase")
- टाइप करके पैकेज लोड करें:
library("robustbase")
- अपनी डेटा फ़ाइल लोड करें और फ़ंक्शन चलाएँ:
mydatavector <- read.table("address to my file in text format", header=T)
scaleTau2(mydatavector)