मैंने नीचे सूचीबद्ध संदर्भों को पढ़ने से अपने इंप्रेशन के आधार पर दूरी कोवरियन पर कुछ टिप्पणी एकत्र करने की कोशिश की है। हालांकि, मैं खुद को इस विषय का विशेषज्ञ नहीं मानता। टिप्पणियाँ, सुधार, सुझाव, आदि का स्वागत है।
टिप्पणी मूल प्रश्न में अनुरोध के अनुसार संभावित कमियों के प्रति (दृढ़ता से) पक्षपाती हैं ।
जैसा कि मैंने देखा, संभावित कमियां इस प्रकार हैं:
- कार्यप्रणाली नई है । मेरा अनुमान है कि इस समय लोकप्रियता की कमी के बारे में यह एकमात्र सबसे बड़ा कारक है। दूरी कोविरेंस को रेखांकित करने वाले कागजात 2000 के दशक के मध्य में शुरू होते हैं और वर्तमान दिन तक प्रगति करते हैं। ऊपर उद्धृत किया गया पेपर वह है जिसे सबसे अधिक ध्यान दिया गया था (प्रचार?) और यह तीन साल से कम है। इसके विपरीत, सिद्धांत और सहसंबंध और सहसंबंध जैसे उपायों का परिणाम उनके पीछे पहले से ही काम की एक सदी से अधिक है।
- मूल अवधारणाएं अधिक चुनौतीपूर्ण हैं । पियर्सन के उत्पाद-क्षण सहसंबंध, एक परिचालन स्तर पर, कॉलेज के फ्रेशमैन को बहुत आसानी से कैलकुलस बैकग्राउंड के बिना समझाया जा सकता है। एक सरल "एल्गोरिथम" के दृष्टिकोण को निर्धारित किया जा सकता है और ज्यामितीय अंतर्ज्ञान का वर्णन करना आसान है। इसके विपरीत, दूरी सहसंयोजक के मामले में, यहां तक कि युग्मक यूक्लिडियन उत्पादों के उत्पादों की धारणा काफी अधिक कठिन है और एक स्टोकेस्टिक प्रक्रिया के संबंध में सहसंयोजक की धारणा इस तरह के दर्शकों को यथोचित रूप से समझाया जा सकता है। ।
- यह कम्प्यूटेशनल रूप से अधिक मांग है । मानक सांख्यिकीय मेट्रिक्स के लिए O ( n ) के विपरीत नमूने के आकार में परीक्षण आँकड़ा की गणना के लिए मूल एल्गोरिथ्म है । छोटे नमूने के आकार के लिए यह एक बड़ी बात नहीं है, लेकिन बड़े लोगों के लिए यह अधिक महत्वपूर्ण हो जाता है।O(n2)O(n)
- परीक्षण आँकड़ा वितरण मुक्त नहीं है, यहाँ तक कि स्पर्शोन्मुख भी नहीं है । कोई उम्मीद कर सकता है कि एक परीक्षण सांख्यिकीय के लिए जो सभी विकल्पों के अनुरूप है, यह है कि वितरण - कम से कम स्पर्शोन्मुख - शून्य परिकल्पना के तहत और वाई के अंतर्निहित वितरण से स्वतंत्र हो सकता है। दूरी covariance के लिए यह मामला नहीं है क्योंकि अशक्त के तहत वितरण एक्स और वाई के अंतर्निहित वितरण पर निर्भर करता है, यहां तक कि नमूना आकार अनन्तता के लिए जाता है। यह है सच है कि वितरण समान रूप से एक से घिरा रहे हैं χ 2 1 वितरण, जो एक की गणना के लिए अनुमति देता है रूढ़िवादी महत्वपूर्ण मान।XYXYχ21
- दूरी सहसंबंध एक-से-एक परिवर्तन है सामान्य मामले में|ρ| । यह वास्तव में एक खामी नहीं है, और इसे एक ताकत के रूप में भी देखा जा सकता है। लेकिन, यदि कोई डेटा को एक द्विभाजित सामान्य सन्निकटन स्वीकार करता है, जो व्यवहार में काफी सामान्य हो सकता है, तो मानक प्रक्रियाओं के स्थान पर दूरी सहसंबंध का उपयोग करने से कुछ भी प्राप्त होता है।
- अज्ञात शक्ति गुण । सभी विकल्पों के खिलाफ सुसंगत होना अनिवार्य रूप से गारंटी देता है कि दूरी के सहसंयोजक के पास कुछ विकल्पों के खिलाफ बहुत कम शक्ति होनी चाहिए। कई मामलों में, कोई व्यक्ति ब्याज के विशेष विकल्पों के खिलाफ अतिरिक्त शक्ति प्राप्त करने के लिए सामान्यता को छोड़ने के लिए तैयार है। मूल कागजात कुछ उदाहरण दिखाते हैं जिसमें वे मानक सहसंबंध मेट्रिक्स के सापेक्ष उच्च शक्ति का दावा करते हैं, लेकिन मेरा मानना है कि, ऊपर (1.) ऊपर जा रहा है, इसके विकल्प के खिलाफ व्यवहार अभी तक अच्छी तरह से समझा नहीं गया है।
दोहराना करने के लिए, यह उत्तर संभवतः काफी नकारात्मक है। लेकिन, वह मंशा नहीं है। दूरी सहसंयोजक से संबंधित कुछ बहुत ही सुंदर और दिलचस्प विचार हैं और इसके सापेक्ष नवीनता भी इसे और अधिक पूरी तरह से समझने के लिए अनुसंधान के रास्ते खोलती है।
संदर्भ :
- जीजे स्ज़ेकली और एमएल रिज़ो (2009), ब्राउनियन दूरी सहसंयोजक , एन। Appl। सांख्यिकीविद। , वॉल्यूम। 3, नहीं। 4, 1236–1265।
- जीजे स्ज़ेकली, एमएल रिज़ो और एनके बकरोव (2007), दूरी के सहसंबंध द्वारा स्वतंत्रता की माप और परीक्षण , एन। सांख्यिकीविद। , वॉल्यूम। 35, 2769–2794।
- आर। ल्योंस (2012), मीट्रिक रिक्त स्थान में दूरी सहसंयोजक ,
एन। Probab। (उपस्थित होना)।