मैं दो यादृच्छिक चर के कोवरियन को बेहतर तरीके से समझने और समझने की कोशिश कर रहा था कि कैसे पहले व्यक्ति ने इसके बारे में सोचा था, जो परिभाषा में नियमित रूप से सांख्यिकी में उपयोग किया जाता है। मैं इसे बेहतर समझने के लिए विकिपीडिया पर गया । लेख से, ऐसा लगता है कि लिए अच्छे उम्मीदवार माप या मात्रा में निम्नलिखित गुण होने चाहिए:
- जब दो यादृच्छिक चर समान होते हैं (यानी जब एक दूसरे को बढ़ाता है और जब एक घटता है तो दूसरा भी करता है) यह एक सकारात्मक संकेत है।
- हम यह भी चाहते हैं कि यह एक नकारात्मक संकेत हो जब दो यादृच्छिक चर समान रूप से समान हों (जैसे जब एक और यादृच्छिक चर घटता है तो बढ़ जाता है)
- अंत में, हम चाहते हैं कि यह कोवरिश मात्रा शून्य हो (या शायद बहुत छोटी?) जब दो चर एक दूसरे से स्वतंत्र होते हैं (अर्थात वे एक-दूसरे के संबंध में भिन्न नहीं होते हैं)।
उपरोक्त गुणों से, हम को परिभाषित करना चाहते हैं । मेरा पहला सवाल यह है, यह मेरे लिए पूरी तरह से स्पष्ट नहीं है कि उन गुणों को संतुष्ट क्यों करता है। हमारे पास मौजूद गुणों से, मैंने आदर्श उम्मीदवार होने के लिए "व्युत्पन्न"-समान समीकरण की अधिक उम्मीद की होगी। उदाहरण के लिए, कुछ अधिक पसंद है, "यदि एक्स पॉजिटिव में परिवर्तन होता है, तो वाई में परिवर्तन भी सकारात्मक होना चाहिए"। इसके अलावा, अंतर को "सही" करने के लिए क्यों लिया जा रहा है?C o v ( X , Y ) = E [ ( X - E [ X ] ) ( Y - E [ Y ] ) ]
एक और अधिक स्पष्ट, लेकिन अभी भी दिलचस्प सवाल है, क्या एक अलग परिभाषा है जो उन गुणों को संतुष्ट कर सकती है और अभी भी सार्थक और उपयोगी रही होगी? मैं यह पूछ रहा हूं क्योंकि ऐसा लगता है कि कोई भी सवाल नहीं कर रहा है कि हम इस परिभाषा का पहली जगह में उपयोग क्यों कर रहे हैं (यह इस तरह का महसूस करता है, इसका "हमेशा इस तरह से" रहा है, जो कि मेरी राय में, एक भयानक कारण है और यह वैज्ञानिकता में बाधा डालता है) गणितीय जिज्ञासा और सोच)। क्या स्वीकृत परिभाषा "सर्वश्रेष्ठ" परिभाषा है जो हमारे पास हो सकती है?
ये मेरे विचार हैं कि स्वीकृत परिभाषा क्यों समझ में आती है (इसका केवल एक सहज ज्ञान युक्त तर्क होना चाहिए):
Let चर X के लिए कुछ अंतर हो सकता है (अर्थात यह कुछ समय के मूल्य से कुछ अन्य मूल्य में बदल गया)। इसी तरह को परिभाषित करने के लिए ।Δ वाई
समय में एक उदाहरण के लिए, हम गणना कर सकते हैं कि क्या वे संबंधित हैं या नहीं:
यह कुछ अच्छा है! समय में एक उदाहरण के लिए, यह उन गुणों को संतुष्ट करता है जो हम चाहते हैं। यदि वे दोनों एक साथ बढ़ते हैं, तो अधिकांश समय, उपरोक्त मात्रा सकारात्मक होनी चाहिए (और इसी तरह जब वे विपरीत रूप से समान होते हैं, तो यह नकारात्मक होगा, क्योंकि के विपरीत संकेत होंगे)।
लेकिन यह केवल हमें वह मात्रा देता है जो हम एक उदाहरण के लिए चाहते हैं, और जब से वे आरवी हैं हम ओवरफिट हो सकते हैं यदि हम केवल 1 अवलोकन के आधार पर दो चर के रिश्ते को आधार बनाते हैं। फिर मतभेदों के "औसत" उत्पाद को देखने के लिए इस की उम्मीद क्यों न करें।
जो औसत से ऊपर के रूप में परिभाषित किया गया है जो औसत पर कब्जा करना चाहिए! लेकिन इस स्पष्टीकरण में एकमात्र समस्या यह है कि हम इस अंतर को किस से मापते हैं? इस अंतर को मापने से पता लगता है (जो किसी कारण से सही काम करना है)।
मुझे लगता है कि मेरे पास मुख्य मुद्दा है जो परिभाषा के साथ अंतर को रूप ले रहा है । मैं अभी तक अपने आप को औचित्य नहीं दे सकता।
संकेत के लिए व्याख्या को एक अलग प्रश्न के लिए छोड़ा जा सकता है, क्योंकि यह अधिक जटिल विषय लगता है।