यदि संयुक्त वितरण बहुभिन्नरूपी सामान्य है तो पियर्सन की ρ केवल संघ की एक विस्तृत माप क्यों है?


16

इस सवाल के शीर्ष प्रतिक्रिया में यह दावा किया गया था । मुझे लगता है कि 'क्यों' प्रश्न पर्याप्त रूप से अलग है कि यह एक नया धागा वारंट करता है। Googling "एसोसिएशन का संपूर्ण माप" किसी भी हिट का उत्पादन नहीं करता था, और मुझे यकीन नहीं है कि उस वाक्यांश का क्या मतलब है।

जवाबों:


15

एक बहुभिन्नरूपी वितरण में "एसोसिएशन के माप" को समझना सबसे अच्छा हो सकता है जिसमें सभी गुण शामिल होते हैं जो समान रूप से रहते हैं जब मान मनमाने ढंग से हटाए जाते हैं और पुनरावृत्त होते हैं। ऐसा करने से किसी भी सैद्धांतिक रूप से स्वीकार्य मूल्यों के साधन और संस्करण बदल सकते हैं (संस्करण सकारात्मक होने चाहिए; साधन कुछ भी हो सकते हैं)।

सहसंबंध गुणांक ("पियर्सन के ") तो पूरी तरह से एक बहुभिन्नरूपी सामान्य वितरण का निर्धारण करते हैं। इसे देखने का एक तरीका किसी भी सूत्र की परिभाषा को देखना है, जैसे घनत्व फ़ंक्शन या विशेषता फ़ंक्शन के लिए सूत्र। वे ही शामिल होते हैंρ साधन, भिन्न और सहसंयोजकों को शामिल करते हैं - लेकिन सहसंबंध और सहसंबंध एक दूसरे से तब काटे जा सकते हैं जब आप भिन्नताओं को जानते हैं।

बहुभिन्नरूपी सामान्य परिवार वितरण का एकमात्र परिवार नहीं है जो इस संपत्ति का आनंद लेता है। उदाहरण के लिए, किसी भी बहुभिन्नरूपी वितरण ( से अधिक स्वतंत्रता की डिग्री के लिए ) एक अच्छी तरह से परिभाषित सहसंबंध मैट्रिक्स है और इसके पहले दो क्षणों से भी पूरी तरह से निर्धारित होता है।2


क्या मैं सही हूं कि आप जो परिभाषा यहां लागू कर रहे हैं, उसके अनुसार सहसंयोजक संघ का एक उपाय नहीं होगा? चूंकि यह विस्तार करने की प्रवृत्ति के रूप में विस्तार होगा।
user1205901 - मोनिका

2
वह सही है। हालांकि सहसंयोजक स्पष्ट रूप से एसोसिएशन के एक उपाय से संबंधित है, यह स्वयं एक नहीं है क्योंकि यह अन्य कारकों से भी प्रभावित होता है।
whuber

19

विविधताएं उन तरीकों से जुड़ी हो सकती हैं जो पियर्सन सहसंबंध पूरी तरह से अंधे हैं।

ρxyz

यहाँ छवि विवरण दर्ज करें

यहां संबद्ध लेकिन असंबद्ध प्रकारों का एक और उदाहरण दिया गया है:

यहाँ छवि विवरण दर्ज करें

(वितरण के बारे में अंतर्निहित बिंदु बनाया जा रहा है, भले ही मैं इसे यहां डेटा के साथ चित्रित कर रहा हूं।)

यहां तक ​​कि जब चर संबंधित होते हैं, तो सामान्य रूप से पियर्सन सहसंबंध आपको यह नहीं बताता है कि - आप संघ के बहुत भिन्न रूप प्राप्त कर सकते हैं, जिसमें एक ही पियरसन सहसंबंध है, लेकिन जब मैं बताता हूं, तो चर सामान्य रूप से सामान्य हैं, सहसंबंध आप कह सकते हैं कि कैसे मानकीकृत चर संबंधित हैं)।

इसलिए पीयर्सन सहसंबंध उन तरीकों को "समाप्त नहीं करता" है जिनसे कि चर जुड़े हुए हैं - वे संबद्ध हो सकते हैं लेकिन असंबद्ध, या वे सहसंबद्ध हो सकते हैं लेकिन काफी अलग तरीकों से जुड़े होते हैं। [उन तरीकों की विविधता जिसमें सहसंबंध द्वारा पूरी तरह से कब्जा नहीं किया जा सकता है, वे काफी बड़े हैं - लेकिन अगर उनमें से कोई भी होता है, तो आपके पास एक बहुभिन्नरूपी सामान्य नहीं हो सकता है। ध्यान दें, हालांकि, मेरी चर्चा में कुछ भी नहीं निकलता है कि यह (यह जानना) हैρ संभावित एसोसिएशन को परिभाषित करता है) बहुभिन्नरूपी सामान्य की विशेषता है, भले ही शीर्षक उद्धरण यह सुझाव देता है।]

(बहुभिन्नरूपी संघ को संबोधित करने का एक सामान्य तरीका है, कोप्लस के माध्यम से। साइट पर कई सवाल हैं जो कॉपुलस से संबंधित हैं; आपको उनमें से कुछ उपयोगी मिल सकते हैं)


क्या इस तरह के वितरण के साथ वास्तविक दुनिया डेटा है?

@ क्या वास्तविक विश्व डेटा भी सामान्य वितरण से तैयार किया गया है? मुझे संदेह है, इसलिए (चूंकि मेरे विकर्ण आरेखों में सभी सामान्य थे) जो तुरंत जवाब "नहीं" बना देगा। उदाहरणों का बिंदु स्पष्ट रूप से दिखाना था कि यादृच्छिक चर के बीच संबंध कभी-कभी सरल क्यों नहीं माना जाता है (कितनी बार लोग एसोसिएशन को मापने के लिए एक पियर्सन सहसंबंध की गणना करते हैं? अक्सर), और यह भी इंगित करने के लिए कि सामान्य मार्जिन होने और बहुभिन्नरूपी होने के कारण। अलग-अलग हैं। बहुत वास्तविक उदाहरण जहां पियर्सन सहसंबंध कैप्चर नहीं करता है जो निश्चित रूप से हो रहा है।
Glen_b -Reinstate मोनिका

चलो एक पल के लिए वितरण के बारे में बात नहीं करते हैं। जब हम एक डॉट क्लाउड से सहसंबंधों की गणना करते हैं, तो हम एक अंतर्निहित "ज्यामितीय आकार" (रैखिक, अतिशयोक्तिपूर्ण, लघुगणक, साइन, आदि) आदर्श सहसंबंध मान लेते हैं, जिसमें से क्लाउड में डॉट्स कुछ "त्रुटि" के कारण विचलित हो जाते हैं। अब सभी आदर्श आकृतियाँ जिन्हें मैंने वास्तविक डेटा से सारगर्भित देखा है जहाँ निरंतर (विराम के बिना) और हमेशा कम से कम एक अक्ष (यानी, उदाहरण के लिए, परिपत्र) के साथ नहीं बढ़ रहा है। डेटा के बारे में मेरा ज्ञान सीमित है, इसलिए मैं सोच रहा था कि क्या वास्तव में वास्तविक दुनिया डेटा था जिसका सहसंबंध गैर-निरंतर या परिपत्र है।

उदाहरण के लिए, डेटा हो सकता है कि अगर मैं प्लॉट करता हूं तो यह दो डॉट क्लाउड की तरह दिखेगा। यदि मैं इस डेटा पर सहसंबंधों की अंधाधुंध गणना करता हूं, तो मुझे एक मिल सकता है, जबकि (या इसलिए मुझे बताया गया है) कथानक स्पष्ट रूप से इंगित करता है कि मैं कुछ अज्ञात भ्रमित चर को याद कर रहा हूं, जो कि अगर मैं इसके लिए जिम्मेदार हूं, तो मेरे संबंध में मधुर संबंध का समाधान होगा डेटा। यदि मेरा प्रोफेसर आपके "x" या "y" आकार के उदाहरणों को देखता है, तो वह मुझे बताता है कि मेरे पास मिश्रित डेटा के दो अलग-अलग उपसमूह हैं।
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.