सहसंबंधी मूल्यों का लाभ उठाना


20

मान लें कि मैं परीक्षण Yकरता हूं कि चर Xविभिन्न प्रयोगात्मक परिस्थितियों में चर पर कैसे निर्भर करता है और निम्नलिखित ग्राफ प्राप्त करता है:

यहां छवि विवरण दर्ज करें

ऊपर दिए गए ग्राफ़ में डैश लाइनें प्रत्येक डेटा श्रृंखला (प्रयोगात्मक सेटअप) के लिए रेखीय प्रतिगमन का प्रतिनिधित्व करती हैं और किंवदंती में संख्या प्रत्येक डेटा श्रृंखला के पियर्सन सहसंबंध को दर्शाती है।

मैं के बीच "औसत सहसंबंध" (या "मतलब सहसंबंध") की गणना करना चाहते हैं Xऔर Y। क्या मैं केवल rमूल्यों को औसत कर सकता हूं ? "औसत निर्धारण मानदंड", बारे में क्या ? क्या मुझे औसत की गणना करनी चाहिए और उस मूल्य का वर्ग लेना चाहिए या क्या मुझे व्यक्तिगत के औसत की गणना करनी चाहिए ?R2rR2

जवाबों:


15

सरल तरीका यह है कि विभिन्न प्रयोगात्मक स्थितियों की पहचान करने के लिए एक श्रेणीगत चर को जोड़ा जाए और इसे साथ "इंटरैक्शन" के साथ अपने मॉडल में शामिल किया जाए ; वह है, । यह एक ही बार में सभी पाँच रजिस्टरों का संचालन करता है। इसका वही है जो आप चाहते हैं।zxyz+x#zR2

यह देखने के लिए कि व्यक्तिगत मान औसत क्यों गलत हो सकता है, मान लीजिए कि ढलान की दिशा कुछ प्रयोगात्मक स्थितियों में उलट है। आप 1 का एक गुच्छा औसतन और 0 से लगभग 0 तक निकालेंगे, जो किसी भी फिट की गुणवत्ता को प्रतिबिंबित नहीं करेगा। यह देखने के लिए कि (या उसके किसी निश्चित परिवर्तन) का औसत सही क्यों नहीं है, मान लीजिए कि अधिकांश प्रायोगिक स्थितियों में आपके पास केवल दो अवलोकन थे, ताकि उनका सभी बराबर हो , लेकिन एक प्रयोग में आपके साथ सौ अवलोकन थे । लगभग 1 के औसत स्थिति को सही ढंग से प्रतिबिंबित नहीं करेंगे।RR2R21R2=0R2


1
मेरी अज्ञानता को क्षमा करें, लेकिन आपके उत्तर में # चिन्ह का क्या अर्थ है?
बोरिस गोरेलिक

1
मुझे लगता है कि आपके उत्तर का उपयोग सहसंबंध की निहित परिभाषा के लिए बहुत अच्छा है। क्या होगा अगर वे इसका मतलब मानकीकृत ढलान के रूप में करते हैं (शायद आंकड़े से निहित है)? उस स्थिति में आप नकारात्मक और सकारात्मकता को रद्द करना चाहते हैं। आप नमूना आकार के मुद्दे के बारे में मृत हैं। इसके अलावा, अपनी टिप्पणी को अपने उत्तर में स्थानांतरित करने पर विचार करें।
जॉन

क्या आप या समायोजित R 2 चाहते हैं? R2R2
रसैलपिएर्स

@ आपकी शुरुआती टिप्पणी में, आपका मतलब यह है कि सहसंबंध हो सकता है ; आर 2 प्रत्येक मामले में है 1 । (मुझे लगता है कि यह केवल एक टाइपिंग या संपादन मुद्दा है; यह आपकी बात नहीं बदलता है, लेकिन यह गुमराह कर सकता है।)±1R21
Glen_b -Reinstate Monica

@rpierce दूसरे पैराग्राफ में, यदि आप समायोजित उपयोग करते हैं तो विचारों में कोई अंतर नहीं पड़ता है - दो बिंदुओं के बजाय तीन के सेट की कल्पना करें , जो लगभग समान हैं। उनका समायोजित आर 2 मनमाने ढंग से 1 के करीब हो सकता है । R2R21
whuber

24

पीयरसन सहसंबंध गुणांक के लिए, आमतौर पर फिशर Z परिवर्तन का उपयोग करके आर मूल्यों को बदलना उचित है । फिर z -val औसत और औसत को वापस r मान में परिवर्तित करें ।

मुझे लगता है कि यह एक स्पीयरमैन गुणांक के लिए भी ठीक होगा।

यहाँ एक पेपर और विकिपीडिया प्रविष्टि है


1
+1; यह उत्तर अधिक उपयुक्त और सामान्य लगता है, लेकिन विशेष रूप से उपयोग के मामले में स्वीकृत उत्तर की तुलना में 1 के r मान से कम नहीं होता? क्या कुछ ऐसा है, जो यहां एक तार्किक लॉगिट की तरह उचित है, जहां कोई बस एक "डाटापॉइंट" जोड़ देगा, जिसमें सहसंबंध का अभाव है? यदि हां, तो इसे कहां जोड़ा जाएगा? क्या किसी को स्रोत वितरण से दो यादृच्छिक चर को हथियाने के लिए एक मोंटे कार्लो सिम का संचालन करना होगा? वैकल्पिक रूप से 1 से थोड़ा कम मूल्य r को समायोजित करेगा? कितनी दूर तक समायोजित करना चाहिए?
रसेलपिएरेस

3

औसत सहसंबंध अर्थपूर्ण हो सकता है। सहसंबंधों के वितरण पर भी विचार करें (उदाहरण के लिए, एक हिस्टोग्राम की साजिश)।

n


1

एल्गोरिथ्म के प्रदर्शन के लिए अनुमानित वर्गीय एरोर (MSPE) का उपयोग करने के बारे में क्या? यदि आप एल्गोरिदम के एक सेट के बीच भविष्य कहनेवाला प्रदर्शन की तुलना करने की कोशिश कर रहे हैं तो यह एक मानक दृष्टिकोण है।


मुझे यकीन नहीं है कि इस पोस्ट के आँकड़े .stackexchange.com/questions/17129/… को इस एक के साथ क्यों मिला दिया गया। वे वास्तव में मेरे विचार में दो अलग-अलग प्रश्न पूछ रहे हैं - दो अलग-अलग लक्ष्य हैं।
स्टेट्सटूडेंट

1
आप सही हैं: वे अलग-अलग प्रश्न हैं। मैंने दूसरे पद को फिर से खोलने के लिए मतदान किया है (हालांकि इसका क्या प्रभाव हो सकता है) स्पष्ट नहीं है। मैं आपकी टिप्पणी नहीं देखने के लिए माफी माँगता हूँ: यदि आपने इसके बजाय उस पोस्ट को झंडी दी होती तो यह कई साल बाद हमारे ध्यान में आता!
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.