इस प्रकार के प्रश्नों की आवश्यकताओं ने मुझे थोड़ा विचित्र बना दिया। यहां एक गणितीय अवधारणा / सूत्र है, फिर भी मैं इसके बारे में कुछ संदर्भों में बात करना चाहता हूं जो पूरी तरह से गणितीय प्रतीकों से रहित है। मुझे यह भी लगता है कि यह कहा जाना चाहिए कि सूत्रों को समझने के लिए आवश्यक वास्तविक बीजगणित, मुझे लगता है, उच्च शिक्षा से पहले अधिकांश व्यक्तियों को सिखाया जाना चाहिए (मैट्रिक्स बीजगणित की समझ की आवश्यकता नहीं है, बस सरल बीजगणित पर्याप्त होगा)।
इसलिए, पहले से ही पूरी तरह से सूत्र को नजरअंदाज करने और कुछ जादुई और विषम प्रकार की उपमाओं में बोलने के बजाय, केवल सूत्र को देखें और व्यक्तिगत घटकों को छोटे चरणों में समझाने का प्रयास करें। सूत्रों को देखते हुए सहसंयोजक और सहसंबंध के संदर्भ में अंतर स्पष्ट हो जाना चाहिए। हालांकि, उपमाओं और आंकड़ों के संदर्भ में बोलते हुए, मुझे संदेह है कि दो अपेक्षाकृत सरल अवधारणाओं और कई स्थितियों में उनके अंतरों को अस्पष्ट किया जाएगा।
तो चलो नमूना सहसंयोजक के लिए एक सूत्र के साथ शुरू होता है (ये मैंने अभी-अभी विकिपीडिया से लिया और अपनाया है);
1n−1∑ni=1(xi−x¯)(yi−y¯)
सभी को गति प्राप्त करने के लिए, सूत्र में सभी तत्वों और परिचालनों को स्पष्ट रूप से परिभाषित करने देता है।
- xi और एक ही अवलोकन के दो अलग-अलग विशेषताओं के प्रत्येक माप हैंyi
- x¯ और प्रत्येक विशेषता के साधन (या औसत) हैंy¯
- के लिए , सिर्फ इतना कहना देता है इसका मतलब यह है कि हम से अंतिम परिणाम विभाजित ।1n−1n−1
- ∑ni=1 कुछ के लिए एक विदेशी प्रतीक हो सकता है, इसलिए यह इस ऑपरेशन को समझाने के लिए उपयोगी होगा। यह बस सभी का योग है टिप्पणियों अलग, और टिप्पणियों की कुल संख्या का प्रतिनिधित्व करता है।in
इस बिंदु पर, मैं एक सरल उदाहरण पेश कर सकता हूं, ताकि बोलने के लिए तत्वों और कार्यों पर एक चेहरा डाल सके। तो उदाहरण के लिए, बस एक तालिका बनाने की सुविधा देता है, जहां प्रत्येक पंक्ति एक अवलोकन से मेल खाती है (और और को उचित रूप से लेबल किया जाता है)। एक संभावना इन उदाहरणों को अधिक विशिष्ट बनाने हैं (उदाहरण के लिए कहते हैं कि उम्र का प्रतिनिधित्व करता है और वजन का प्रतिनिधित्व करता है), लेकिन हमारी चर्चा यहाँ इससे कोई फर्क नहीं करना चाहिए।xyxy
x y
---
2 5
4 8
9 3
5 6
0 8
इस बिंदु पर यदि आपको लगता है कि सूत्र में योग संचालन पूरी तरह से समझ में नहीं आया है, तो आप इसे फिर से बहुत सरल संदर्भ में पेश कर सकते हैं। इस उदाहरण में कहने के रूप में वर्तमान में कहें कि समान है;∑ni=1(xi)
x
--
2
4
9
5
+ 0
--
20
अब उस गंदगी को साफ किया जाना चाहिए, और हम फार्मूला के दूसरे भाग में अपना काम कर सकते हैं, । अब, यह मानते हुए कि लोग पहले से ही जानते हैं कि क्या मतलब है, और खड़ा है, और मैं कहूंगा, पोस्ट में पहले मेरी अपनी टिप्पणियों के पाखंडी होने के नाते, कोई भी सिर्फ मतलब के संदर्भ में संदर्भित कर सकता है सरल अनुमान (जैसे वितरण के मध्य)। एक तो इस प्रक्रिया को एक समय में एक ही ऑपरेशन कर सकता है। कथन(xi−x¯)(yi−y¯)x¯y¯(xi−x¯)बस प्रत्येक अवलोकन के बीच विचलन / दूरी की जांच कर रहा है, और उस विशेष विशेषता के लिए सभी टिप्पणियों का मतलब है। इसलिए जब माध्य से एक अवलोकन आगे होता है, तो इस ऑपरेशन को एक उच्च मूल्य दिया जाएगा। फिर दी गई उदाहरण तालिका में वापस संदर्भित कर सकते हैं, और बस वेक्टर के अवलोकन पर ऑपरेशन का प्रदर्शन कर सकते हैं ।x
x x_bar (x - x_bar)
2 4 -2
4 4 0
9 4 5
5 4 1
0 4 -4
ऑपरेशन वेक्टर के लिए समान है , लेकिन सिर्फ सुदृढीकरण के लिए आप उस ऑपरेशन को भी प्रस्तुत कर सकते हैं।y
y y_bar (y - y_bar)
5 6 -1
8 6 2
3 6 -3
6 6 0
8 6 2
अब, शर्तें और अस्पष्ट नहीं होनी चाहिए, और हम अगले ऑपरेशन पर जा सकते हैं, इन परिणामों को एक साथ गुणा कर सकते हैं, । जैसा कि गंग टिप्पणियों में बताते हैं, इसे अक्सर क्रॉस उत्पाद कहा जाता है (यदि आंकड़ों के लिए मूल मैट्रिक्स बीजगणित शुरू कर रहे थे तो वापस लाने के लिए एक उपयोगी उदाहरण)।(xi−x¯)(yi−y¯)(xi−x¯)⋅(yi−y¯)
गुणा करते समय क्या होता है, इस पर ध्यान दें, यदि दो अवलोकनों के माध्यम से दोनों एक बड़ी दूरी पर हैं, तो परिणामी अवलोकन का और भी बड़ा सकारात्मक मान होगा (यह सच है कि दोनों अवलोकनों के अर्थ के नीचे एक बड़ी दूरी है, जैसे कि दो निगेटिव गुणा करना बराबरी एक सकारात्मक)। यह भी ध्यान दें कि यदि एक अवलोकन माध्य से ऊपर है और दूसरा माध्य से नीचे है, तो परिणामी मान बड़ा (पूर्ण शब्दों में) और ऋणात्मक होगा (सकारात्मक समय के रूप में ऋणात्मक ऋणात्मक संख्या के बराबर होता है)। अंत में ध्यान दें कि जब कोई मान या तो अवलोकन के लिए माध्य के पास होता है, तो दोनों मानों को गुणा करने पर परिणाम कम होगा। फिर से हम इस ऑपरेशन को एक तालिका में प्रस्तुत कर सकते हैं।
(x - x_bar) (y - y_bar) (x - x_bar)*(y - y_bar)
-2 -1 2
0 2 0
5 -3 -15
1 0 0
-4 2 -8
अब अगर कमरे में कोई सांख्यिकीविद् हैं तो उन्हें इस बिंदु पर प्रत्याशा के साथ उबलना चाहिए। हम सभी अलग-अलग तत्वों को देख सकते हैं कि एक सहसंयोजक क्या है और इसकी गणना कैसे की जाती है। अब हमें बस इतना करना है कि पूर्ववर्ती तालिका में अंतिम परिणाम को जोड़ दें, और वॉइला द्वारा विभाजित करें , कोविरियन को अब रहस्यमय नहीं होना चाहिए (सभी केवल एक हनी प्रतीक को परिभाषित करने के साथ)।n−1
(x - x_bar)*(y - y_bar)
-----------------------
2
0
-15
0
+ -8
-----
-21
-21/(5-1) = -5.25
इस बिंदु पर आप यह सुदृढ़ करना चाहते हैं कि 5 कहां से आ रहा है, लेकिन यह तालिका में वापस संदर्भित करने और टिप्पणियों की संख्या गिनने के रूप में सरल होना चाहिए (फिर से नमूना और आबादी के बीच अंतर को दूसरी बार छोड़ देता है)।
अब, अपने आप में सहसंयोजक हमें बहुत कुछ नहीं बताता है (यह कर सकता है, लेकिन दर्शकों को जादुई, अपरिभाषित संदर्भों का सहारा लिए बिना किसी भी दिलचस्प उदाहरण में जाना इस बिंदु पर बेकार है)। एक अच्छे मामले में, आपको वास्तव में बेचने की आवश्यकता नहीं होगी क्यों हमें परवाह करनी चाहिए कि सहसंयोजक क्या है, अन्य परिस्थितियों में, आपको बस यह आशा करनी चाहिए कि आपके दर्शक बंदी हैं और इसके लिए आपका शब्द लेंगे। लेकिन, सह-अस्तित्व क्या है और सहसंबंध क्या है, के बीच अंतर को विकसित करने के लिए जारी है, हम सिर्फ सहसंबंध के लिए सूत्र का उल्लेख कर सकते हैं। ग्रीक प्रतीक फोबिया को रोकने के लिए शायद सिर्फ सहसंबंध का प्रतिनिधित्व करने के लिए इस्तेमाल किया जाने वाला सामान्य प्रतीक है।ρ
ρ=Cov(x,y)Var(x)Var(y)√
फिर से दोहराने के लिए, पूर्ववर्ती सूत्र में अंश मात्र कोविर्स है जैसा कि हमने अभी परिभाषित किया है, और हर एक व्यक्ति श्रृंखला के भिन्नता के गुणनफल का वर्गमूल है । यदि आपको स्वयं विचरण को परिभाषित करने की आवश्यकता है, तो आप बस यह कह सकते हैं कि विचरण एक ही चीज़ के सहसंयोजक के समान है (अर्थात )। और सभी समान अवधारणाएं जो आपने सहसंयोजक के साथ लागू की थीं (यानी यदि किसी श्रृंखला में इसके अर्थ से कई तरीके हैं, तो इसका उच्च संस्करण होगा)। शायद यहां ध्यान दें कि एक श्रृंखला में एक नकारात्मक विचरण नहीं हो सकता है (जो पहले प्रस्तुत किए गए गणित से तार्किक रूप से पालन करना चाहिए)।Cov(x,x)=Var(x)
तो हमारे द्वारा शुरू किए गए केवल नए घटक हर में हैं, । इसलिए हम प्रत्येक श्रृंखला के भिन्नताओं के उत्पाद द्वारा गणना किए गए सहसंयोजक को विभाजित कर रहे हैं। एक व्यक्ति इस बात के इलाज में जा सकता है कि क्यों से विभाजित होने पर हमेशा -1 और 1 के बीच का मूल्य होगा, लेकिन मुझे संदेह है कि Cauchy-Schwarz असमानता को एजेंडे के लिए छोड़ दिया जाना चाहिए यह चर्चा। इसलिए, मैं एक पाखंडी हूं और कुछ का सहारा लेता हूं , इसके लिए अपना शब्द लेता हूं , लेकिन इस बिंदु पर हम सभी कारणों का परिचय दे सकते हैं कि हम सहसंबंध गुणांक का उपयोग क्यों करते हैं। एक तो इन गणित के पाठों को फिर से उन आंकड़ों से संबंधित कर सकता है जो अन्य बयानों में दिए गए हैं, जैसे कि पीटर फ्लॉम की प्रतिक्रियाVar(x)Var(y)Var(x)Var(y)−−−−−−−−−−−√अन्य प्रश्नों में से एक। हालांकि यह कारण संबंधी बयानों के संदर्भ में अवधारणा को पेश करने के लिए क्रिटिसाइज़ किया गया था, लेकिन यह सबक कुछ बिंदु पर एजेंडे पर भी होना चाहिए।
मैं समझता हूं कि कुछ परिस्थितियों में उपचार का यह स्तर उचित नहीं होगा। सीनेट को कार्यकारी सारांश की आवश्यकता है । उस मामले में, अच्छी तरह से आप उन साधारण उत्तराधिकारियों का उल्लेख कर सकते हैं जो लोग अन्य उदाहरणों में उपयोग करते रहे हैं, लेकिन रोम एक दिन में नहीं बनाया गया था। और सीनेट जिसे कार्यकारी सारांश के लिए पूछता है, यदि आपके पास इतना कम समय है तो शायद आपको बस इसके लिए मेरा शब्द लेना चाहिए, और उपमाओं और बुलेट-पॉइंट की औपचारिकताओं के साथ फैलाव करना चाहिए।