एक श्रेणीगत चर प्रभावी रूप से संकेतक चर का एक सेट है। यह माप सिद्धांत का एक मूल विचार है कि इस तरह का एक वैरिएबल श्रेणियों की रीलेबलिंग के लिए अपरिवर्तनीय है, इसलिए किसी अन्य चर के बीच संबंधों के किसी भी माप में श्रेणियों के संख्यात्मक लेबलिंग का उपयोग करने का कोई मतलब नहीं है (जैसे, 'सहसंबंध) । इस कारण से, और एक निरंतर चर और एक श्रेणीगत चर के बीच संबंध का मापन पूरी तरह से बाद वाले सूचक सूचक चर पर आधारित होना चाहिए।
यह देखते हुए कि आप दो चर के बीच 'सहसंबंध' का एक माप चाहते हैं, यह एक निरंतर यादृच्छिक चर और एक संकेतक यादृच्छिक चर के बीच सहसंबंध को देखने के लिए समझ में आता है जो मैं ता श्रेणीगत चर से प्राप्त किया गया था। दे φ ≡ पी ( मैं = 1 ) हमने:XIϕ≡P(I=1)
Cov(I,X)=E(IX)−E(I)E(X)=ϕ[E(X|I=1)−E(X)],
जो देता है:
Corr(I,X)=ϕ1−ϕ−−−−−√⋅E(X|I=1)−E(X)S(X).
तो एक सतत यादृच्छिक चर और एक संकेतक यादृच्छिक चर I के बीच सहसंबंध सूचक संभावना ized का एक काफी सरल कार्य है और I = 1 पर कंडीशनिंग से एक्स के अपेक्षित मूल्य में मानकीकृत लाभ है । ध्यान दें कि इस सहसंबंध को निरंतर यादृच्छिक चर के किसी भी विवेक की आवश्यकता नहीं है।XIϕXI=1
एक सामान्य स्पष्ट चर के लिए श्रृंखला के साथ 1 , । । । , मी तो आप इस विचार को विस्तार देने वाले वैरिएबल के प्रत्येक परिणाम के लिए सहसंबंध मानों का एक वेक्टर होगा । किसी भी परिणाम के लिए सी = k हम इसी सूचक परिभाषित कर सकते हैं मैं कश्मीर ≡ मैं ( सी = कश्मीर ) और हमने:C1,...,mC=kIk≡I(C=k)
Corr(Ik,X)=ϕk1−ϕk−−−−−−√⋅E(X|C=k)−E(X)S(X).
हम तो परिभाषित कर सकते हैं Corr(C,X)≡(Corr(I1,X),...,Corr(Im,X)) प्रत्येक श्रेणी के लिए सह-संबंध मूल्यों का वेक्टर के रूप में स्पष्ट यादृच्छिक चर की। यह वास्तव में एकमात्र अर्थ है जिसमें यह एक स्पष्ट यादृच्छिक चर के लिए 'सहसंबंध' के बारे में बात करने के लिए समझ में आता है।
∑kCov(Ik,X)=0Xm−1
(x1,c1),...,(xn,cn)
ϕ^k≡1n∑i=1nI(ci=k).
इ^( एक्स)) ≡ x¯≡ १nΣमैं = १nएक्समैं।
इ^( एक्स)| सी=k)≡x¯k≡1n∑i=1nxiI(ci=k)/ϕ^k.
S^(X)≡sX≡1n−1∑i=1n(xi−x¯)2−−−−−−−−−−−−−−−√.
Substitution of these estimates would yield a basic estimate of the correlation vector. If you have parametric information on X then you could estimate the correlation vector directly by maximum likelihood or some other technique.