वास्तविक जीवन में स्वतंत्र और असंबंधित डेटा के उदाहरण, और उन्हें मापने / पता लगाने के तरीके


20

हम हमेशा डेटा के इस वेक्टर के बारे में सुनते हैं। डेटा के इस दूसरे वेक्टर से एक दूसरे से स्वतंत्र होने, या असंबंधित, आदि, और जबकि उन दो अवधारणाओं के बारे में गणित में आना आसान है, मैं उन्हें वास्तविक से उदाहरणों में बाँधना चाहता हूं- जीवन, और इस रिश्ते को मापने के तरीके भी खोजते हैं।

इस दृष्टिकोण से, मैं दो संकेतों के उदाहरणों की तलाश कर रहा हूं जो निम्नलिखित संयोजनों के हैं: (मैं कुछ के साथ शुरू करूंगा):

  • दो संकेत जो स्वतंत्र हैं और (आवश्यक) असंबंधित हैं:

    • जैसा कि आप बात कर रहे हैं एक कार इंजन से शोर (इसे ) और आपकी आवाज़ ( )।v1[n]v2[n]
    • हर दिन आर्द्रता की रिकॉर्डिंग ( ) और डॉव-जोन इंडेक्स ( )।v1[n]v2[n]

Q1) आप कैसे मापेंगे / साबित करेंगे कि वे उन दो वैक्टर के साथ स्वतंत्र हैं? हम जानते हैं कि स्वतंत्रता का अर्थ है कि उनके pdfs का उत्पाद उनके संयुक्त पीडीएफ के बराबर है, और यह बहुत अच्छा है, लेकिन उन दो वैक्टरों के साथ, कोई अपनी स्वतंत्रता कैसे साबित करता है?

  • दो संकेत जो स्वतंत्र नहीं हैं, लेकिन अभी भी असंबंधित हैं:

Q2) मैं यहाँ किसी भी उदाहरण के बारे में नहीं सोच सकता ... कुछ उदाहरण क्या होंगे? मुझे पता है कि हम ऐसे दो वैक्टरों के क्रॉस-सहसंबंध को ले कर सहसंबंध को माप सकते हैं, लेकिन हम यह कैसे साबित करेंगे कि वे भी स्वतंत्र नहीं हैं?

  • दो संकेत जो सहसंबद्ध हैं:
    • एक सदिश हॉल में एक ओपेरा गायिका की आवाज़ को मापता है, , जबकि कोई व्यक्ति इमारत के अंदर कहीं से उसकी आवाज़ रिकॉर्ड करता है, रिहर्सल रूम ( ) में कहता है ।v1[n]v2[n]
    • यदि आप लगातार अपनी कार में अपनी हृदय गति को , ( ), और आपकी रियर विंडशील्ड ( ) पर लगाई जाने वाली नीली रोशनी की तीव्रता को भी मापा जाता है ... तो मुझे लगता है कि वे बहुत सहसंबद्ध होंगे। , :-)v1[n]v2[n]

क्यू 3) क्यू 2 से संबंधित है, लेकिन इस अनुभवजन्य स्टैंड बिंदु से क्रॉस-सहसंबंध को मापने के मामले में, क्या यह उन वैक्टर के डॉट उत्पाद को देखने के लिए पर्याप्त है (क्योंकि उनके क्रॉस-सहसंबंध के चरम पर मूल्य है)? हम क्रॉस-क्रॉस फ़ंक्शन में अन्य मानों की परवाह क्यों करेंगे?

फिर से धन्यवाद, अधिक उदाहरण अंतर्ज्ञान के निर्माण के लिए बेहतर दिया!


@DilipSarwate धन्यवाद दिलीप, मैं इस पर एक नज़र डालूंगा। अभी के लिए कुछ उदाहरण अच्छे होंगे।
स्पेसी

आप "साबित" नहीं कर सकते हैं कि वे उसी तरह से स्वतंत्र हैं कि यहां तक ​​कि एक अच्छी तरह से निर्मित पोल भी "साबित" नहीं कर सकते हैं कि हर कोई कैसे वोट दे रहा है- और उसी कारणों से।
जिम क्ले

@JimClay 'कसौटी' को आराम देने के लिए स्वतंत्र महसूस करें - मैं जो पाने की कोशिश कर रहा हूं वह स्वतंत्रता को मापने / निर्धारित करने के तरीके हैं। हम अक्सर के बारे में सुनते हैं और इसलिए स्वतंत्र हैं, ठीक है, वे कैसे जानते हैं? मापने वाले टेप का क्या उपयोग किया जा रहा है?
स्पेसी

मैं यह जानना चाहूंगा कि क्या क्रोस कोरलेशन का उपयोग दो एनालॉग सिग्नल में से एक के लिए किया जा सकता है उच्च रिज़ॉल्यूशन में से एक और विश्लेषण के उद्देश्य के लिए कम रिज़ॉल्यूशन के अन्य।

अगर हमारे पास कुछ रैंडम वैरिएबल X हैं और 2 सिग्नलों का निर्माण a ** = (x) और ** b ** = f 2 (x) के साथ f 1 और f 2 का ऑर्थोगोनल है और ** x = a + b हैf1f2f1f2 । क्या इसका मतलब यह होगा कि ऐसे संकेत स्वतंत्र हैं? क्या इसके लिए कुछ अतिरिक्त शर्तों की आवश्यकता है? यह संपत्ति दिलचस्प होगी क्योंकि यह और बी के संयुक्त पीडीएफ के निर्माण से बचती है ।
म्लाडेन

जवाबों:


9

कुछ तत्व ... (मुझे पता है कि यह संपूर्ण नहीं है, एक अधिक पूर्ण उत्तर में संभवतः क्षणों का उल्लेख होना चाहिए)

Q1

यह जांचने के लिए कि क्या दो वितरण स्वतंत्र हैं, आपको यह मापने की जरूरत है कि उनके संयुक्त वितरण के उत्पाद उनके सीमांत वितरण p ( x ) × p ( y ) के समान कैसे हैं । इस उद्देश्य के लिए, आप वितरण के बीच किसी भी दूरी का उपयोग कर सकते हैं। यदि आप उन वितरणों की तुलना करने के लिए कुल्बैक-लीब्लर विचलन का उपयोग करते हैं, तो आप मात्रा पर विचार करेंगे:p(x,y)p(x)×p(y)

xyp(x,y)logp(x,y)p(x)p(y)dxdy

और आपने पहचान लिया होगा ... म्युचुअल जानकारी! यह जितना कम होगा, चर उतने ही स्वतंत्र होंगे।

व्यावहारिक रूप से, आपकी टिप्पणियों से इस मात्रा की गणना करने के लिए, आप कर्नेल घनत्व अनुमानक का उपयोग करके अपने डेटा से घनत्व , p ( y ) , p ( x , y ) का अनुमान लगा सकते हैं और एक महीन ग्रिड पर एक संख्यात्मक एकीकरण कर सकते हैं। ; या सिर्फ एन डिब्बे में अपने डेटा की मात्रा निर्धारित करें और असतत वितरण के लिए पारस्परिक जानकारी की अभिव्यक्ति का उपयोग करें।p(x)p(y)p(x,y)N

Q2

सांख्यिकीय स्वतंत्रता और सहसंबंध पर विकिपीडिया पृष्ठ से:

वितरण भूखंड

अंतिम उदाहरण के अपवाद पर, इन 2D वितरण का असंबद्ध (विकर्ण सहसंयोजक मैट्रिक्स) है, लेकिन स्वतंत्र नहीं, सीमांत वितरण p ( x ) और p ( y )p(x,y)p(x)p(y)

Q3

वास्तव में ऐसी स्थितियां हैं जिनमें आप क्रॉस-सहसंबंध कार्यों के सभी मूल्यों को देख सकते हैं। वे उत्पन्न होते हैं, उदाहरण के लिए, ऑडियो सिग्नल प्रोसेसिंग में। एक ही स्रोत पर कब्जा करने वाले दो माइक्रोफोन पर विचार करें, लेकिन कुछ मीटर से दूर। दो संकेतों के क्रॉस-सहसंबंध में ध्वनि की गति से विभाजित माइक्रोफोन के बीच की दूरी के अनुरूप अंतराल पर एक मजबूत-शिखर होगा। यदि आप लैग 0 पर क्रॉस-सहसंबंध को देखते हैं, तो आप यह नहीं देखेंगे कि एक सिग्नल दूसरे के टाइम-शिफ्ट किया गया संस्करण है!


धन्यवाद pichenettes: 1) क्या आप अपने पहले बिंदु पर विस्तार से बता सकते हैं - मैं वास्तव में एक कठिन समय समझ रहा हूं कि कैसे, दो डेटा वैक्टर से, x [n] और y [n], मैं संभवतः उनके JOINT PDF के साथ आ सकता हूं , । मैं समझ सकता हूँ कि x [n] का हिस्टोग्राम लेने से मुझे X का pdf कैसे मिलेगा, ( p (x} ), और Y के साथ भी, लेकिन पृथ्वी पर एक संयुक्त दो वैक्टर के साथ कैसे आता है ?? संक्षिप्त रूप से पूछे जाने वाले नमूनों से पीडीएफ की सटीक कंक्रीट मैपिंग। यह वही है जो मुझे सबसे ज्यादा भ्रमित कर रहा है। (contd)p(x,y)p(x}
Spacey

(contd) 2) तो संक्षेप में प्रस्तुत करने के लिए: यदि x, और y के सहसंयोजक मैट्रिक्स तिरछे हैं, तो वे असंबद्ध हैं, लेकिन जरूरी नहीं कि स्वतंत्र सही हों? स्वतंत्रता के लिए परीक्षण करने के लिए अनुवर्ती प्रश्न (1) था। हालांकि, अगर हम दिखाते हैं कि वे इंडेप कर रहे हैं, तो निश्चित रूप से उनके सहसंयोजक मैट्रिक्स तिरछे होने के लिए। क्या मैंने सही समझा है? 2 भौतिक संकेतों का एक उदाहरण है जो मैं वास्तविक जीवन में माप सकता हूं जो निर्भर होगा, लेकिन सहसंबद्ध नहीं? एक बार फिर धन्यवाद।
स्पेसी

1
मान लीजिए कि आपके पास दो संकेत हैं और y n को N तत्वों के वैक्टर के रूप में दर्शाया गया है । आप का एक अनुमान प्राप्त कर सकते हैं पी ( एक्स , वाई ) उदाहरण के लिए, का उपयोग करते हुए, एक कर्नेल घनत्व आकलनकर्ता: पी * ( एक्स , वाई ) = Σ मैं 1xnynNp(x,y)जहांKएक कर्नेल फ़ंक्शन है। या आप हिस्टोग्राम के निर्माण के लिए उसी तकनीक का उपयोग कर सकते हैं, लेकिन 2 डी में। एक आयताकार ग्रिड निर्माण, गिनती कितने जोड़े(एक्सएन,yएन)ग्रिड की प्रत्येक कोशिका में गिर जाते हैं, और उपयोगपी*(एक्स,वाई)=सीp(x,y)=i1NK(xxi,yyi)K(xn,yn) जहां N आपके संकेतों का आकार है औरCबिंदु(x,y) सेजुड़े सेल में तत्वों की संख्या है। p(x,y)=CNC(x,y)
pichenettes

1
"2 भौतिक संकेत जो निर्भर होंगे, लेकिन सहसंबद्ध नहीं होंगे": मान लीजिए कि हम अपनी स्थिति के इतिहास (अक्षांश, देशांतर) को रिकॉर्ड करने के लिए एनवाई कैब के जीपीएस को हैक कर लेते हैं। वहाँ एक अच्छा मौका है अव्यक्त, लंबे समय से। डेटा असंबंधित होगा - बिंदु बादल का कोई विशेषाधिकार प्राप्त "अभिविन्यास" नहीं है। लेकिन यह शायद ही स्वतंत्र होगा, जब से, अगर आपको कैब के अक्षांश का अनुमान लगाने के लिए कहा गया था, तो आप एक बेहतर अनुमान प्रदान करेंगे यदि आप देशांतर को जानते हैं (आप तब एक नक्शा देख सकते हैं और [लाट बाहर शासन कर सकते हैं,) लंबी] इमारतों द्वारा कब्जा किए गए जोड़े)।
pichenettes

एक अन्य उदाहरण: एक ही आवृत्ति के पूर्णांक पर दो साइन लहर। अशक्त सहसंबंध (फूरियर का आधार अलंकारिक है); लेकिन अगर आप एक के मूल्य को जानते हैं, तो केवल मूल्यों का एक सीमित सेट है जो दूसरे को ले सकते हैं (एक लिसाझी साजिश के बारे में सोचें)।
pichenettes

5

यह उल्लेख करते हुए कि क्या दो संकेत स्वतंत्र हैं, बिना किसी पूर्व ज्ञान / मान्यताओं के करना बहुत कठिन है।

दो यादृच्छिक चर और Y स्वतंत्र हैं यदि X का मान Y के मूल्य के बारे में कोई जानकारी नहीं देता है (यानी Y के लिए हमारी पूर्व संभाव्यता वितरण को प्रभावित नहीं करता है )। इस में से किसी nonlinear परिवर्तन के बराबर है एक्स और वाई की जा रही असहसंबद्ध यानी cov ( 1 ( एक्स ) , 2 ( वाई ) ) = ( 1 ( एक्स ) , 2 ( वाई )XYXYYXY किसी भी गैर-रैखिक1 और f 2 के लिए मान लें कि दोनों चर शून्य मतलब हैं। स्वतंत्रता और असंबद्धता के बीच का अंतर यह है कि एक्स और वाई असंबंधित हैं यदि उपरोक्त धारण, केवल एफ 1 ( एक्स ) = एफ 2 ( एक्स ) = एक्स , पहचान समारोह के लिए है।

cov(1(एक्स),2(Y))=E(f1(X),f2(Y))=0
f1f2XYf1(x)=f2(x)=x

E(XiYj)

X(t)Y(t)

SX,Y(f),SX2,Y(f),SX,Y2(f)
f

उदाहरण :

X(t)=sin(2πft)
Y(t)=sin(2πftk)
kZk1X(t)Y(t)sin(kx)sin(x)
Y(t)=f(X(t))
f

X(t)Y(t)


Xx2,Y(f)

X2(t)Y(t)
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.