असतत और निरंतर चर के बीच संबंध की कल्पना करने का सबसे अच्छा तरीका क्या है?


19

सबसे अच्छा तरीका क्या है:

  • सतत और असतत चर,
  • दो असतत चर?

अब तक मैंने निरंतर चरों के बीच संबंधों को देखने के लिए तितर बितर भूखंडों का उपयोग किया है। हालांकि असतत चर डेटा बिंदुओं के मामले में कुछ निश्चित अंतराल पर संचयी होते हैं। इस प्रकार सबसे अच्छा फिट की लाइन पक्षपाती हो सकती है।


4
असतत-असतत मामले के लिए, यह कुछ हद तक संबंधित प्रश्न का उत्तर देता है , क्रमबद्ध क्रमबद्ध डेटा पर मदद कर सकता है (हालांकि संभवतः आपके मामले में बक्से के बिना)। मुझे वास्तव में यकीन नहीं है कि आप कैसे सोचते हैं कि यह 'पूर्वाग्रह' पैदा होता है; यह डेटा बिंदुओं के दृश्य प्रभाव को प्रभावित करेगा (जहां यह होना चाहिए इसके अलावा कहीं और जाने के लिए लाइन का उपयोग करने के लिए अग्रणी) लेकिन वास्तविक डेटा ही नहीं। क्या आप यहाँ अपना तर्क समझा सकते हैं?
Glen_b -Reinstate मोनिका

जवाबों:


26

नीचे: मूल कथानक भ्रामक हो सकता है क्योंकि चरों की असतत प्रकृति बिंदुओं को ओवरलैप करती है:

यहाँ छवि विवरण दर्ज करें

इसके चारों ओर काम करने का एक तरीका डेटा प्रतीक के लिए कुछ पारदर्शिता पेश करना है:

यहाँ छवि विवरण दर्ज करें

दूसरा तरीका यह है कि एक स्मीयर बनाने के लिए प्रतीक के स्थान को हल्के से विस्थापित किया जाए। इस तकनीक को "घबराना:" कहा जाता है

यहाँ छवि विवरण दर्ज करें

दोनों समाधान अभी भी आपको रैखिकता का आकलन करने के लिए एक सीधी रेखा में फिट करने की अनुमति देंगे।

आपके संदर्भ के लिए R कोड:

x <- trunc(runif(200)*10)
y <- x * 2 + trunc(runif(200)*10)
plot(x,y,pch=16)
plot(x,y,col="#00000020",pch=16)
plot(jitter(x),jitter(y),col="#000000",pch=16)

1
अच्छा उत्तर। परिवर्तनीय उदाहरण के साथ बबल-बिखरने वाले भूखंडों के बारे में क्या मायने रखता है? मैंने बड़े पैमाने पर डेटा सेट पर इन तकनीकों का उपयोग करने की कोशिश की और सभी ने अल्फ़ाज़ को प्रस्तुत करने में बहुत लंबा समय लिया।
जोश

14

मैं एक असतत और एक सतत चर के बीच संबंध प्रदर्शित करने के लिए बॉक्सप्लेट का उपयोग करूंगा। आप मानक सांख्यिकीय सॉफ्टवेयर के साथ अपने बॉक्सप्लॉट को ऊर्ध्वाधर या क्षैतिज बना सकते हैं, इसलिए IV या DV के रूप में कल्पना करना आसान है। यह है एक असतत और सतत चर के साथ एक scatterplot उपयोग करने के लिए, बस असतत चर (जैसे, 1 और 2), और घबराना उन मूल्यों (दाईं ओर टिप्पणी शीर्ष साजिश करने के लिए एक संख्या आवंटित संभव यहाँ )।

आपकी टिप्पणी के बारे में कि सबसे अच्छी फिट की रेखा पक्षपाती हो सकती है, यह इस बात पर निर्भर करता है कि आपके पास क्या है। उदाहरण के लिए, यदि आपके पास अपने IV के रूप में दो स्तरों के साथ एक असतत चर है, और आपके DV के रूप में एक निरंतर चर है, तो आप दो साधनों के माध्यम से एक रेखा खींच सकते हैं और यह पक्षपाती नहीं होगा। (हम आमतौर पर इस स्थिति को टी-टेस्ट के लिए उपयुक्त मानते हैं, लेकिन यह वास्तव में एक रूप है - यानी, सरल मामला - प्रतिगमन का, मेरा जवाब यहां देखें ।) दूसरी तरफ, यदि आपके पास असतत है। आपके डीवी के रूप में दो स्तरों वाला चर, मानक (OLS) प्रतिगमन अनुचित होगा (लॉजिस्टिक प्रतिगमन के लिए कहा जाएगा) और सबसे अच्छी फिट की लाइन पक्षपाती होगी, लेकिन आप अपने प्रारंभिक के भाग के रूप में एक नीच लाइन फिट कर सकते हैं (और प्लॉट) डेटा की खोज।

दो असतत चर के बीच संबंध की कल्पना के लिए, मैं एक मोज़ेक साजिश का उपयोग करूंगा । आप कुछ प्रोग्रामिंग के साथ एक छलनी की साजिश , एक एसोसिएशन साजिश , या एक गतिशील दबाव साजिश का भी उपयोग कर सकते हैं ।


8

जब एक द्विआधारी परिणाम चर और एक निरंतर भविष्यवक्ता के बीच के संबंध पर विचार करते हैं, तो मैं lo चिकनी का उपयोग करूंगा (बाहरी रूप से पता लगाने के साथ बंद हो गया, उदाहरण के लिए, आर में lowess(x, y, iter=0)

आर Hmiscपैकेज की अगली रिलीज में आप आसानी से एक एकल latticeग्राफिक बना सकते हैं , जो कई भविष्यवक्ताओं के लिए एक मल्टीपल डिस्प्ले में ऐसे कर्व्स डालता है, जैसे।

summaryRc(heart.attack ~ age + blood.pressure + weight, data=mydata)

1

यदि आप सरल तितर बितर भूखंडों से संतुष्ट नहीं हैं, तो आप असतत चर के प्रत्येक मूल्य पर डेटा बिंदुओं की आवृत्तियों को जोड़ना चाहते हैं। यह कैसे करें तो बस उस सांख्यिकीय कार्यक्रम पर निर्भर करता है जिसका आप उपयोग कर रहे हैं। यहाँ Stata के लिए एक उदाहरण है। आप इसे दो श्रेणीगत चर के स्कैटर प्लॉट पर भी लागू कर सकते हैं। अन्यथा एक बॉक्स प्लॉट या ओवरलेड बार चार्ट ठीक हो सकते हैं लेकिन यह वास्तव में इस बात पर निर्भर करता है कि आप इन चरों को कैसे प्रस्तुत करना चाहते हैं।


1

मुझे http://www.boekboek.com/xb130929113026 पर दो बाइनरी चर के बीच सहयोग पर एक पेपर मिला - यहाँ उस लेख में यह दिखाया गया है और साबित किया गया है कि दो बाइनरी वैरिएबल्स के बीच जुड़ाव को एक अंश के रूप में व्यक्त किया जा सकता है परिपूर्ण संगति। इसलिए यह राज्य के लिए संभव और बेहतर हो सकता है: चर ए और चर बी के बीच का संबंध उदाहरण के अनुसार 50% है, उदाहरण के लिए: या = 9 (व्याख्या करना आसान नहीं) या वास्तविक जोखिम = 2 (समकालीन सापेक्ष जोखिम माना जाता है) हालांकि एसोसिएशन का एक माप होना है, हालांकि वास्तव में यह एसोसिएशन, प्रसार या घटना और सकारात्मकता का एक कार्य है)।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.