आर में क्रमबद्ध डेटा के बीच त्वरित मूल्यांकन (नेत्रहीन) सहसंबंध?


11

मैं एक सर्वेक्षण में अलग-अलग सवालों के जवाबों के बीच सहसंबंधों की तलाश कर रहा हूं ("उम, चलो देखते हैं कि प्रश्न 11 के उत्तर प्रश्न 78 के साथ संबंधित हैं")। सभी उत्तर स्पष्ट हैं (उनमें से अधिकांश "बहुत दुखी" से "बहुत खुश" तक हैं), लेकिन कुछ के पास उत्तरों का एक अलग सेट है। उनमें से अधिकांश को अध्यादेश माना जा सकता है तो आइए इस मामले पर यहां विचार करें।

चूँकि मेरे पास एक वाणिज्यिक सांख्यिकी कार्यक्रम नहीं है, इसलिए मुझे R का उपयोग करना चाहिए।

मैंने रैटल (आर के लिए एक फ्रीवेयर डेटा माइनिंग पैकेज, बहुत निफ्टी) की कोशिश की , लेकिन दुर्भाग्य से यह श्रेणीबद्ध डेटा का समर्थन नहीं करता है। एक हैक जो मैं उपयोग कर सकता था, वह आर के सर्वेक्षण के कोडित संस्करण में आयात करना है जिसमें "बहुत दुखी" ... "खुश" के बजाय संख्या (1..5) है और रेटल को विश्वास है कि वे संख्यात्मक डेटा हैं।

मैं एक स्कैटर प्लॉट करने के लिए सोच रहा था और प्रत्येक जोड़ी के लिए अंकों की संख्या के अनुपात में डॉट आकार है। कुछ गोलगप्पे खाने के बाद मुझे http://www.r-statistics.com/2010/04/correlation-scatter-plot-matrix-for-ordered-categorical-data/ मिला लेकिन यह बहुत जटिल (मुझे) लगता है।

मैं एक सांख्यिकीविद् (लेकिन एक प्रोग्रामर) नहीं हूं, लेकिन इस मामले में कुछ पढ़ने को मिला है और अगर मैं सही ढंग से समझूं , तो स्पीयरमैन की आरएचओ उपयुक्त होगी।

तो जल्दी में उन लोगों के लिए सवाल का संक्षिप्त संस्करण: क्या आर में स्पीयरमैन की आरओ को जल्दी से साजिश करने का एक तरीका है ? एक प्लॉट संख्या के एक मैट्रिक्स के लिए बेहतर है क्योंकि यह आंख की गेंद के लिए आसान है और सामग्री में भी शामिल किया जा सकता है।

पहले ही, आपका बहुत धन्यवाद।

PS I ने थोड़ी देर के लिए सोचा कि यह मुख्य SO साइट पर या यहाँ पोस्ट करना है या नहीं। आर सहसंबंध के लिए दोनों साइटों की खोज करने के बाद, मुझे लगा कि यह साइट प्रश्न के लिए बेहतर अनुकूल है।


2
आप ध्वनि की तरह आर स्वामित्व सॉफ्टवेयर के लिए अवर है। :)
रोमन लुसट्रिक

मेरे लिए यह आपके मामले में पीयरसन उत्पाद-पल-सहसंबंध (निरंतर डेटा मानकर) का उपयोग करने के लिए पूरी तरह से उचित लगता है (अपने पैमाने पर पर्याप्त बिंदुओं को ध्यान में रखते हुए और मध्य बिंदु नहीं जानता)। मनोविज्ञान के भीतर पूरे क्षेत्र (जैसे, व्यक्तित्व या सामाजिक मनोविज्ञान) इस धारणा पर आराम (सफलतापूर्वक) कि एक एकल, पांच-बिंदु (या सात-बिंदु) पैमाने पर किसी भी आइटम का उत्तर बहुत ही गैर-एक्स से लेकर बहुत एक्स तक हो सकता है निरंतर माना जाता है। इस धागे को भी देखें: आंकड़े.stackexchange.com/questions/539/…
हेनरिक

@romunov: यकीन नहीं होता कि आपको कैसे आभास हुआ कि मेरा मानना ​​है कि R अन्य s / w से नीच है। लेकिन ऐसा बिल्कुल नहीं है।
इच्छादिबतनामे

मैं बस एक स्मार्ट गधा बन रहा था। मुझे आशा है कि कोई कठिन भावना नहीं है। :)
रोमन लुसत्रिक

जवाबों:


19

सहसंबंध का एक और अच्छा दृश्य कॉरपोटल पैकेज द्वारा पेश किया जाता है, जो आपको इस तरह की चीजें प्रदान करता है: वैकल्पिक शब्द

यह एक बेहतरीन पैकेज है।

इसके जवाब पर भी गौर करें , आपके लिए यह जानना अच्छा होगा।

अंत में, यदि आपके पास सुझाव हैं कि आपके द्वारा संदर्भित पोस्ट पर कोड कैसे सरल हो सकता है - तो कृपया मुझे बताएं।


1
धन्यवाद ताल, मैं अब भ्रष्ट करने की कोशिश करूँगा। मैं यह भी चाहता हूं कि मैं जानता था कि आपके समाधान को कैसे सरल बनाया जाए (जिसे मैंने प्रश्न में जोड़ा है) लेकिन मैं आर में एक नौसिखिया हूं इसलिए आप मुझसे अधिक जानते हैं। मैं प्रश्न को स्पष्ट करने के लिए अद्यतन करूंगा कि समाधान मेरे लिए
इच्छा ४५:४०

गलियारा अच्छा लगता है। यह सहसंबंधों के आकार और दिशा का एक शानदार दृश्य स्नैपशॉट देता है। 5-पॉइंट ऑर्डर किए गए श्रेणीगत चर के मामले में, पियर्सन के सहसंबंध के अलावा एसोसिएशन के कुछ अन्य उपाय की आपूर्ति करना उपयोगी हो सकता है: उदाहरण के लिए, पॉलीकोरिक सहसंबंध। ऑर्डर किए गए श्रेणीबद्ध चर के मानक पियर्सन के सहसंबंधों का आकार दो चर के माध्यम से कुछ हद तक प्रभावित होता है।
जेरोमे एंग्लीम

3

अतिरिक्त साजिश रचने वाले विचारों के एक जोड़े हैं:


सूरजमुखी एक मजेदार उपाय है। एक घबराना का उपयोग करना है जो मैंने पहली बार विषय पर देखा था, लेकिन मैंने पाया कि यह सहसंबंध मैट्रिक्स के प्लॉटिंग के लिए पर्याप्त प्रभावी नहीं है ...
ताल गैली

हाँ, घबराना बहुत सारे वैरिएबल के साथ स्कैम्बेट्रिक्स के साथ बहुत गन्दा हो सकता है। मुझे लगता है कि घबराना और सूरजमुखी का लाभ यह है कि आपको कच्चा डेटा (घबराहट के मामले में परेशान) दिखाई देता है।
जेरोमे एंग्लीम

सहमत (मुझे घबराना पसंद है, बस इसके लिए नहीं :))
ताल गैलिली
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.