पैरापैट्रिक आंकड़े कभी भी गैर-पैरामीटर पर क्यों पसंद किए जाएंगे?


60

क्या कोई मुझे समझा सकता है कि परिकल्पना परीक्षण या प्रतिगमन विश्लेषण के लिए एक गैर-सांख्यिकीय सांख्यिकीय पद्धति पर कोई पैरामीट्रिक क्यों चुनेगा?

मेरे दिमाग में, यह राफ्टिंग के लिए जा रहा है और एक गैर-जल प्रतिरोधी घड़ी चुनना है, क्योंकि आप इसे गीला नहीं कर सकते । हर अवसर पर काम करने वाले उपकरण का उपयोग क्यों नहीं किया जाता है?


21
यह सांख्यिकीय अनुमान की प्रक्रिया में आगमनात्मक पूर्वाग्रह का परिचय देना है। यह कहने का एक फैंसी तरीका है: यदि आप कुछ जानते हैं, तो इसे संकेत के रूप में प्रदान करें। यह संकेत इस तरह के रूप ले सकता है जैसे कि संभावना का कार्यात्मक रूप प्रदान करना या मापदंडों पर पूर्व वितरण। यदि आपका संकेत अच्छा है, तो परिणाम बिना संकेत के बेहतर है, और यदि यह खराब है तो परिणाम खराब है।
कागदस ओजेंक

6
जरुरी नहीं। मूल रूप से आप एक बहुत बड़ी मिठाई पर कुछ खोज रहे हैं। यदि कोई आपको बताता है कि आप जो खोज रहे हैं वह एक निश्चित क्षेत्र में सीमित है तो आपके खोजने की संभावना में सुधार होता है। लेकिन अगर वे आपको गलत जानकारी से गुमराह करते हैं तो आप उस क्षेत्र को कितना भी खोज लें, आपको नहीं मिलेगा।
कागदस ओजेंक

17
एक लकड़ी के काम के रूप में, मैं अंत में सादृश्य से प्यार करता हूं। मकान और फर्नीचर जो अच्छी तरह से बनाए गए हैं और अंतिम निर्माण विशेष उपकरणों का उपयोग करके किया गया है। सामान्य प्रयोजन के उपकरण घर के मालिकों के लिए और पेशेवरों के लिए बहुत अच्छे होते हैं, जिन्हें जल्दी से नौकरी पाने की आवश्यकता होती है या जब एक कच्चे या अनुचित उपकरण का उपयोग करने से गुणवत्ता में कोई फर्क नहीं पड़ता है कि किसी को भी परवाह है। कारीगर, हालांकि, नौकरी के लिए सही उपकरण को नियोजित करके बेहतरीन परिणाम प्राप्त करते हैं, और वास्तव में कुछ चीजें बस इसके बिना नहीं हो सकती हैं। उदाहरण के लिए, किसी ने भी सामान्य उद्देश्य वाले हैंड्स के साथ कभी अच्छा ड्वेल नहीं बनाया।
whuber

3
चाहे आप एक कुदाल के साथ एक खाई खोदें या एक चम्मच आप एक खाई के साथ समाप्त हो। यह सिर्फ इतना है कि यदि आप चम्मच का उपयोग करते हैं, तो आप भी पुराने हैं।
संयुक्ताक्षर 14

5
संबंधित (हालांकि शायद स्पष्ट रूप से ऐसा नहीं है): यदि मतलब इतना संवेदनशील है, तो इसे पहली जगह में क्यों उपयोग करें?
गूँग -

जवाबों:


25

शायद ही कभी एक पैरामीट्रिक परीक्षण और एक गैर पैरामीट्रिक परीक्षण वास्तव में एक ही अशक्त है। पैरामीट्रिक -est वितरण के माध्य का परीक्षण कर रहा है, यह मानते हुए कि पहले दो क्षण मौजूद हैं। विलकॉक्सन रैंक योग परीक्षण किसी भी क्षण को नहीं मानता है, और इसके बजाय वितरण की समानता का परीक्षण करता है। इसका निहित पैरामीटर वितरण का एक अजीब कार्यात्मक है, संभावना है कि एक नमूने से अवलोकन दूसरे से अवलोकन की तुलना में कम है। आप समान वितरण के पूरी तरह से निर्दिष्ट अशक्त के तहत दो परीक्षणों के बीच तुलना के बारे में बात कर सकते हैं ... लेकिन आपको यह पहचानना होगा कि दोनों परीक्षण अलग-अलग परिकल्पनाओं का परीक्षण कर रहे हैं।टी

पैरामीट्रिक परीक्षण की जानकारी जो उनकी धारणा के साथ लाती है, परीक्षणों की शक्ति में सुधार करने में मदद करती है। निश्चित रूप से वह जानकारी बेहतर है, लेकिन अगर मानव ज्ञान के किसी भी क्षेत्र में इन दिनों ऐसी प्रारंभिक जानकारी मौजूद नहीं है, तो बहुत कम हैं। एक दिलचस्प अपवाद जो स्पष्ट रूप से कहता है "मैं कुछ भी ग्रहण नहीं करना चाहता हूं" कोर्टरूम है जहां गैर-पैरामीट्रिक तरीके व्यापक रूप से लोकप्रिय हैं - और यह एप्लिकेशन के लिए एकदम सही समझ में आता है। वहाँ शायद एक अच्छा कारण है, सज़ा का इरादा है, कि फिलिप गुड ने गैर-पैरामीट्रिक आँकड़े और कोर्ट रूम आँकड़ों दोनों पर अच्छी किताबें लिखी हैं ।

ऐसे परीक्षण परिस्थितियाँ भी होती हैं जहाँ आपके पास नॉनमेट्रिक टेस्ट के लिए आवश्यक माइक्रोडेटा तक पहुँच नहीं होती है। मान लीजिए कि आपको लोगों के दो समूहों की तुलना करने के लिए कहा गया था कि क्या एक दूसरे की तुलना में अधिक मोटे हैं। एक आदर्श दुनिया में, आपके पास हर किसी के लिए ऊंचाई और वजन माप होगा, और आप ऊंचाई द्वारा स्तरीकरण एक क्रमचय परीक्षण बना सकते हैं। आदर्श से कम (यानी, वास्तविक) दुनिया में, आपके पास प्रत्येक समूह में केवल ऊँचाई और औसत वजन हो सकता है (या नमूने के शीर्ष पर इन विशेषताओं की कुछ श्रेणियां या संस्करण हो सकते हैं)। आपका सबसे अच्छा शर्त यह है कि प्रत्येक समूह के लिए औसत बीएमआई की गणना करें और उनकी तुलना करें यदि आपके पास केवल साधन हैं; यदि आपके पास साधन और भिन्नताएं हैं, तो ऊंचाई और वजन के लिए सामान्य रूप से एक बीवरिएट मान लें (यदि आपके नमूनों के साथ नहीं आया तो आपको कुछ बाहरी डेटा से सहसंबंध लेना होगा)


3
मैं समझता हूं कि परीक्षण के मामले में आपके पास एक ही अशक्त नहीं है, हालांकि मुझे यकीन नहीं है कि यह कहने का कोई मतलब नहीं है कि एक अशक्त दूसरे अशक्त से बेहतर है। लेकिन भविष्यवाणी के मामले के बारे में क्या? पूरी तरह से अलग कहानी, अभी भी पैरामीट्रिक बनाम नॉनपेर्मेट्रिक दुविधा।
en

22

जैसा कि अन्य लोगों ने लिखा है: यदि पूर्व शर्त पूरी की जाती है, तो आपका पैरामीट्रिक परीक्षण गैर-पैरामीटर एक की तुलना में अधिक शक्तिशाली होगा।

आपकी घड़ी सादृश्य में, गैर-जलरोधी एक अधिक सटीक होगा जब तक कि यह गीला न हो जाए। उदाहरण के लिए, आपकी जल-रोधी घड़ी या तो एक घंटे के लिए बंद हो सकती है, जबकि गैर-जल-रोधी एक सटीक होगी ... और आपको अपनी राफ्टिंग यात्रा के बाद बस पकड़ने की आवश्यकता है। ऐसे मामले में यह गैर-जल प्रतिरोधी घड़ी को अपने साथ ले जाने और यह सुनिश्चित करने के लिए समझ में आता है कि यह गीला न हो।


बोनस बिंदु: nonparametric तरीके हमेशा आसान नहीं होते हैं। हाँ, परीक्षण में एक क्रमपरिवर्तन परीक्षण विकल्प सरल है। लेकिन दो-तरफ़ा इंटरैक्शन और नेस्टेड यादृच्छिक प्रभावों के साथ मिश्रित रैखिक मॉडल के लिए एक nonparametric विकल्प एक साधारण कॉल की तुलना में सेट करने के लिए काफी कठिन है nlme()। मैंने ऐसा किया है, क्रमपरिवर्तन परीक्षणों का उपयोग करते हुए, और मेरे अनुभव में, पैरामीट्रिक और क्रमपरिवर्तन परीक्षणों के पी मान हमेशा एक साथ बहुत करीब रहे हैं, भले ही पैरामीट्रिक मॉडल से अवशिष्ट काफी गैर-सामान्य थे। पैरामीट्रिक परीक्षण अक्सर उनके पूर्व शर्त से प्रस्थान के खिलाफ आश्चर्यजनक रूप से लचीला होते हैं।


यह प्रचलित दृष्टिकोण की तरह लगता है कि जब उनकी मान्यताएं पूरी होती हैं तो पैरामीट्रिक विधियां अधिक शक्तिशाली होती हैं। लेकिन अगर ऐसा है तो दोनों दृष्टिकोणों से परिणामों का मूल्यांकन करने के लिए हमारे पास पी-वैल्यू कैसे हैं? मेरा मतलब है कि अगर एक पैरामीट्रिक परीक्षण कम से कम 99% की संभावना के साथ एक शून्य परिकल्पना को खारिज कर देता है, तो 99% की संभावना के साथ अशक्त परिकल्पना को अस्वीकार करने वाले एक गैर-समरूप परीक्षण से बेहतर कैसे है? क्या प्रत्येक मामले में 0.99 की संभावना अलग है? यह समझ में नहीं आएगा।
en 1

1
अशक्त परिकल्पनाएं एक पैरामीट्रिक परीक्षण और इसके गैर-पैरामीट्रिक समकक्ष के बीच भिन्न होती हैं। विशेष रूप से, पैरामीट्रिक परीक्षण के लिए अशक्त परिकल्पना में परीक्षण सांख्यिकीय के वितरण पर एक विशिष्ट पैरामीट्रिक धारणा होती है (जिसे आमतौर पर दो परीक्षणों के लिए अलग-अलग तरीकों से गणना की जाएगी) - इसलिए इसे "पैरामीट्रिक" कहा जाता है, आखिर! तो दो पी मूल्यों का एक ही नाम है, लेकिन अलग-अलग परीक्षण आँकड़ों के आधार पर गणना की जाती है, जिनके विभिन्न अशक्त परिकल्पनाओं के तहत अलग-अलग वितरण होते हैं।
एस। कोलासा -


3
@StephanKolassa, मैंने वास्तव में आपके उत्तर के लिए एक टिप्पणी लिखना शुरू कर दिया, और दूर हो गया :)
StasK

12

जबकि मैं मानता हूं कि कई मामलों में, गैर-पैरामीट्रिक तकनीक अनुकूल हैं, ऐसी परिस्थितियां भी हैं जिनमें पैरामीट्रिक तरीके अधिक उपयोगी हैं।

आइए "दो-नमूना टी-परीक्षण बनाम विल्कोक्सन के रैंक सम टेस्ट" चर्चा पर ध्यान केंद्रित करें (अन्यथा हमें पूरी किताब लिखना है)।

  1. 2-3 के छोटे समूह के आकार के साथ, केवल टी-परीक्षण सैद्धांतिक रूप से 5% के तहत पी मान प्राप्त कर सकता है। जीव विज्ञान और रसायन विज्ञान में, इस तरह के समूह आकार असामान्य नहीं हैं। बेशक ऐसी सेटिंग में टी-टेस्ट का उपयोग करना नाजुक है। लेकिन शायद यह कुछ भी नहीं से बेहतर है। (यह बिंदु इस मुद्दे से जुड़ा है कि सही परिस्थितियों में, टी-परीक्षण में विलकॉक्सन परीक्षण की तुलना में अधिक शक्ति है)।
  2. विशाल समूह आकारों के साथ, केंद्रीय सीमा प्रमेय के लिए गैर-पैरामीट्रिक धन्यवाद के रूप में एक टी-टेस्ट भी देखा जा सकता है।
  3. टी-टेस्ट के परिणाम माध्य अंतर के लिए छात्र विश्वास अंतराल के अनुरूप हैं।
  4. यदि विभिन्न समूहों में भिन्नताएं भिन्न होती हैं, तो टी-टेस्ट का वेल्च संस्करण इसे ध्यान में रखने की कोशिश करता है, जबकि विलकॉक्सन का रैंक योग परीक्षण बुरी तरह से विफल हो सकता है यदि साधनों की तुलना की जाती है (उदाहरण के लिए नाममात्र स्तर से पहली तरह की त्रुटि संभावना बहुत अलग है। )।

2
मैं 1 से असहमत हूं। बस एक प्रक्रिया का उपयोग करना क्योंकि यह आपको निर्णय लेने की अनुमति देता है वास्तव में एक अच्छा कारण नहीं है, खासकर जब आपके पास उस प्रक्रिया के वैध होने की उम्मीद करने का कोई कारण नहीं है। यदि आपके पास बहुत कम या कोई डेटा नहीं है, तो बस एक निर्णय लें और दिखावा न करें कि यह कठोरता पर आधारित है।
dsaxton

5
मैं आपसे सहमत हुँ। यह स्पष्ट रूप से एक कारण है कि परिणाम अक्सर प्रतिलिपि प्रस्तुत करने योग्य नहीं होते हैं, भले ही उच्चतम रैंक वाली पत्रिकाओं में प्रकाशित हो। लेकिन एक शोधकर्ता के रूप में आपके पास क्या विकल्प हैं यदि बजट केवल छोटे नमूना आकार की अनुमति देता है?
माइकल एम।

1
4 और विलकॉक्सन-मैन-व्हिटनी को लागू करने में समस्याएं जब समूहों के बीच असमान परिवर्तन होते हैं, तो गैर-पैरामीट्रिक तरीके होते हैं जो विषमलैंगिकता के लिए अनुमति देते हैं: मैं उदाहरण के लिए क्लिफ के परीक्षण या ब्रूनर-मुन्ज़ेल परीक्षण को याद करता हूं। (मुझे नहीं लगता कि हमारे पास इस साइट पर उनके बारे में बहुत सारी जानकारी है।)
सिल्वरफ़िश

@Silverfish: मैं बार-बार ब्रूनर के तरीकों का उपयोग कर रहा हूं और मुझे लगता है कि आप सही हैं। लेकिन मुझे संदेह है कि वे वास्तव में तुलना कर रहे हैं इसका मतलब है कि मजबूत वितरण संबंधी धारणा बनाते समय निर्वासन।
माइकल एम।

1
@MichaelM हां बिल्कुल - जो अलग-अलग परिकल्पना वाले पैरामीट्रिक और गैर-पैरामीट्रिक तरीकों के सवाल पर वापस आता है, मुझे लगता है।
सिल्वरफिश

9

परिकल्पना परीक्षण में नॉनपैरेट्रिक परीक्षण अक्सर विभिन्न परिकल्पनाओं का परीक्षण कर रहे हैं, जो एक कारण है कि एक पैरामीट्रिक के लिए हमेशा एक अपरंपरागत परीक्षण का विकल्प नहीं हो सकता है।

अधिक आम तौर पर, पैरामीट्रिक प्रक्रियाएं अन्यथा असंरचित समस्याओं पर ढाँचे का एक तरीका प्रदान करती हैं । यह बहुत उपयोगी है और इसे इस धारणा के बजाय एक तरह के सरलीकरणवादी के रूप में देखा जा सकता है कि मॉडल वास्तव में सच है। उदाहरण के लिए एक सतत प्रतिक्रिया की भविष्यवाणी की समस्या लो का भविष्यफल बताने एक वेक्टर के आधार पर एक्स कुछ प्रतिगमन समारोह का उपयोग कर (यहां तक कि यह सोचते हैं कि इस तरह के एक समारोह में मौजूद है पैरामीट्रिक प्रतिबंध का एक प्रकार है)। अगर हम मान लेते हैं कि एफ के बारे में कुछ भी नहीं हैyएक्सतब यह बिल्कुल स्पष्ट नहीं है कि हम इस फ़ंक्शन का अनुमान लगाने में कैसे आगे बढ़ सकते हैं। संभावित उत्तरों का समूह, जिनकी हमें खोज करने की आवश्यकता है, वे अभी बहुत बड़े हैं। लेकिन अगर हम (उदाहरण के लिए) के लिए संभव उत्तरों की अंतरिक्ष प्रतिबंधित के सेट रैखिक कार्यों , तो हम वास्तव में प्रगति कर शुरू कर सकते हैं। हमें यह मानने की ज़रूरत नहीं है कि मॉडल वास्तव में धारण करता है, हम केवल कुछ उत्तर पर पहुंचने की आवश्यकता के कारण एक अनुमान लगा रहे हैं , हालांकि अपूर्ण।(एक्स)=Σजे=1पीβजेएक्सजे


हां, और यह एक मॉडल पूर्वाग्रह जोड़ता है। पी-वैल्यू शोधकर्ताओं की रिपोर्ट के बारे में क्या बताता है?
कगदस ओजेंक जूल

@dsaxton जो आप कहते हैं वह विभिन्न परिकल्पनाओं के परीक्षण के बारे में सच है लेकिन लोग अभी भी उनकी उसी तरह व्याख्या करते हैं। फिर वहाँ प्रतिगमन भी है, जहां आप nonparametric और पैरामीट्रिक विश्लेषण के बीच प्राप्त अंतर्दृष्टि बहुत अधिक हैं।
en 1

@ cagdas-ozgenc यह आपको बताता है कि मॉडल पर p- मान सशर्त हैं। लेकिन यह स्पष्ट नहीं है कि चीजें अन्यथा कैसे हो सकती हैं ...
संयुक्ताक्षरी

3
+1 यह ध्यान देने के लिए कि हमारे पास प्रतिगमन फ़ंक्शन के बारे में कुछ मान्यताओं के बिना एक प्रतिगमन में मूल्य के कुछ भी आकलन करने का बिल्कुल कोई मौका नहीं है ।
conjugateprior

9

सेमीपैरमेट्रिक मॉडल के कई फायदे हैं। वे एक विशेष मामले के रूप में विलकॉक्सन परीक्षण जैसे परीक्षण की पेशकश करते हैं, लेकिन प्रभाव अनुपात, क्वांटाइल्स, साधन, और अधिक संभावनाओं का अनुमान लगाने की अनुमति देते हैं। वे अनुदैर्ध्य और सेंसर डेटा का विस्तार करते हैं। वे वाई-स्पेस में मजबूत हैं और अनुमान लगाने के अलावा परिवर्तनकारी हैं। विस्तृत उदाहरण / केस स्टडी के लिए http://biostat.mc.vanderbilt.edu/rms लिंक हैंडआउट्स को देखें ।

टीYYएक्सएक्स1एक्स2। उदाहरणों में आनुपातिक अंतर मॉडल (विशेष मामला: विलकॉक्सन और क्रुस्ल-वालिस) और आनुपातिक खतरे मॉडल (विशेष मामला: लॉग-रैंक और स्तरीकृत लॉग-रैंक परीक्षण) शामिल हैं।

Y


1
मैं इसके साथ थोड़ा संघर्ष कर रहा हूं। क्या आप टी-टेस्ट को अर्ध-पैरामीट्रिक या गैर-पैरामीट्रिक मानते हैं? एक तरफ, मैंने हमेशा अर्ध-पैरामीट्रिक्स के 'जिस्ट' को मान लिया है, निम्नलिखित है: डेटा के लिए "कार्य" संभावना मॉडल लें, उस वितरण में मापदंडों का अनुमान लगाएं, चाहे वितरण सही हो, और त्रुटि अनुमान में सुधार हो। अनिश्चितता का हिसाब। (इसलिए गाऊसी स्कोर समीकरणों के समाधान के लिए सैंडविच आधारित त्रुटियां एक अर्ध-पैरामीट्रिक टी-टेस्ट होगी)। हालाँकि, अर्ध-पैरामीट्रिक्स में लगभग हमेशा आंशिक / कंडीशनिंग शामिल होती है, जैसा कि कॉक्स मॉडल के साथ होता है।
एडम जूल 30'15

मैं उस से निपटने के लिए अपने उत्तर में अधिक विवरण जोड़ूंगा।
फ्रैंक हारेल

6

आपूर्ति किए गए उत्तरों की मेजबानी के बीच, मैं बायेसियन आंकड़ों पर भी ध्यान दूंगा। कुछ समस्याओं का उत्तर केवल संभावना से नहीं दिया जा सकता है। एक फ़्रीक्वेंटिस्ट काउंटरफ़ेक्शनल रीज़निंग का उपयोग करता है, जहाँ "संभावना" वैकल्पिक ब्रह्मांडों को संदर्भित करता है और एक वैकल्पिक ब्रह्माण्ड की रूपरेखा किसी व्यक्ति की स्थिति का उल्लेख करने से कोई मतलब नहीं रखती है, जैसे कि एक अपराधी का अपराध या निर्दोषता, या क्या जीन आवृत्ति की अड़चन बड़े पैमाने पर पर्यावरणीय बदलाव के कारण प्रजातियाँ विलुप्त हो गईं। बायेसियन संदर्भ में, संभावना "विश्वास" है आवृत्ति नहीं, जिसे उस पर लागू किया जा सकता है जो पहले से ही अवक्षेपित है।

अब, अधिकांश बायेसियन विधियों को पूर्व और परिणाम के लिए पूरी तरह से संभाव्यता मॉडल निर्दिष्ट करने की आवश्यकता होती है। और, इनमें से अधिकांश संभावना मॉडल पैरामीट्रिक हैं। दूसरों के साथ क्या कह रहे हैं, इसके अनुरूप, डेटा के सार्थक सारांश का उत्पादन करने के लिए ये बिल्कुल सही नहीं हैं। "सभी मॉडल गलत हैं, कुछ मॉडल उपयोगी हैं।"

निश्चित रूप से, गैरपारंपरिक बायेसियन विधियां हैं। इनमें बहुत सी सांख्यिकीय झुर्रियाँ होती हैं और आम तौर पर बोलना, लगभग व्यापक जनसंख्या डेटा को सार्थक रूप से उपयोग करने की आवश्यकता होती है।


6

उपरोक्त सभी बारीक उत्तरों के बावजूद मैं केवल यही उत्तर दे रहा हूं कि किसी ने भी # 1 कारण पर ध्यान नहीं दिया है जिसका उपयोग हम पैरामीट्रिक परीक्षण (कम से कम कण भौतिकी डेटा विश्लेषण में) करते हैं। क्योंकि हम डेटा के पैरामीरिजेशन को जानते हैं। ओह! इतना बड़ा फायदा है। आप अपने सैकड़ों, हजारों या लाखों डेटा बिंदुओं को कुछ मापदंडों में उबाल रहे हैं, जिनके बारे में आप ध्यान रखते हैं और आपके वितरण का वर्णन करते हैं। ये आपको अंतर्निहित भौतिकी (या जो भी विज्ञान आपको अपना डेटा देता है) बताता है।

बेशक, यदि आपके पास अंतर्निहित संभावना घनत्व का कोई विचार नहीं है, तो आपके पास कोई विकल्प नहीं है: गैर-पैरामीट्रिक परीक्षणों का उपयोग करें। गैर-पैरामीट्रिक परीक्षणों में किसी भी पूर्वाग्रहित गैसों की कमी का गुण होता है, लेकिन इसे लागू करना कठिन हो सकता है - कभी-कभी बहुत कठिन।


5

नॉनपरमेट्रिक आँकड़ों की अपनी समस्याएं हैं! उनमें से एक परिकल्पना परीक्षण पर जोर है, अक्सर हमें अनुमान और आत्मविश्वास अंतराल की आवश्यकता होती है, और उन्हें गैर-पैरामीटर वाले जटिल मॉडल में प्राप्त करना --- जटिल है। इस बारे में एक बहुत अच्छी ब्लॉग पोस्ट है, चर्चा के साथ, http://andrewgelman.com/2015/07/13/dont-do-the-wilcoxon/ पर चर्चा इस अन्य पोस्ट, http: // notstatschat की ओर ले जाती है । tumblr.com/post/63237480043/rock-paper-screens-wilcoxon-test , जिसे विलकॉक्सन पर बहुत अलग दृष्टिकोण के लिए अनुशंसित किया गया है। संक्षिप्त संस्करण है: विलकॉक्सन (और अन्य रैंक परीक्षण) से अनियंत्रितता हो सकती है।


4
मुझे यकीन नहीं है कि पारगमन सब-एंड-बी है। और आप एक बहुत मजबूत और उपयोगी स्थान अनुमानक विश्वास अंतराल प्राप्त करने के लिए विलकॉक्सन परीक्षण को उल्टा कर सकते हैं।
फ्रैंक हरेल

2
कारण मॉडलिंग में नॉनट्रांससेंसिटी के अपने बिंदु हैं, लेकिन एसोसिएशन के सरल दो नमूना परीक्षणों के लिए, मुझे नहीं लगता कि यह वास्तव में एक मुद्दा है। इसके अलावा, मैं परिकल्पना परीक्षण / आकलन / अविश्वास अंतराल के अंतर को गैरप्रेमिक और पैरामीट्रिक तरीकों के बीच देखने में विफल रहता हूं। कभी-कभी, मजबूत अनुमान के साथ, आप एक कार्य संभाव्यता मॉडल का उपयोग करते हैं ताकि संबंधित पैरामीट्रिक अनुमान डेटा का एक सार्थक सारांश प्रदान करता है (भले ही यह सही संभावना मॉडल प्रति प्रति न हो)। शायद आप इस उत्तर पर विस्तार कर सकते हैं?
अदमो

2
आमतौर पर विलकॉक्सन टेस्ट के लिए कुछ अतिरिक्त धारणाएं बनाई जाती हैं, उदाहरण के लिए एक समूह के दूसरे पर स्टोकेस्टिक का प्रभुत्व, कि अगर सच में सकारात्मकता ठीक हो जाए।
Scortchi - फिर से बहाल करें मोनिका

3

मैं कहूंगा कि गैर-पैरामीट्रिक आंकड़े आमतौर पर इस अर्थ में लागू होते हैं कि वे पैरामीट्रिक आंकड़ों की तुलना में कम धारणा बनाते हैं।

फिर भी, यदि कोई पैरामीट्रिक सांख्यिकी का उपयोग करता है और अंतर्निहित धारणाएं पूरी होती हैं, तो पैरामाट्रिक आँकड़े गैर पैरामीट्रिक की तुलना में अधिक शक्तिशाली होंगे।


2

पैरामीट्रिक आँकड़े अक्सर बाहरी [डेटा] ज्ञान को शामिल करने के तरीके हैं। उदाहरण के लिए, आप जानते हैं कि त्रुटि वितरण सामान्य है, और यह ज्ञान या तो पूर्व अनुभव या कुछ अन्य विचार से आया है न कि डेटा सेट से। इस मामले में, सामान्य वितरण मानकर आप इस बाहरी ज्ञान को अपने पैरामीटर अनुमानों में शामिल कर रहे हैं, जिससे आपके अनुमानों में सुधार होना चाहिए।

आपकी घड़ी सादृश्य पर। इन दिनों लगभग सभी घड़ियाँ जल प्रतिरोधी होती हैं, जिनमें विशेष प्रकार के गहने या लकड़ी जैसी असामान्य सामग्री होती है। उन्हें पहनने का कारण ठीक यही है कि: वे विशेष हैं। अगर आपका मतलब वाटर प्रूफ है तो कई ड्रेस वॉच वाटर प्रूफ नहीं हैं। उन्हें पहनने का कारण फिर से उनका कार्य है: आप एक सूट और टाई के साथ एक गोताखोर घड़ी नहीं पहनेंगे। इसके अलावा, इन दिनों कई घड़ियाँ खुली हैं, ताकि आप क्रिस्टल के माध्यम से आंदोलन को देखने का आनंद ले सकें। स्वाभाविक रूप से, ये घड़ियाँ आमतौर पर पानी के सबूत नहीं होती हैं।


1
मुझे यह रूपक पसंद है! मुझे याद है कि एक प्रोफेसर ने हमें बताया था कि हमें एक ही बात पर अलग-अलग आँकड़ों को आज़माना चाहिए और देखना चाहिए कि क्या हम एक ही परिणाम प्राप्त कर सकते हैं।
दीप उत्तर

2

यह परिकल्पना परीक्षण परिदृश्य नहीं है, लेकिन यह आपके प्रश्न का उत्तर देने के लिए एक अच्छा उदाहरण हो सकता है: आइए क्लस्टरिंग विश्लेषण पर विचार करें। कई "गैर-पैरामीट्रिक" क्लस्टरिंग विधियां हैं जैसे कि पदानुक्रमित क्लस्टरिंग, के-साधन आदि, लेकिन समस्या हमेशा यह है कि मूल्यांकन कैसे करें कि आपका क्लस्टरिंग समाधान "बेहतर" है, अन्य संभावित समाधान की तुलना में (और अक्सर एक से अधिक समाधान हैं) । प्रत्येक एल्गोरिथ्म आपको यह सबसे अच्छा मिल सकता है, हालांकि आप कैसे जानते हैं कि अगर कुछ बेहतर नहीं है ..? अब, क्लस्टरिंग के लिए पैरामीट्रिक दृष्टिकोण भी हैं, तथाकथित मॉडल-आधारित क्लस्टरिंग है, जैसे परिमित मिश्रण मॉडल। FMM के साथ आप अपने डेटा के वितरण का वर्णन करने वाले एक सांख्यिकीय मॉडल का निर्माण करते हैं और इसे डेटा में फिट करते हैं। जब आपके पास अपना मॉडल होता है, तो आप यह आकलन कर सकते हैं कि इस मॉडल को दिए गए आपके डेटा की कितनी संभावना है, आप संभावना अनुपात परीक्षण का उपयोग कर सकते हैं, एआईसी की तुलना कर सकते हैं और मॉडल फिट और मॉडल तुलना की जांच के लिए कई अन्य तरीकों का उपयोग कर सकते हैं। गैर-पैरामीट्रिक क्लस्टरिंग एल्गोरिदम केवल समूह डेटा को कुछ समानता मानदंडों का उपयोग करते हुए, एफएमएम का उपयोग करने के साथ-साथ आपको वर्णन करने और अपने डेटा को समझने की कोशिश करने में सक्षम बनाता है, यह जांचें कि यह कितना फिट बैठता है, भविष्यवाणी करें ... व्यवहार में गैर-पैरामीट्रिक दृष्टिकोण सरल हैं, काम आउट-ऑफ-द-बॉक्स और बहुत अच्छे हैं, जबकि एफएमएम समस्याग्रस्त हो सकता है, लेकिन फिर भी, मॉडल-आधारित दृष्टिकोण अक्सर आपको समृद्ध उत्पादन प्रदान करते हैं।


2

गैर-पैरामीट्रिक मॉडल के लिए पूर्वानुमान और नए डेटा का पूर्वानुमान अक्सर बहुत मुश्किल या असंभव होता है। उदाहरण के लिए, मैं अगले 10 वर्षों के लिए एक वीबुल या लॉगेनॉलल उत्तरजीविता मॉडल का उपयोग करके वारंटी के दावों की संख्या का अनुमान लगा सकता हूं, हालांकि कॉक्स मॉडल या कापलान-मायर का उपयोग करना संभव नहीं है।

संपादित करें: मुझे थोड़ा और स्पष्ट होने दें। यदि किसी कंपनी के पास दोषपूर्ण उत्पाद है, तो वे वर्तमान वारंटी के दावों और बिक्री के आंकड़ों के आधार पर भविष्य के वारंटी दावे की दर और सीडीएफ को पेश करने में अक्सर रुचि रखते हैं। इससे उन्हें यह तय करने में मदद मिल सकती है कि किसी रिकॉल की जरूरत है या नहीं। मुझे नहीं पता कि आप गैर-पैरामीट्रिक मॉडल का उपयोग करके यह कैसे करते हैं।


7
क्षमा करें मैं असहमत हूं। आप मात्रा का अनुमान लगाने के लिए कॉक्स मॉडल का उपयोग कर सकते हैं, मतलब (यदि उच्चतम वाई मान बिना सेंसर किया गया है) और सभी प्रकार की संभावनाएं। डेटा की सीमा से परे पूर्वानुमान नहीं कर पाना हालांकि एक समस्या है (जैसा कि आपने उल्लेख किया है) लेकिन आप खतरनाक रूप से एक्सट्रपलेटिंग हो सकते हैं।
फ्रैंक हरेल

@FrankHarrell हां अच्छा बिंदु, एक्सट्रपलेशन करते समय हमेशा सावधान रहना चाहिए।
ग्लेन

रैंडम फॉरेस्ट, डीप लर्निंग या एसवीएम के बारे में क्या? वे सबसे अधिक हराते हैं यदि भविष्यवाणी के लिए सभी पैरामीट्रिक तरीके नहीं हैं।
en

2
कोशिश को छोड़कर एक निर्णय पेड़ एक विकर्ण सीमा सीखें
Bill_e

1

मैं ईमानदारी से मानता हूं कि इस सवाल का कोई सही जवाब नहीं है। दिए गए उत्तरों को देखते हुए, सर्वसम्मति यह है कि पैरामीट्रिक परीक्षण गैर-समतुल्य समकक्षों की तुलना में अधिक शक्तिशाली हैं। मैं यह दृश्य नहीं लूँगा, लेकिन मैं इसे तथ्यात्मक दृष्टिकोण के बजाय एक काल्पनिक के रूप में अधिक देखता हूं क्योंकि यह स्पष्ट रूप से स्कूलों में कुछ पढ़ाया नहीं जाता है और कोई भी सहकर्मी समीक्षक आपको कभी नहीं बताएगा कि "आपका पेपर अस्वीकार कर दिया गया था क्योंकि आपने गैर-पैरामीट्रिक परीक्षणों का उपयोग किया था"। यह सवाल कुछ इस बारे में है कि आंकड़ों की दुनिया स्पष्ट रूप से जवाब देने में असमर्थ है, लेकिन इसे स्वीकार कर लिया गया है।

मेरी निजी राय है कि पैरामीट्रिक या नॉनपैरेमेट्रिक दोनों में से किसी भी चीज की तुलना में परम्परागत की प्राथमिकता अधिक है (बेहतर तरीके से कमी के लिए)। परीक्षण और भविष्यवाणी के लिए पैरामीट्रिक तकनीक पहले थी और एक लंबा इतिहास है, इसलिए उन्हें पूरी तरह से अनदेखा करना आसान नहीं है। विशेष रूप से भविष्यवाणी, कुछ प्रभावशाली गैर-समसामयिक समाधान हैं जो आजकल पहली पसंद उपकरण के रूप में व्यापक रूप से उपयोग किए जाते हैं। मुझे लगता है कि यह एक कारण है कि मशीन लर्निंग तकनीक जैसे कि तंत्रिका नेटवर्क और निर्णय पेड़, जो प्रकृति द्वारा अप्रकाशित हैं, ने हाल के वर्षों में व्यापक लोकप्रियता हासिल की है।


3
3/π95%

'सहमति ’का अर्थ है' सामान्य समझौता’, न कि मेरा व्यक्तिगत दृष्टिकोण।
डिजीओ

2
मैं इस बात का जिक्र नहीं कर रहा था कि क्या कथन आपके निजी विचारों का प्रतिनिधित्व करता है या दूसरों के सामूहिक ज्ञान का, केवल इस बात की ओर इशारा करता है कि यदि पैरामीट्रिक टेस्ट के लिए आवश्यक शर्तें सही हैं तो यह कथन सही है । जब स्थितियां धारण नहीं करती हैं, तो यह अब ऐसा नहीं हो सकता है कि "पैरामीट्रिक परीक्षण नॉनपैरेमेट्रिक की तुलना में अधिक शक्तिशाली हैं", और वास्तव में रिवर्स मामला हो सकता है (कभी-कभी बहुत व्यापक मार्जिन से)।
सिल्वरफिश

ट्च! ..... +1
डिगियो

0

यह सांख्यिकीय शक्ति का मुद्दा है। गैर-पैरामीट्रिक परीक्षणों में आमतौर पर उनके पैरामीट्रिक समकक्षों की तुलना में कम सांख्यिकीय शक्ति होती है।


6
जब उनकी धारणाएं पूरी होती हैं, तो पैरामीट्रिक परीक्षणों में अधिक शक्ति होगी। जब उनकी धारणाएं पूरी नहीं होती हैं, तो गैर-पैरामीट्रिक परीक्षण अधिक शक्तिशाली हो सकते हैं।
गंग -

3
यह उत्तर बहुत छोटा है, और शक्ति पिछले उत्तरों में चर्चा की गई है। क्या आप इसे थोड़ा विस्तार देने पर विचार करेंगे?
Scortchi - फिर से बहाल करें मोनिका

4
पैरामीट्रिक परीक्षणों से बिजली का लाभ तब कम हो जाता है जब बिजली की तुलना में उन्हें नुकसान होता है जब उनकी धारणाएं पूरी नहीं होती हैं।
फ्रैंक हरेल

फ्रैंक, यह परीक्षण पर निर्भर करता है, कुछ परीक्षण उनकी मान्यताओं के उल्लंघन के लिए अधिक मजबूत हैं।
छिपे हुए मार्कोव मॉडल

0

बहुत अच्छे जवाब पहले से ही हैं लेकिन कुछ कारण हैं जिनका मैंने उल्लेख नहीं किया है:

  1. अपनेपन। आपके दर्शकों के आधार पर, पैरामीट्रिक परिणाम लगभग एक बराबर गैर-पैरामीट्रिक से अधिक परिचित हो सकता है। यदि दोनों समान निष्कर्ष देते हैं, तो परिचित होना अच्छा है।

  2. सादगी। कभी-कभी, पैरामीट्रिक परीक्षण प्रदर्शन करने और रिपोर्ट करने के लिए सरल होता है। कुछ अपरंपरागत तरीके बहुत कंप्यूटर गहन हैं। बेशक, कंप्यूटर ने बहुत तेजी से प्राप्त किया है और एल्गोरिदम में भी सुधार हुआ है, लेकिन .... डेटा ने "बड़ा" प्राप्त किया है।

    1. कभी-कभी पैरामीट्रिक परीक्षण का आमतौर पर नुकसान क्या होता है, वास्तव में एक फायदा है, हालांकि यह विशेष रूप से जोड़े के परीक्षणों के लिए विशिष्ट है। उदाहरण के लिए, मैं आम तौर पर, मात्रात्मक प्रतिगमन का प्रशंसक हूं क्योंकि यह सामान्य विधियों की तुलना में कम धारणा बनाता है। लेकिन कभी-कभी आपको माध्य की बजाय माध्य का अनुमान लगाने की आवश्यकता होती है।
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.