क्या कोई सांख्यिकीय परीक्षण है जो पैरामीट्रिक और गैर पैरामीट्रिक है?


20

क्या कोई सांख्यिकीय परीक्षण है जो पैरामीट्रिक और गैर पैरामीट्रिक है? यह सवाल एक इंटरव्यू पैनल ने पूछा था। क्या यह वैध प्रश्न है?


1
एक गैर साक्षात्कारकर्ता आंकड़ों के लिए विकिपीडिया प्रविष्टि का अध्ययन आपको एक साक्षात्कारकर्ता के लिए तैयार करने के लिए पर्याप्त हो सकता है। आप एक प्रश्न के साथ प्रश्न का उत्तर दे सकते हैं, जैसे कि "आप गैर-पैरामीट्रिक से क्या मतलब है? वितरण-मुक्त मॉडल या रैंक-क्रम सांख्यिकीय?"
jhhorn424

3
प्रस्थान के एक बिंदु के रूप में, यह परिभाषाओं से संबंधित एक प्राधिकरण ( इंटरनेट नहीं !) से परामर्श करने में आपकी, साथ ही आपके उत्तरदाताओं की मदद कर सकता है । " पैरामीट्रिक मामले ... वे सभी हैं जिनमें सभी प्रकृति के राज्यों [प्रकृति के राज्यों] का प्रतिनिधित्व एक सदिश रूप में किया जा सकता है जिसमें प्राकृतिक तरीके से वास्तविक घटकों की एक सीमित संख्या होती है। (... वितरण और नुकसान समारोह पर निर्भर एक यथोचित चिकनी फैशन में) अन्य सभी समस्याओं कहा जाता है। nonparametric --JC कीफर,। सांख्यिकी निष्कर्ष, का परिचय । पी 23θθθ
whuber

प्रोफेसर में से एक ने मुझे बताया कि 'ची-स्क्वायर टेस्ट' में दोनों व्यवहार होते हैं (जैसे, पैरामीट्रिक और नॉनपैमेट्रिक)। मुझे बिल्कुल समझ नहीं आया, क्यों 'ची स्क्वायर टेस्ट' में दोनों व्यवहार हैं।
14

3
यह परीक्षण नहीं है कि पैरामीट्रिक है, यह मॉडल है। ची-स्क्वायर वितरण दोनों स्थितियों में उत्पन्न होते हैं (सामान्य वितरण मॉडल में एक प्राकृतिक तरीके से सामान्य वितरणीय मान्यताओं के साथ, और लॉग संभावना के अंतर के लिए एक सन्निकटन के रूप में - दोनों पैरामीट्रिक अनुप्रयोग - और बहुराष्ट्रीय के लिए एक सन्निकटन के रूप में भी। वितरण जो कई अपरंपरागत अनुप्रयोगों में उत्पन्न होते हैं), इसलिए "चि-चुकता" नाम से साझा करने वाले कई अलग-अलग परीक्षण हैं। यह संभवतः आपके प्रोफेसर की टिप्पणी का सुझाव है।
whuber

@whuber: क्या आपकी अंतिम टिप्पणी का मतलब है कि अच्छाई के लिए ची-स्क्वायर टेस्ट गैर-समरूप है?
टिम

जवाबों:


6

"पैरामीट्रिक परीक्षण" और "गैर-पैरामीट्रिक परीक्षण" द्वारा वास्तव में क्या मतलब है, यह बताना मुश्किल है, हालांकि कई ठोस उदाहरण हैं जहां अधिकांश इस बात पर सहमत होंगे कि क्या परीक्षण पैरामीट्रिक या गैर पैरामीट्रिक है (लेकिन दोनों कभी नहीं) । एक त्वरित खोज ने यह तालिका दी , जो मुझे लगता है कि पैरामीट्रिक और गैर-पैरामीट्रिक परीक्षणों के बीच कुछ क्षेत्रों में एक सामान्य व्यावहारिक अंतर का प्रतिनिधित्व करता है।

तालिका के ठीक ऊपर एक टिप्पणी है:

"... पैरामीट्रिक डेटा में एक अंतर्निहित सामान्य वितरण है .... और कुछ भी गैर पैरामीट्रिक है।"

यह कुछ क्षेत्रों में एक स्वीकृत मानदंड हो सकता है जो या तो हम सामान्यता मान लेते हैं और एनोवा का उपयोग करते हैं, और यह पैरामीट्रिक है, या हम सामान्यता नहीं मानते हैं और गैर-पैरामीट्रिक विकल्प का उपयोग करते हैं।

यह शायद बहुत अच्छी परिभाषा नहीं है, और यह वास्तव में मेरी राय में सही नहीं है, लेकिन यह अंगूठे का एक व्यावहारिक नियम हो सकता है। ज्यादातर इसलिए कि सामाजिक विज्ञानों में अंतिम लक्ष्य, डेटा का विश्लेषण करना है, और गैर-सामान्य वितरण के आधार पर एक पैरामीट्रिक मॉडल तैयार करने में सक्षम होना अच्छा है और फिर डेटा का विश्लेषण करने में सक्षम नहीं है?

एक वैकल्पिक परिभाषा, "गैर-पैरामीट्रिक परीक्षण" को उन परीक्षणों के रूप में परिभाषित करना है जो वितरण योग्य मान्यताओं और पैरामीट्रिक परीक्षणों पर निर्भर नहीं करते हैं।

पूर्व के साथ-साथ बाद की परिभाषा प्रस्तुत परीक्षणों के एक वर्ग को परिभाषित करती है और फिर अन्य वर्ग को पूरक (कुछ भी) के रूप में परिभाषित करती है। परिभाषा के अनुसार, यह नियम बताता है कि एक परीक्षण पैरामीट्रिक के साथ-साथ गैर पैरामीट्रिक भी हो सकता है।

सच्चाई यह है कि बाद की परिभाषा भी समस्याग्रस्त है। क्या होगा अगर कुछ प्राकृतिक "गैर-पैरामीट्रिक" धारणाएं हैं, जैसे कि समरूपता, जिसे लगाया जा सकता है? क्या यह एक परीक्षण आँकड़ा बदल देगा जो अन्यथा किसी पैरामीट्रिक परीक्षण में किसी भी वितरण संबंधी मान्यताओं पर भरोसा नहीं करता है? ज्यादातर कहेंगे ना!

इसलिए गैर-पैरामीट्रिक परीक्षणों के वर्ग में परीक्षण होते हैं जिन्हें कुछ वितरण संबंधी धारणाएं बनाने की अनुमति होती है जब तक कि वे "बहुत पैरामीट्रिक" न हों। "पैरामीट्रिक" और "नॉन-पैरामीट्रिक" परीक्षणों के बीच की सीमा धुंधली हो गई है, लेकिन मेरा मानना ​​है कि अधिकांश इस बात को बनाए रखेंगे कि या तो एक परीक्षण पैरा-मैट्रिक है या गैर-पैरामीट्रिक है, शायद यह न तो हो सकता है, बल्कि यह कह सकता है कि यह दोनों है थोड़ा समझ में आता है।-

एक अलग दृष्टिकोण लेते हुए, कई पैरामीट्रिक परीक्षण (समतुल्य) संभावना अनुपात परीक्षण हैं। यह एक सामान्य सिद्धांत को संभव बनाता है, और हमारे पास उपयुक्त नियमितता परिस्थितियों में संभावना अनुपात परीक्षणों के वितरण गुणों की एक एकीकृत समझ है। गैर-पैरामीट्रिक परीक्षण, इसके विपरीत, प्रति से तुलना अनुपात अनुपात परीक्षण के बराबर नहीं हैं कोई संभावना नहीं है - और संभावना के आधार पर एकीकृत पद्धति के बिना हमें केस-बाय-केस आधार पर वितरण परिणाम प्राप्त करना होगा। अनुभवजन्य संभावना का सिद्धांत--स्टैनफोर्ड में मुख्य रूप से आर्ट ओवेन द्वारा विकसित किया गया है, हालांकि, एक बहुत ही दिलचस्प समझौता है। (के रूप में मैं एक की तुलना में अधिक महत्वपूर्ण वस्तु के रूप में संभावना के संबंध में, मेरे लिए एक महत्वपूर्ण बिंदु यह आंकड़े की प्रबल संभावना है आधारित दृष्टिकोण प्रदान करता है ठेठ पैरामीट्रिक वितरणात्मक मान्यताओं के आवश्यकता के बिना -value, कहते हैं)। मौलिक विचार अनुभवजन्य डेटा पर बहुराष्ट्रीय वितरण का एक चतुर उपयोग है, तरीके बहुत "पैरामीट्रिक" हैं फिर भी पैरामीट्रिक मान्यताओं को प्रतिबंधित किए बिना मान्य हैं।पी

अनुभवजन्य संभावना के आधार पर परीक्षण, IMHO, पैरामीट्रिक परीक्षणों के गुण और गैर-पैरामीट्रिक परीक्षणों की व्यापकता है, इसलिए जिन परीक्षणों के बारे में मैं सोच सकता हूं, वे पैरामीट्रिक होने के साथ-साथ गैर पैरामीट्रिक होने के लिए योग्य हैं, हालांकि मैं इस शब्दावली का उपयोग न करें।


+1 बहुत ही रोचक टिप्पणियां। जहां तक ​​सीमा रेखा "धुंधली" हो रही है, मैं इसे धारणा के बारे में एक सही कथन के रूप में लेता हूं , लेकिन स्वयं परिभाषाओं में कोई धुंधलापन नहीं है: पैरामीट्रिक और गैर-पैरामीट्रिक के बीच का अंतर उतना ही स्पष्ट और तेज है जितना कि, कहना, परिमित और अनंत।
whuber

@whuber, "धुंधला" के बारे में, मैं विशेष रूप से इस तथ्य का उल्लेख कर रहा था कि गैर-पैरामीट्रिक परीक्षणों के लिए भी वितरण संबंधी धारणाएं हो सकती हैं, इस प्रकार मेरी दूसरी परिभाषा भी काम नहीं करती है। यदि मुझे एक तेज परिभाषा का प्रयास करना चाहिए, तो एक पैरामीट्रिक परीक्षण एक मॉडल पर आधारित है जो परिमित आयामी यूक्लिडियन अंतरिक्ष के सबसेट द्वारा पैरामीट्रिक किया जा सकता है। जो मुझे लगता है कि सबसे अधिक "धुंधला" है कि यह मेरे लिए अस्पष्ट है, "कोई वितरण संबंधी धारणाओं" से कितनी दूर है, आप गैर-पैरामीट्रिक मान्यताओं से पहले जा सकते हैं जितना कि पैरामीट्रिक धारणाएं हैं।
NRH

@whuber, मैंने अब आपकी टिप्पणी को Kiefer के संदर्भ में प्रश्न के साथ पढ़ा, और हाँ, औपचारिक परिभाषा के लिए किसी प्राधिकारी से परामर्श करना निश्चित रूप से एक अच्छा विचार है! मैं वास्तव में अधिक चिंतित था कि लोग आम तौर पर "गैर-पैरामीट्रिक" कहने पर क्या मतलब रखते हैं, और मुझे लगता है कि उनके दिमाग में कुछ केफेर-परिभाषा है।
एनआरएच

मूल प्रश्न के लिए एक टिप्पणी में Kiefer से मेरा उद्धरण देखें। विशेष रूप से, "गैर-पैरामीट्रिक" का अर्थ "कोई वितरण संबंधी धारणा नहीं है।" इसके विपरीत, सबसे प्रसिद्ध गैर-पैरामीट्रिक परीक्षण सभी वितरण संबंधी धारणाएं बनाते हैं। मुझे लगता है कि मैं "धुंधली" की आपकी समझ को समझता हूं: मैंने उसके लिए परिमित / अनंत सादृश्य को चुना, क्योंकि व्यवहार में मापदंडों की एक बहुत बड़ी (लेकिन परिमित) संख्या बस के रूप में अच्छी तरह से अनंत मानी जा सकती है।
whuber

2

पैरामीट्रिक का उपयोग (कम से कम) दो अर्थों में किया जाता है: - घोषित करने के लिए आप मानदंड के परिवार को मानदंड तक मान रहे हैं। बी - घोषित करने के लिए आप व्याख्यात्मक चर और परिणाम के बीच विशिष्ट कार्यात्मक संबंध मान रहे हैं।

कुछ उदाहरण:

  • एक रैखिक लिंक के साथ एक मात्रात्मक प्रतिगमन बी-पैरामीट्रिक और ए-गैर-पैरामीट्रिक के रूप में योग्य होगा।
  • गौसियन शोर के साथ एक समय श्रृंखला के तले चिकनाई ए-गैर-पैरामीट्रिक और बी-पैरामीट्रिक के रूप में गुणवत्ता कर सकती है।

शब्द "अर्ध-पैरामीट्रिक" आमतौर पर केस बी को संदर्भित करता है और इसका मतलब है कि आप पूरे कार्यात्मक संबंध नहीं मान रहे हैं, लेकिन इसके बजाय आपके पास "पूर्ववर्ती के कुछ सुचारू परिवर्तन में योगात्मक" जैसी सैन्य धारणाएं हैं।

आप शोर के वितरण पर भी दूधिया धारणा हो सकते हैं- जैसे "सभी क्षण परिमित हैं", विशेष रूप से वितरण के आकार को निर्दिष्ट किए बिना। मेरे ज्ञान का सबसे अच्छा करने के लिए, इस प्रकार की धारणा के लिए कोई शब्द नहीं है।

ध्यान दें कि उत्तर डेटा निर्माण प्रक्रिया के पीछे अंतर्निहित धारणाओं से संबंधित है। जब "ए-पैरामीट्रिक टेस्ट" कहा जाता है, तो एक आमतौर पर गैर-पैरामीट्रिक को समझ में आता है। ए। इसका मतलब है कि आप इसका मतलब है, तो मैं "नहीं" का जवाब दूंगा। एक ही समय में एक ही अर्थ में पैरामीट्रिक और गैर पैरामीट्रिक होना असंभव होगा।


पहले पैराग्राफ में दो अर्थों का अक्सर साहित्य में एक एकीकृत उपचार होता है: अर्थात्, उनके बीच कोई मौलिक या महत्वपूर्ण अंतर प्रतीत नहीं होता है। BTW, "सभी क्षण परिमित हैं" मामला निश्चित रूप से एक गैर-पैरामीट्रिक समस्या है।
whuber

@whuber: केइफ़र में परिभाषा दोनों मामलों को कवर करती है (मैं मानता हूं- मैंने इसे कभी नहीं पढ़ा है और मैं अभी भी अपवाद की तलाश में हूं)। दूसरी ओर, शब्द अपने अर्थ बदलते हैं। "एम्पिरिकल-बेस" का अब कोई मतलब नहीं है कि रॉबिन्स ने 1955 में इसका क्या उपयोग किया था। आप इस तथ्य को अनदेखा नहीं कर सकते कि एक से अधिक व्याख्याएं चल रही हैं।
जॉनरोस

ठीक है, लेकिन हमें थोड़ा चुना जाना चाहिए: यह स्पष्ट है कि कई व्याख्याएं और "पैरामीट्रिक" और "गैर-पैरामीट्रिक" की परिभाषाएं अज्ञानता की अभिव्यक्ति हैं, समझ की नहीं। क्या आप एक वैकल्पिक परिभाषा का हवाला दे सकते हैं जो एक बार स्पष्ट, कठोर और आधिकारिक है (इस अर्थ में सटीक, आधिकारिक रूप से कि यह एक विश्वसनीय सहकर्मी द्वारा समीक्षित पत्रिका द्वारा प्रश्न के बिना स्वीकार किया जाएगा)?
whuber

1
@ शुभंकर: मैं चुनौती स्वीकार करता हूं! :-) यद्यपि ध्यान दें, चूंकि सभी शोधकर्ता विकिपीडिया में अपने लुकअप को शुरू करते हैं, यह तब तक की बात है जब तक कि विश्वसनीय सहकर्मी-समीक्षित जर्नल विकी परिभाषा के साथ संरेखित नहीं हो जाते। ("अगर आप उन्हें हरा नहीं सकते ...")
जॉनरोस

1
विकिपीडिया लेख 1940, जो न केवल पहले उपयोग करने के लिए है से वुल्फोवित्ज़ उद्धरण "गैर पैरामीट्रिक," लेकिन यह भी कीफर की प्रत्यक्ष बौद्धिक पूर्वजों से एक है। मुझे नहीं लगता कि हम वहां कोई वास्तविक अंतर पाएंगे। (किफ़र केवल नुकसान फ़ंक्शन के बारे में एक तकनीकी आवश्यकता जोड़ता है।) हालांकि, मुझे संदेह है कि बहुत कम (यदि कोई हो) वास्तविक शोधकर्ता विकिपीडिया को प्रस्थान के बिंदु के रूप में लेते हैं, खासकर गणितीय नींव वाले क्षेत्रों में नहीं!
whuber

1

मुझे लगता है कि "पैरामीट्रिक और गैर पैरामीट्रिक" से उनका क्या अर्थ है यह निर्भर करता है? एक ही समय में बिल्कुल दोनों, या दो का मिश्रण?

कई कॉक्स आनुपातिक खतरों के मॉडल को अर्ध-पैरामीट्रिक मानते हैं, क्योंकि यह आधारभूत खतरे का अनुमान नहीं लगाता है।

या आप वास्तव में बड़े पैमाने पर पैरामीट्रिक के रूप में कई गैर-पैरामीट्रिक आँकड़े देखने का विकल्प चुन सकते हैं।


7
यह एक चकमा लगता है। प्रश्न यह जांच कर रहा है कि क्या कोई "पैरामीट्रिक" और "गैर पैरामीट्रिक" के बीच अंतर की सराहना करता है या नहीं, यह स्पष्ट है या नहीं। एक अच्छा जवाब उस भेद को रोशन करेगा, उसे भ्रमित नहीं करेगा।
व्हिबर

1
@whuber कौन सा "सवाल"? पैनल, या ओपी? क्योंकि मेरे दिमाग में, ओपी कुछ भी भेद नहीं कर रहा है। जिसका अर्थ है कि यह इस बात पर निर्भर करता है कि लोग कहां रेखा खींचते हैं। मुझे नहीं लगता कि "खैर, यह निर्भर करता है" के लिए एक सामान्य और दार्शनिक उदाहरण दोनों प्रदान करता है। मुझे लगता है कि यह एक जवाब है। जैसे कोई "पैरामीट्रिक" को पूरी तरह से पैरामीट्रिक मानता है, या केवल पैरामीटर होना चाहता है।
फोमाइट

"कौन सा सवाल" के बारे में बात अच्छी है। मुझे लगता है कि जहां मुझे आपके जवाब से कुछ परेशानी होने लगी है, वह यह है कि यह इस बात को स्पष्ट करता है कि मेरे संसाधनों के अनुसार कोई मतलब नहीं है (एक "मिश्रण" निरर्थक है, साथ ही यह विचार भी है कि एक "आँकड़ा" पैरामीट्रिक हो सकता है), जो सुझाव देता है आप "पैरामीट्रिक" और "गैर-पैरामीट्रिक" की एक अलग परिभाषा का उपयोग कर रहे हैं जो मैं कर रहा हूं। यद्यपि आप एक उत्कृष्ट बिंदु बनाते हैं कि एक उत्तर पर निर्भर करता है कि इन शर्तों का क्या मतलब है, आप वास्तव में अपने बाद की टिप्पणियों को स्पष्ट या समझने योग्य बनाने के लिए परिभाषा नहीं देते हैं।
whuber

@ शुभ मेला काफी मुझे मूल प्रश्न कुछ निरर्थक लगा, इसलिए मैं जो कर सकता था वह कर रहा था। इस सवाल का अब बेहतर जवाब है कि ओपी का मतलब क्या है, इसके बारे में कुछ धारणाएं बनाते हैं।
फोमाइट

0

ब्रैडली ने अपने क्लासिक डिस्ट्रीब्यूशन-फ्री स्टेटिस्टिकल टेस्ट्स (1968, पृष्ठ 15-16 - एक उद्धरण के लिए इस प्रश्न को देखें ) में वितरण-मुक्त और गैर - समरूप परीक्षणों के बीच अंतर को स्पष्ट किया गया है , जो कहता है कि वे अक्सर एक-दूसरे के साथ भ्रमित होते हैं, और देते हैं मध्यिका के लिए साइन परीक्षण के रूप में एक पैरामीट्रिक वितरण-मुक्त परीक्षण का उदाहरण । यह परीक्षण विभिन्न मूल्यों के नमूने की अंतर्निहित वितरण के बारे में कोई धारणा नहीं बनाता है, इसलिए यह वितरण-मुक्त है । हालांकि, यदि चयनित माध्य सही है, तो इसके ऊपर और नीचे के मान समान संभावनाओं पर चुने जाने चाहिए, जिसमें से यादृच्छिक नमूने का परीक्षण किया गया हैपी=0.5

अपडेट करें

(¬)


1
मुझे इस उत्तर की शुरुआत पसंद है क्योंकि यह एक दिलचस्प अंतर बनाता है और एक अच्छे संदर्भ के साथ इसका समर्थन करता है। हालांकि, यह मुझे लगता है कि बाकी का जवाब आंकड़े के गुणों के बारे में मान्यताओं को भ्रमित करता है। साइन टेस्ट की धारणाएं वास्तव में "वितरण मुक्त हैं।" हालांकि, तथ्य यह है कि परीक्षण सांख्यिकीय का नमूना वितरण द्विपद है एक पूरी तरह से अलग मुद्दा है और प्रक्रिया पैरामीट्रिक नहीं करता है!
व्हीबर

खैर, ब्रैडली खुद को पेज 15. पर साइन टेस्ट डिस्ट्रीब्यूशन-फ्री अभी तक पैरामीट्रिक कहते हैं। दो प्रमुख वाक्य अपनी संपूर्णता में लाने के लिए टिप्पणी बॉक्स बहुत छोटा है। कृपया अन्य उत्तर पढ़ें, विशेष रूप से वाक्य जो "मोटे तौर पर बोलना" शुरू करते हैं ... और "पूरी तरह से स्पष्ट होने के लिए ..."। धन्यवाद।
अवराम

अगर ब्रैडली के साथ ऐसा है, तो या तो इन शब्दों के अर्थ तब से बदल गए हैं या (मुझे यह कहने से नफरत है) आपने जो लिखा वह गलत है। (मेरे पास एक कॉपी नहीं है जिसे मैं जांच सकता हूं।) यह निश्चित रूप से अब नहीं है - और न ही यह कम से कम पिछले 30 वर्षों से है - जो कि "पैरामीट्रिक" ने एक परीक्षण सांख्यिकीय के वितरण के लिए संदर्भित किया है। विकिपीडिया लेख में वोल्फोवित्ज़ उद्धरण देखें ।
whuber

2
एफΩθ

2
इसके लायक होने के लिए, मैंने दो अन्य सांख्यिकीय ग्रंथों में देखा, डेग्रोट की प्रायिकता और सांख्यिकी (2 थ एड, पीपी 520-521) और लार्सन का प्रोबबिलिटी थ्योरी एंड स्टैटिस्टिकल इंफ़ेक्शन (तीसरा संस्करण, पीपी 50.50-50-50) और दोनों का उपयोग शब्द पैरामीट्रिक का अर्थ है कि ब्रैडली वितरण-मुक्त कहते हैं , जो किफ़र की तरह है, मुझे लगता है। तो, ओपी का जवाब देने के लिए, यह इस बात पर निर्भर करता है कि आप "पैरामीट्रिक" को कैसे परिभाषित करते हैं।
अवराम
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.