"गैर पैरामीट्रिक सांख्यिकीय मॉडल" के वास्तविक जीवन उदाहरण क्या हैं?


12

मैं यहाँ सांख्यिकीय मॉडल पर विकिपीडिया लेख पढ़ रहा हूँ , और मैं कुछ हद तक "गैर-पैरामीट्रिक सांख्यिकीय मॉडल" के अर्थ के रूप में हैरान हूँ, विशेष रूप से:

एक सांख्यिकीय मॉडल nonparametric है यदि पैरामीटर सेट अनंत आयामी है। एक सांख्यिकीय मॉडल अर्धवृत्ताकार है अगर इसमें परिमित-आयामी और अनंत-आयामी दोनों पैरामीटर हैं। औपचारिक रूप से, यदि d Θ का आयाम है और n नमूनों की संख्या है, तो दोनों semiparametric और nonparametric मॉडल d as n ∞ हैं । यदि / n 0 के रूप में एन , तो मॉडल semiparametric है; अन्यथा, मॉडल nonparametric है।ΘdΘndnd/n0n

मुझे लगता है कि यदि एक मॉडल का आयाम , (मैं इसे सचमुच में लेता हूं, तो मापदंडों की संख्या) परिमित है, तो यह एक पैरामीट्रिक मॉडल है।

मेरे लिए क्या मायने नहीं रखता है, यह है कि हमारे पास एक सांख्यिकीय मॉडल हो सकता है जिसमें अनंत संख्या में पैरामीटर होते हैं, जैसे कि हम इसे "गैर-पैरामीट्रिक" कहते हैं। इसके अलावा, यहां तक ​​कि अगर यह मामला था, तो "गैर-", यदि वास्तव में अनंत आयाम हैं? अंत में, जब से मैं मशीन-लर्निंग बैकग्राउंड से इस पर आ रहा हूं, क्या इस "गैर-पैरामीट्रिक सांख्यिकीय मॉडल" और "गैर-पैरामीट्रिक मशीन लर्निंग मॉडल" के बीच कोई अंतर है? अंत में, इस तरह के "गैर पैरामीट्रिक अनंत आयामी मॉडल" के कुछ ठोस उदाहरण क्या हो सकते हैं?


3
एक अन्य विकी पेज ( en.wikipedia.org/wiki/… ) का उपयोग करते हुए : 'गैर-पैरामीट्रिक मॉडल पैरामीट्रिक मॉडल से भिन्न होते हैं, जिसमें मॉडल संरचना को प्राथमिकता नहीं दी जाती है, बल्कि इसके बजाय डेटा से निर्धारित किया जाता है। गैर-पैरामीट्रिक शब्द का अर्थ यह नहीं है कि ऐसे मॉडल में पूरी तरह से मापदंडों का अभाव है, लेकिन यह कि मापदंडों की संख्या और प्रकृति लचीली है और पहले से तय नहीं है। ' इसलिए गैर-पैरामीट्रिक में अनंत संख्या में पैरामीटर नहीं हैं, लेकिन अज्ञात संख्या में पैरामीटर हैं।
रिफ

मुझे एक शंका है। गैर-पैरामीट्रिक मॉडल में, हम मॉडल की संरचना को प्राथमिकता देते हैं। उदाहरण के लिए, निर्णय पेड़ (जो एक गैर-पैरामीट्रिक मॉडल है) में हम max_depth को परिभाषित करते हैं। फिर आप कैसे कह सकते हैं कि यह पैरामीटर वास्तव में डेटा से ही सीखा / निर्धारित किया गया है और हमारे द्वारा पूर्व-निर्धारित नहीं है?
अमरप्रीत सिंह

जवाबों:


5

जैसा कि Johnnyboycurtis ने उत्तर दिया है, गैर-पैरामीट्रिक तरीके वे हैं यदि यह एक मॉडल बनाने के लिए जनसंख्या वितरण या नमूना आकार पर कोई धारणा नहीं बनाता है।

के-एनएन मॉडल एक गैर-पैरामीट्रिक मॉडल का एक उदाहरण है क्योंकि यह किसी मॉडल को विकसित करने के लिए किसी भी धारणा पर विचार नहीं करता है। एक Naive Bayes या K- साधन पैरामीट्रिक का एक उदाहरण है क्योंकि यह एक मॉडल बनाने के लिए एक वितरण मानता है।

उदाहरण के लिए, K- साधन एक मॉडल विकसित करने के लिए निम्नलिखित मानता है सभी क्लस्टर गोलाकार होते हैं (iid Gaussian)। सभी अक्षों में समान वितरण और इस प्रकार विचरण है। सभी क्लस्टर समान रूप से आकार के हैं।

के-एनएन के लिए, यह भविष्यवाणी के लिए पूर्ण प्रशिक्षण सेट का उपयोग करता है। यह भविष्यवाणी के लिए परीक्षण बिंदु से निकटतम पड़ोसियों की गणना करता है। यह एक मॉडल बनाने के लिए कोई वितरण नहीं मानता है।

अधिक जानकारी के लिए:

  1. http://pages.cs.wisc.edu/~jerryzhu/cs731/stat.pdf
  2. https://stats.stackexchange.com/a/133841/86202
  3. https://stats.stackexchange.com/a/133694/86202

क्या आप इस पर विस्तार कर सकते हैं? क्यों KNN एक गैर पैरामीट्रिक का एक उदाहरण है, और K- साधन क्यों हो सकता है? यह उन विवरणों के बाद मैं हूं, जो गैर-पैरामीट्रिक तरीकों के esp उदाहरण हैं, और क्यों / कैसे वे जनसंख्या वितरण पर एक धारणा नहीं है। धन्यवाद!
क्रिएट्रॉन

@ क्रिएट्रोन मैंने अधिक स्पष्टीकरण के लिए उत्तर को संशोधित किया है।
प्रशान्त

3

इसलिए, मुझे लगता है कि आप कुछ बिंदुओं को याद कर रहे हैं। सबसे पहले, और सबसे महत्वपूर्ण बात,

एक सांख्यिकीय पद्धति को गैर-पैरामीट्रिक कहा जाता है यदि यह जनसंख्या वितरण या नमूना आकार पर कोई धारणा नहीं बनाता है।

यहाँ कुछ गैर-आदर्श मॉडलों पर एक सरल (लागू) ट्यूटोरियल है: http://www.r-tutor.com/elementary-statistics/non-parametric-methods

एक शोधकर्ता एक गैर-पैरामीट्रिक मॉडल बनाम पैरामीट्रिक मॉडल का उपयोग करने का निर्णय ले सकता है, कह सकता है, गैरपारंपरिक प्रतिगमन बनाम रैखिक प्रतिगमन, क्योंकि डेटा पैरामीट्रिक मॉडल द्वारा आयोजित मान्यताओं का उल्लंघन करता है। जब से आप एक एमएल बैकग्राउंड से आ रहे हैं, मैं बस मान लूंगा कि आपने कभी भी लीनियर रिग्रेशन मॉडल की धारणाएं नहीं सीखी हैं। यहाँ एक संदर्भ है: https://statistics.laerd.com/spss-tutorials/linear-regression-using-spss-statistics.php

उल्लंघन की धारणाएं आपके पैरामीटर अनुमानों को तिरछा कर सकती हैं, और अंततः अमान्य निष्कर्षों के जोखिम को बढ़ा सकती हैं। एक गैरपारंपरिक मॉडल आउटलेर्स, नॉनलाइनर संबंधों के लिए अधिक मजबूत है, और कई जनसंख्या वितरण मान्यताओं पर निर्भर नहीं करता है, इसलिए, जब अनुमान या भविष्यवाणियां करने की कोशिश कर रहे हैं तो अधिक विश्वास योग्य परिणाम प्रदान कर सकते हैं।

नॉनपरेट्रिक रिग्रेशन पर एक त्वरित ट्यूटोरियल के लिए, मैं इन स्लाइड्स की सलाह देता हूं: http://socserv.socsci.mcmaster.ca/jfox/Courses/Oxford-2005/slides-handout.pdf


लिंक के लिए धन्यवाद, मैं उनके माध्यम से जाऊंगा। हालांकि एक बात यह है कि हम "गैर-पैरामीटर्स" मॉडल बनाने वाले "मापदंडों की अनंत संख्या" के साथ यह शादी कैसे करें? धन्यवाद
क्रिएट्रॉन

उस "मापदंडों की अनंत संख्या" के लिए कोई उद्धरण नहीं है, इसलिए मैं टिप्पणी नहीं कर सकता। मैंने कभी भी अपरिमेय सांख्यिकीय मॉडल के विषय के लिए ऐसा संदर्भ नहीं देखा है, इसलिए मुझे उत्तर / व्याख्या प्रदान करने से पहले एक संदर्भ देखना होगा। अभी के लिए, मैं विशिष्ट मॉडल बनाम संपूर्ण क्षेत्र की मान्यताओं के बारे में चिंता करूंगा।
जॉन

मेरे प्रश्न में उद्धृत विकिपीडिया लेख अनंत आयामीता को दर्शाता है। सचमुच: "एक सांख्यिकीय मॉडल गैर-पैरामीट्रिक है यदि पैरामीटर सेट अनंत आयामी है।" इसका क्या मतलब है? इसी का मैं जिक्र कर रहा हूं।
क्रिएट्रॉन

मुझे पता है। लेकिन विकिपीडिया उस कथन के लिए प्रशस्ति पत्र प्रदान नहीं करता है। एक संदर्भ के बिना कुछ पर भरोसा नहीं कर सकते।
जॉन

3

मैं वर्तमान में मशीन लर्निंग पर एक कोर्स कर रहा हूं, जहां हम नॉनपेर्मेट्रिक मॉडल की निम्न परिभाषा का उपयोग करते हैं: "नॉनपैरामेट्रिक मॉडल डेटा के आकार के साथ जटिलता में बढ़ते हैं"।

पैरामीट्रिक मॉडल

wd

f(x)=wTx

गैरपारंपरिक मॉडल

f(x)=i=1nαik(xi,x)
nαik(xi,x)αin

f(x)=sign(i=1nαiyik(xi,x)))

αind

मैंने अपनी लेक्चर स्लाइड्स से कर्नेल रिग्रेशन फंक्शन और विकिपीडिया से कर्नेलाइज़्ड परसेप्ट्रॉन फंक्शन लिया: https://en.wikipedia.org/wiki/Kernel_method

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.