मैं इसे यह कहते हुए पेश करूंगा कि यह हमेशा स्पष्ट नहीं होता है कि "nonparametric" या "semiparametric" इत्यादि का क्या मतलब है। टिप्पणियों में, यह संभावना प्रतीत होती है कि whuber के मन में कुछ औपचारिक परिभाषा है (शायद एक मॉडल चुनने जैसा कुछ। θ कुछ परिवार से { एम θ : θ ∈ Θ } जहां ΘMθ{Mθ:θ∈Θ}Θ अनंत आयामी) है, लेकिन मैं बहुत अनौपचारिक जा रहा हूँ। कुछ लोग यह तर्क दे सकते हैं कि एक गैर-पैरामैट्रिक विधि वह है जिसमें आपके द्वारा उपयोग किए जाने वाले मापदंडों की प्रभावी संख्या डेटा के साथ बढ़ जाती है। मुझे लगता है कि videolectures.net पर एक वीडियो है, जहां (मुझे लगता है) पीटर ओर्बनज़ चार या पांच अलग-अलग लेता है कि हम कैसे "नॉनपैमेट्रिक" को परिभाषित कर सकते हैं।
जब से मुझे लगता है कि मुझे पता है कि आपके मन में किस तरह की चीजें हैं, सादगी के लिए मैं मानूंगा कि आप एक सामान्य तरीके से प्रतिगमन के लिए गॉसियन प्रक्रियाओं का उपयोग करने के बारे में बात कर रहे हैं: हमारे पास प्रशिक्षण डेटा और हम सशर्त माध्य E ( Y | X = x ) के मॉडलिंग में रुचि रखते हैं : = f ( x ) । हम Y i = f ( X + ϵ) लिखते हैं
(Yi,Xi),i=1,...,nE(Y|X=x):=f(x)
और शायद हम के रूप में ग्रहण करने के लिए कि इतने बोल्ड हैं ε मैं आईआईडी और सामान्य रूप से कर रहे हैं वितरित, ε मैं ~ एन ( 0 , σ 2 ) । एक्स i एक आयामी होगा, लेकिन सब कुछ उच्च आयामों पर ले जाता है।
Yi=f(Xi)+ϵi
ϵiϵi∼N(0,σ2)Xi
हमारे तो एक निरंतरता तो में मान ले जा सकते हैं f ( ⋅ ) (uncountably) अनंत आयाम के एक पैरामीटर के रूप में के बारे में सोचा जा सकता है। तो, इस अर्थ में कि हम अनंत आयाम के एक पैरामीटर का अनुमान लगा रहे हैं , हमारी समस्या एक गैर-मापक है। यह सच है कि बायेसियन दृष्टिकोण में कुछ मापदंडों के बारे में यहां और वहां चल रहा है। लेकिन वास्तव में, इसे नॉनपरमेट्रिक कहा जाता है क्योंकि हम कुछ अनंत आयामों का अनुमान लगा रहे हैं। जीपी पादरियों का उपयोग हम प्रत्येक निरंतर फ़ंक्शन के प्रत्येक पड़ोस के लिए बड़े पैमाने पर करते हैं, इसलिए वे किसी भी निरंतर फ़ंक्शन को मनमाने ढंग से अच्छी तरह से अनुमान लगा सकते हैं।Xif(⋅)
कोविरियन फ़ंक्शन में चीजें सामान्य क्रमिक अनुमानकों में चौरसाई मापदंडों के समान एक भूमिका निभा रही हैं - समस्या के लिए बिल्कुल निराशाजनक नहीं होने के लिए हमें यह मान लेना होगा कि कुछ संरचना है जिसे हम प्रदर्शन को देखने की उम्मीद करते हैं। बायेसियन एक गाऊसी प्रक्रिया के रूप में निरंतर कार्यों के स्थान पर एक पूर्व का उपयोग करके इसे पूरा करते हैं। एक बायेसियन दृष्टिकोण से, हम के बारे में विश्वास एन्कोडिंग कर रहे हैं च संभालने से च इस तरह के और इस तरह के सहप्रसरण समारोह के साथ एक जीपी से ली गई है। पूर्व प्रभावी ढंग से च के अनुमानों को दंडित करता हैffff से बहुत जटिल होने के लिए है।
कम्प्यूटेशनल मुद्दों के लिए संपादित करें
इस सामान का अधिकांश (सभी?) रासमुसेन और विलियम्स द्वारा गाऊसी प्रक्रिया पुस्तक में है।
कम्प्यूटेशनल मुद्दों GPs के लिए मुश्किल हैं। यदि हम निस्संदेह आगे बढ़ते हैं, तो हमें कोविरियस मैट्रिक्स को पकड़ने के लिए आकार की मेमोरी की आवश्यकता होगी और (यह पता चलता है) हे ( एन 3 ) ऑपरेशन को उल्टा करने के लिए। कुछ चीजें हैं जो हम चीजों को और अधिक संभव बनाने के लिए कर सकते हैं। एक विकल्प यह है कि पुरुष है कि हम वास्तव में जरूरत नहीं है ध्यान दें करने के लिए है वी , का हल ( कश्मीर + σ 2 मैं ) वी = Y जहां कश्मीर सहप्रसरण मैट्रिक्स है। संयुग्मक ग्रेडिएंट्स की विधि इसे O ( N 3 ) में ठीक करती हैO(N2)O(N3)v(K+σ2I)v=YKO(N3)अभिकलन, लेकिन यदि हम अपने आप को एक अनुमानित समाधान से संतुष्ट करते हैं, तो हम चरणों के बाद संयुग्मक ढाल एल्गोरिथ्म को समाप्त कर सकते हैं और इसे O ( k N 2 ) अभिकलन में कर सकते हैं। हमें एक बार में पूरे मैट्रिक्स K को संग्रहीत करने की भी आवश्यकता नहीं है ।kO(kN2)K
इसलिए हम से O ( k N 2 ) में चले गए हैं , लेकिन यह अभी भी N में चतुष्कोणीय है , इसलिए हम खुश नहीं हो सकते। अगली सबसे अच्छी बात डेटा के एक सबसेट के बजाय काम करना है, आकार मीटर का कहना है जहाँ एम × एम मैट्रिक्स को इन्वर्ट करना और स्टोर करना इतना बुरा नहीं है। बेशक, हम केवल शेष डेटा को फेंकना नहीं चाहते हैं। रजिस्टरों के सबसेट का दृष्टिकोण है कि हम अपने जीपी के पीछे के माध्य को अपने डेटा वाई के एक प्रतिगमन के रूप में हमारे सह-कार्य फ़ंक्शन द्वारा निर्धारित एन डेटा-निर्भर आधार फ़ंक्शन पर प्राप्त कर सकते हैं ; इसलिए हम सब फेंक देते हैंO(N3)O(kN2)Nmm×mYNइन दूर मी और हम ओ ( एम 2 एन ) अभिकलन केलिए नीचे हैं।mO(m2N)
अन्य संभावित विकल्पों में से कुछ मौजूद हैं। हम करने के लिए एक कम रैंक सन्निकटन का निर्माण कर सकता है , और सेट कश्मीर = क्यू क्यू टी जहां क्यू है n × क्ष और रैंक के क्ष ; यह K + I 2 I को निष्क्रिय करता है , इस मामले में Q T Q + I 2 I को बदलने के बजाय किया जा सकता है । एक अन्य विकल्प यह है कि सहसंयोजक कार्य को विरल चुना जाए और संयुग्मक ढाल विधियों का उपयोग किया जाए - यदि सहसंयोजक मैट्रिक्स बहुत विरल है तो इससे कम्प्यूटेशन की गति काफी हद तक बढ़ सकती है।KK=QQTQn×qqK+σ2IQTQ+σ2I