जैसा कि आप उलझन में हैं, मुझे समस्या के बारे में बताते हुए और अपने प्रश्नों को एक-एक करके शुरू करने दें। आपके पास 10,000 का एक नमूना आकार है और प्रत्येक नमूना एक विशेषता वेक्टर में वर्णित है । यदि आप गाऊसी रेडियल आधार कार्यों का उपयोग करके प्रतिगमन करना चाहते हैं, तो प्रपत्र जहां आपके आधार कार्य हैं। विशेष रूप से, आपको वेट खोजने की आवश्यकता है ताकि दिए गए मापदंडों और आप और संबंधित भविष्यवाणी = बीच की त्रुटि को कम करें।x∈R31
f(x)=∑jwj∗gj(x;μj,σj),j=1..m
gimwjμjσjyy^f(x^) - आम तौर पर आप कम से कम वर्गों की त्रुटि को कम कर देंगे।
वास्तव में म्यू सबस्क्रिप्ट जे पैरामीटर क्या है?
आपको खोजने की आवश्यकता हैm आधार फ़ंक्शन । (आपको अभी भी संख्या मी निर्धारित करने की आवश्यकता है ) प्रत्येक आधार फ़ंक्शन में μ j और σ j (भी अज्ञात) होंगे। सबस्क्रिप्ट j से लेकर 1 को मीटर ।gjmμjσjj1m
क्या सदिश है?μj
हां, में यह एक बिंदु है । दूसरे शब्दों में, यह आपके सुविधा अंतरिक्ष में बात कहीं है और एक μ से प्रत्येक के लिए निर्धारित किया जाना चाहिए मीटर आधार कार्य करता है।R31μm
मैंने पढ़ा है कि यह आधार कार्यों के स्थानों को नियंत्रित करता है। तो क्या यह किसी चीज का मतलब नहीं है?
आधार समारोह में केंद्रित है μ जे । आपको यह तय करने की आवश्यकता होगी कि ये स्थान कहाँ हैं। तो नहीं, यह आवश्यक रूप से किसी भी चीज़ का मतलब नहीं है (लेकिन इसे निर्धारित करने के तरीकों के लिए और नीचे देखें)jthμj
अब सिग्मा के लिए कि "स्थानिक पैमाने को नियंत्रित करता है"। वास्तव में वह क्या है?
यह समझना आसान है कि क्या हम स्वयं आधार कार्यों में बदल जाते हैं।σ
या आर 2 कहते हैं कि यह निचले डिमेंसन्स में गाऊसी रेडियल आधार कार्यों के बारे में सोचने में मदद करता है । में आर 1 गाऊसी रेडियल आधार समारोह सिर्फ प्रसिद्ध घंटी वक्र है। घंटी बेशक संकीर्ण या चौड़ी हो सकती है। चौड़ाई σ द्वारा निर्धारित की जाती है - बड़ा σ बेल की आकृति संकरी होती है। दूसरे शब्दों में, σ घंटी आकार की चौड़ाई मापता है। तो σ = 1 के लिए हमारे पास कोई स्केलिंग नहीं है। बड़े के लिए σ हम पर्याप्त स्केलिंग है।R1R2R1σσσσσ
आप पूछ सकते हैं कि इसका उद्देश्य क्या है। यदि आप अंतरिक्ष के कुछ हिस्से ( में एक पंक्ति ) को कवर करने वाली घंटी के बारे में सोचते हैं - एक संकीर्ण घंटी केवल रेखा के एक छोटे हिस्से को कवर करेगी *। घंटी के केंद्र के करीब बिंदु x का बड़ा g j ( x ) मान होगा। केंद्र से दूर के बिंदुओं का एक छोटा जी j ( x ) मान होगा। स्केलिंग का केंद्र से आगे बिंदुओं को प्रभावित करने का प्रभाव होता है - क्योंकि घंटी के अंक अंक केंद्र से आगे स्थित होंगे - जी जे ( x ) के मान को कम करते हुएR1xgj(x)gj(x)gj(x)
प्रत्येक आधार फ़ंक्शन इनपुट वेक्टर x को स्केलर मान में परिवर्तित करता है
हाँ, आप कुछ बिंदु पर आधार कार्यों का मूल्यांकन कर रहे ।x∈R31
exp(−∥x−μj∥222∗σ2j)
परिणामस्वरूप आपको एक स्केलर मिलता है। स्केलर का परिणाम केंद्र द्वारा दिए गए बिंदु की दूरी पर निर्भर करता है, जो द्वारा दिया जाता हैऔर अदिश ।xμj∥x−μj∥σj
मैंने कुछ कार्यान्वयन देखे हैं जो इस मान के लिए .1, .5, 2.5 जैसे मानों को आज़माते हैं। इन मूल्यों की गणना कैसे की जाती है?
यह कोर्स गाऊसी रेडियल आधार कार्यों का उपयोग करने के दिलचस्प और कठिन पहलुओं में से एक है। यदि आप वेब खोजते हैं तो आपको कई सुझाव मिलेंगे कि ये पैरामीटर कैसे निर्धारित किए जाते हैं। मैं क्लस्टरिंग के आधार पर बहुत ही सरल शब्दों में एक संभावना को रेखांकित करूंगा। आप इसे और कई अन्य सुझावों को ऑनलाइन पा सकते हैं।
अपने 10000 नमूनों को क्लस्टर करके प्रारंभ करें (आप k-मीन्स क्लस्टरिंग के बाद आयामों को कम करने के लिए पीसीए का उपयोग कर सकते हैं)। आप उन समूहों की संख्या बता सकते हैं जिन्हें आप पाते हैं (आमतौर पर सर्वोत्तम निर्धारित करने के लिए क्रॉस सत्यापन को नियोजित करते हैं )। अब, प्रत्येक क्लस्टर के लिए एक रेडियल आधार फ़ंक्शन । प्रत्येक रेडियल आधार समारोह के लिए जाने क्लस्टर का केंद्र (जैसे मतलब, केन्द्रक, आदि)। Let क्लस्टर की चौड़ाई को दर्शाते हैं (जैसे त्रिज्या ...) अब आगे बढ़ो और अपने प्रतिगमन का प्रदर्शन करें (यह सरल विवरण सिर्फ एक अवलोकन है- इसे प्रत्येक चरण पर बहुत काम करने की आवश्यकता है!)mmgjμjσj
* बेशक, बेल वक्र को परिभाषित किया गया है - to तो लाइन पर हर जगह एक मूल्य होगा। हालांकि, केंद्र से दूर मूल्य नगण्य हैं∞∞