गाऊसी प्रक्रियाएँ: बहु-आयामी उत्पादन के लिए GPML का उपयोग कैसे करें


13

क्या GPML का उपयोग करके बहुआयामी आउटपुट (संभवतः सहसंबद्ध) पर गौसियन प्रक्रिया प्रतिगमन करने का एक तरीका है ?

में डेमो स्क्रिप्ट मैं केवल एक -1 डी उदाहरण मिल सका।

CV पर एक समान प्रश्न जो बहुआयामी इनपुट के मामले से निपटता है।


मैं उनकी किताब के माध्यम से देखने के लिए गया कि क्या मुझे कुछ मिल सकता है। इस पुस्तक के 9 वें अध्याय (खंड 9.1) में, उन्होंने कई आउटपुट के इस मामले का उल्लेख किया है। उन्होंने इससे निपटने के लिए कुछ तरीकों का उल्लेख किया है, एक - एक सहसंबद्ध शोर प्रक्रिया और दो का उपयोग करते हुए - कोकिंग (पूर्व सहसंबंधित)।

मुझे अभी भी नहीं पता है, मैं कैसे इन विचारों में से किसी को GPML फ्रेमवर्क में शामिल कर सकता हूं।


इसके अलावा, क्या कोई अन्य जीपी लाइब्रेरी / फ्रेमवर्क हैं जो बहु-आयामी आउटपुट का समर्थन करते हैं?


इनपुट और आउटपुट के बीच संयुक्त कर्नेल पर एक-वर्ग (कर्नेल घनत्व अनुमान) मामले में SVMs के उपयोग के बारे में "संरचित डेटा की भविष्यवाणी" वार्ता। यह देखते हुए कि वे दोनों कर्नेल मशीन हैं यह दृष्टिकोण काम करना चाहिए। मैंने पाया कि एक पेपर कुछ इसी तरह का उल्लेख करता है। datamin.ubbcluj.ro/tr/2011/sogp.pdf फिटिंग स्ट्रक्चर्ड लर्निंग एल्गोरिदम में मेरी कोशिशें बहुत अचूक रही हैं, इसलिए मुझे यकीन नहीं है कि यह कैसे ढेर हो जाएगा।
जेसिका कॉलिन्स

जवाबों:


7

मेरा मानना ​​है कि जुड़वां गॉसियन प्रक्रियाएं वही हैं जो आप देख रहे हैं। मैं मॉडल को कागज के सार से बेहतर नहीं बता सकता, इसलिए मैं इसे कॉपी पेस्ट करने वाला हूं:

हम जुड़वां गाऊसी प्रक्रियाओं (टीजीपी) 1 का वर्णन करते हैं, एक सामान्य संरचित भविष्यवाणी पद्धति जो गॉव्सियन प्रक्रिया (जीपी) के पुजारियों [2] का उपयोग करती है, दोनों कोविरेट्स और प्रतिक्रियाओं, दोनों बहुभिन्नरूपी, और आउटपुट का अनुमान है कि दो GP से कुल्लबैक-लीब्लर विचलन को कम करके प्रशिक्षण के सामान्य सूचकांक सेटों के रूप में मॉडलिंग की गई है। उदाहरणों का परीक्षण करना, इस लक्ष्य पर जोर देना कि इसी तरह के इनपुट समान विचार पैदा करते हैं और यह उनके सीमांत वितरण के बीच औसतन पकड़ होना चाहिए। टीजीपी एक विशिष्ट जीपी के रूप में, कोवरिएट्स के बीच न केवल अन्योन्याश्रितियों को पकड़ता है, बल्कि उन प्रतिक्रियाओं के बीच भी है, इसलिए इनपुट और आउटपुट दोनों के बीच सहसंबंधों के लिए जिम्मेदार हैं। TGP को हाल ही में पेश किए गए HumanEva बेंचमार्क में मोनोक्युलर और मल्टीमैकेरा वीडियो अनुक्रमों से 3 डी मानव पोज़ के पुनर्निर्माण के लिए, आशाजनक परिणाम के साथ, उदाहरण के लिए, जहां हम संयुक्त रूप से प्रशिक्षित मॉडल के लिए औसतन 3 सेमी प्रति व्यक्ति पर 5 सेमी त्रुटि प्राप्त करते हैं, कई लोगों और कई गतिविधियों के डेटा का उपयोग करते हैं। विधि तेज और स्वचालित है: इसके लिए प्रारंभिक मुद्रा, कैमरा अंशांकन मापदंडों या प्रशिक्षण या परीक्षण के लिए उपयोग किए जाने वाले मानव विषयों से जुड़े 3 डी बॉडी मॉडल की उपलब्धता की आवश्यकता नहीं है।

लेखकों ने शुरू करने के लिए उदारता से कोड और नमूना डेटासेट प्रदान किए हैं।


साइट पर आपका स्वागत है, @ ओके। क्या आप उस लिंक पर क्या है, इस बारे में थोड़ी जानकारी प्रदान करने का मन करेगा? इस तरह, पाठकों को पता चल सकता है कि क्या यह उनके लिए पीछा करने योग्य है, और इसका मतलब होगा कि भविष्य के लिंकरोट के मामले में अभी भी यहाँ कुछ मूल्य है।
गंग -

@ गुंग, thx, आशा है कि सार काम करता है।
21 अक्टूबर को यानुशुई काओ

@ ऑय ... क्या आप जुड़वाँ गाऊसी प्रक्रियाओं में आउटपुट के पूर्वानुमान और विचरण के बारे में विस्तार से बता सकते हैं?
संदीपन कर्मकार

3

संक्षिप्त उत्तर बहु-आयामी उत्पादन के लिए प्रतिगमन थोड़ा पेचीदा है और ज्ञान के मेरे मौजूदा स्तर में सीधे GPML टूलबॉक्स में शामिल नहीं है।

लंबा उत्तर आप अपनी बहु-आयामी आउटपुट प्रतिगमन समस्या को 3 अलग-अलग हिस्सों में तोड़ सकते हैं।

  1. आउटपुट एक दूसरे के साथ संबंधित नहीं हैं - बस 1 डी मामले के लिए डेमो स्क्रिप्ट की तरह व्यक्तिगत रूप से आउटपुट को पुनः प्राप्त करें।
  2. आउटपुट संबंधित हैं लेकिन उनके बीच संबंध नहीं जानते हैं - आप मूल रूप से आउटपुट के बीच के आंतरिक संबंधों को सीखना चाहेंगे। जैसा कि पुस्तक में उल्लेख किया गया है कि कोकिंग करना शुरू करने का एक अच्छा तरीका है। GPML के अलावा अन्य सॉफ्टवेयर्स भी हैं जो सीधे आपको cokriging जैसे प्रदर्शन करने दे सकते हैं। ooDace
  3. आउटपुट संबंधित हैं और आप उनके बीच संबंध जानते हैं - एक नियमित कोक्रीगिंग करते हैं लेकिन आप आउटपुट के बीच हार्ड-बाधाओं को या तो ऑप्टिमाइज़र में बाधाओं को लागू करके (लॉग सीमांत संभावना को कम करते हुए) हॉल और हुआंग 2001 के अनुसार कह सकते हैं। कॉन्स्टैंटिंसक्यू एंड एनीत्स्कु 2013 के अनुसार पूर्व कार्य में संबंधों को लागू करें ।

मुझे उम्मीद है यह मदद करेगा :)


2

यह स्किटिट-लर्न का एक मॉड्यूल है जो मेरे लिए आश्चर्यजनक रूप से अच्छा काम करता है:

http://scikit-learn.org/stable/auto_examples/gaussian_process/plot_gp_regression.html

# Instanciate a Gaussian Process model
gp = GaussianProcess(corr='cubic', theta0=1e-2, thetaL=1e-4, thetaU=1e-1,
                     random_start=100)

# Fit to data using Maximum Likelihood Estimation of the parameters
gp.fit(X, y)

# Make the prediction on the meshed x-axis (ask for MSE as well)
y_pred, MSE = gp.predict(x, eval_MSE=True)
sigma = np.sqrt(MSE)

1

मैं मल्टी आउटपुट गाऊसी प्रोसेस की खोज कर रहा था और इसके साथ अभिनय करने के कई तरीके पाए गए, जैसे कि कनवल्शन मेथड, मिक्स्ड इफेक्ट्स मॉडलिंग मेथड और लेटेस्ट इस वन ट्विन गॉसियन प्रोसीसेस (टीजीपी)।

मुझे ट्विन गॉसियन प्रोसेस (टीजीपी) की अवधारणा में संदेह है। क्या कोई मेरी मदद कर सकता है?

y^p(y|y)(μ,σ2)σ2yy^y

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.