गाऊसी प्रक्रिया मॉडल के मुख्य लाभ


11

गाऊसी प्रक्रिया का व्यापक रूप से उपयोग किया गया है, विशेष रूप से अनुकरण में। यह ज्ञात है कि कम्प्यूटेशनल मांग अधिक है ( )।0(n3)

  1. क्या उन्हें लोकप्रिय बनाता है?
  2. उनके मुख्य और छिपे हुए फायदे क्या हैं?
  3. पैरामीट्रिक मॉडल के बजाय उनका उपयोग क्यों किया जाता है (पैरामीट्रिक मॉडल से मेरा मतलब है विशिष्ट रैखिक प्रतिगमन जिसमें इनपुट बनाम आउटपुट प्रवृत्ति का वर्णन करने के लिए विभिन्न पैरामीट्रिक रूपों का उपयोग किया जा सकता है; उदाहरण के लिए, qaudratic)?

मैं वास्तव में निहित गुणों को स्पष्ट करने वाले एक तकनीकी उत्तर की सराहना करूंगा जो गॉसियन प्रक्रिया को अद्वितीय और लाभप्रद बनाता है


क्या आप स्पष्ट कर सकते हैं कि पैरामीट्रिक मॉडल से आपका क्या मतलब है?
एलेक्सी ज़ेत्सेव

@Alexey मैंने स्पष्ट किया है कि ऊपर दिए गए पैरामीट्रिक मॉडल से मेरा क्या अभिप्राय है। धन्यवाद
विस

क्या मैं पैरामीट्रिक मॉडल के बारे में मानता हूं, इसके लिए आपको प्रत्येक समस्या के लिए हाथ से मॉडल निर्दिष्ट करने की आवश्यकता है। यह हमेशा संभव नहीं है, क्योंकि वास्तविक प्रकृति हमेशा ज्ञात नहीं होती है। इसके अलावा, इन मॉडलों की फिटिंग के साथ कठिनाइयाँ हो सकती हैं, जबकि गाऊसी प्रक्रियाओं के लिए मापदंडों का अनुमान लगभग हर बार अच्छी तरह से काम करता है।
एलेक्सी ज़ेत्सेव

4
स्प्लिन्स और लीनियर रिग्रेशन गॉसियन प्रोसेस रिग्रेशन के समतुल्य हैं, जिनमें उचित कोवरियन फंक्शन का चयन किया गया है। लेकिन गाऊसी प्रक्रियाएं कई कार्यों के लिए एक सुविधाजनक संभाव्य ढांचा प्रदान करती हैं।
एलेक्सी ज़ेत्सेव

1
आप गाऊसी प्रक्रिया का उपयोग कब नहीं करेंगे?
अल्बी

जवाबों:


6

मुख्य लाभ इंजीनियरिंग के दृष्टिकोण से हैं (जैसा @Alexey उल्लेख किया गया है)। दूरी और अभिविन्यास के आधार पर संबंधों के लिए व्यापक रूप से इस्तेमाल की जाने वाली क्रैगिंग प्रक्रिया में आप "सहसंबंध" (या सहसंयोजक) मॉडल (आमतौर पर वैरोग्राम इलिप्सिड ) कहा जाता है ।

ऐसा कुछ भी नहीं है जो अन्य कार्यप्रणाली को समान विशेषताओं के लिए रोकता है, यह सिर्फ इतना हुआ कि जिस तरह से पहली बार अवधारणा की गई थी, उसमें लोगों के लिए एक अनुकूल दृष्टिकोण था जो सांख्यिकीय नहीं थे।

आजकल जियोस्टैटिस्टिक्स आधारित स्टोकेस्टिक विधियों के उदय के साथ, अन्य लोगों के बीच अनुक्रमिक गाऊसी सिमुलेशन की तरह , इन प्रक्रियाओं का उपयोग उन क्षेत्रों में किया जा रहा है जहां अनिश्चितता वाले स्थान को परिभाषित करना महत्वपूर्ण है (जो हजारों से लाखों आयाम ले सकता है)। फिर, इंजीनियरिंग की दृष्टि से, भू-विज्ञान आधारित एल्गोरिदम आनुवांशिक प्रोग्रामिंग में शामिल करना बहुत आसान है । जब आपके पास उलटा समस्याएं हैं, तो आपको कई परिदृश्यों का परीक्षण करने और अपने अनुकूलन फ़ंक्शन के लिए उनकी अनुकूलन क्षमता का परीक्षण करने में सक्षम होने की आवश्यकता है।

आइए एक क्षण के लिए शुद्ध तर्क छोड़ दें कि इस उपयोग के आधुनिक वास्तविक उदाहरण के लिए तथ्य क्या हैं। आप या तो भूमिगत नमूनों को सीधे (हार्ड-डेटा) नमूना कर सकते हैं या उपसतह (सॉफ्ट-डेटा) का भूकंपीय मानचित्र बना सकते हैं।

हार्ड डेटा में आप एक संपत्ति को माप सकते हैं (मान लें कि ध्वनिक प्रतिबाधा) सीधे (ईश) त्रुटि के बिना। समस्या यह है कि यह दुर्लभ (और महंगी) है। दूसरी ओर आपके पास भूकंपीय मानचित्रण है जो वस्तुतः एक मात्रा, पिक्सेल-वार, उपसतह का मानचित्र है लेकिन आपको ध्वनिक प्रतिबाधा नहीं देता है। सादगी प्रयोजनों के लिए मान लें कि यह आपको ध्वनिक प्रतिबाधा (ऊपर और नीचे) के दो मूल्यों के बीच का अनुपात देता है। तो 0.5 का अनुपात 1000/2000 या 10 000/20 000 का एक विभाजन हो सकता है। यह एक बहु समाधान स्थान है और कई संयोजन करेंगे, लेकिन केवल एक ही वास्तविकता का सही प्रतिनिधित्व करता है। इसे आप कैसे हल करते हैं?

जिस तरह से भूकंपरोधी काम करता है (स्टोकेस्टिक प्रक्रियाएं) प्रशंसनीय (और यह सब एक साथ एक और कहानी है) ध्वनिक प्रतिबाधा (या अन्य गुण) के परिदृश्यों को उत्पन्न करके है, उन परिदृश्यों को एक सिंथेटिक भूकंपी (पिछले उदाहरण में अनुपात की तरह) में परिवर्तित करें और वास्तविक (सहसंबंध) के खिलाफ सिंथेटिक भूकंपी की तुलना करें। सबसे अच्छे परिदृश्यों का उपयोग और भी अधिक परिदृश्यों का उत्पादन करने के लिए किया जाएगा, एक समाधान में परिवर्तित करना (यह उतना आसान नहीं है जितना लगता है)।

इसे ध्यान में रखते हुए और प्रयोज्यता के दृष्टिकोण से बोलते हुए मैं आपके प्रश्नों का उत्तर निम्न प्रकार से दूंगा:

1) जो चीज उन्हें लोकप्रिय बनाती है वह है प्रयोज्यता, कार्यान्वयन में लचीलापन, अनुसंधान केंद्रों और संस्थानों की अच्छी संख्या जो कई अलग-अलग क्षेत्रों के लिए नए और अधिक अनुकूलनीय गौसियन आधारित प्रक्रियाएं बनाते रहते हैं (विशेषकर भूविज्ञान में, जीआईएस शामिल)।

2) मुख्य लाभ हैं , जैसा कि पहले उल्लेख किया गया है, मेरे दृष्टिकोण से उपयोगिता और लचीलापन। यदि यह हेरफेर करना आसान है और आपको इसका उपयोग करना आसान है। गॉसियन प्रक्रियाओं में कोई विशेष विशेषताएं नहीं हैं जो अन्य तरीकों (आंकड़ों या अन्यथा) में प्रतिलिपि प्रस्तुत करने योग्य नहीं हैं।

3) इनका उपयोग तब किया जाता है जब आपको अपने मॉडल में केवल डेटा की तुलना में अधिक जानकारी शामिल करने की आवश्यकता होती है (इस तरह की जानकारी में अंतरिक्ष के संबंध, सांख्यिकीय वितरण और इतने पर ...) हैं। मैं आश्वस्त कर सकता हूं कि अगर आपके पास बहुत से डेटा है जिसमें एक आइसोट्रोपिक व्यवहार है जिसमें क्रिंगिंग का उपयोग करना समय की बर्बादी है। आप किसी भी अन्य विधि का उपयोग करके समान परिणाम प्राप्त कर सकते हैं जो कि कम जानकारी की आवश्यकता होती है, इसके तेजी से चलने के लिए।


और दूसरा मॉडल कब बेहतर विकल्प है?
बेन

1
@ यह हमेशा केस स्टडी पर निर्भर करेगा। क्रैगिंग, या क्रिंगिंग आधारित विधियां, एक उच्च संगणना लागत (इसलिए, तेजी से नहीं) है। उदाहरण के लिए, आधुनिक 4k (या अधिक) टीवी छोटे प्रस्तावों के लिए बनाई गई सामग्री की कोशिश करने और सुधारने के लिए प्रक्षेप तरीकों का उपयोग करते हैं। इसका तात्पर्य यह है कि इसे इस ऑपरेशन को तेजी से और उपयोगकर्ता के हस्तक्षेप के बिना करने की आवश्यकता है (जिसे एक सहसंयोजक मॉडल की आवश्यकता होगी)। अगर मैं इस विशेष समस्या को हल करने के लिए था तो मैं पूरी तरह से क्रिंगिंग से बचूंगा। इसके अलावा कुछ घटनाएं पैटर्न आधारित हैं, या एक असतत चर है, या सूत्र (FEM, उदाहरण के लिए), आदि के लिए कम किया जा सकता है ...
armatita

और जब गति महत्वपूर्ण नहीं है?
बेन

यदि आपकी रिजल्ट को तत्काल करने की आवश्यकता नहीं है, तो @ स्पीड कम महत्वपूर्ण है। सबसिफ़ मॉडलिंग, मौसम की भविष्यवाणी और जीआईएस विज्ञान के भीतर संचालन का गुच्छा कुछ उदाहरण हैं। एक अन्य उत्तर (भूकंपीय व्युत्क्रम) में प्रस्तुत किया गया है।
११:०१ पर आर्मेटिटा

क्षमा करें, वह नहीं मिला। न तो कम्प्यूटेशनल और न ही परिणाम गति मायने रखती है, एक जीपी के नुकसान क्या हैं? या दूसरे शब्दों में: क्या इसका उपयोग अधिक बार नहीं किया जाना चाहिए?
बेन

7

इंजीनियरों के लिए यह महत्वपूर्ण है:

  • भविष्यवाणियों के लिए आत्मविश्वास अंतराल होना चाहिए
  • प्रशिक्षण डेटा को प्रक्षेपित करना
  • चिकनी और nonlinear मॉडल है
  • प्रयोगों और अनुकूलन के अनुकूली डिजाइन के लिए प्राप्त प्रतिगमन मॉडल का उपयोग करें

गॉसियन प्रक्रियाएं इन सभी आवश्यकताओं को पूरा करती हैं।

इसके अलावा, अक्सर इंजीनियरिंग और जियोस्टैटिस्टिक्स डेटा सेट बड़े या विशिष्ट ग्रिड संरचना नहीं होते हैं जो तेजी से अनुमान लगाते हैं।


1
आपकी टिप्पणी के लिये धन्यवाद । ऐसा लगता है कि उनकी बेयसियन व्याख्या के कारण गॉसियन प्रक्रिया के मॉडल में अनिश्चितता की मात्रा बढ़ सकती है, हालांकि यह पैरामीट्रिक प्रतिगमन में भी संभव है। मैं एक तकनीकी दृष्टिकोण की तलाश कर रहा हूं जो सांख्यिकीय लाभों के सेट की व्याख्या कर सकता है
Wis

3

गाऊसी मॉडल के फायदे।

गाऊसी पीडीएफ केवल इसके 1-क्रम और 2-क्रम के क्षणों पर निर्भर करता है। एक व्यापक-अर्थ स्थिर गौसियन प्रक्रिया भी एक सख्त-समझ वाली स्थिर प्रक्रिया है और इसके विपरीत।

गॉसियन पीडीएफ सिग्नल और शोर के कुछ महत्वपूर्ण वर्गों सहित कई प्रक्रियाओं के वितरण को मॉडल कर सकते हैं। कई स्वतंत्र यादृच्छिक प्रक्रियाओं के योग में एक गाऊसी वितरण (केंद्रीय सीमा प्रमेय) है।

गैर-गॉसियन प्रक्रियाओं को उचित साधनों और भिन्नताओं के कई गॉसियन पीडीएफ के भारित संयोजन (यानी एक मिश्रण) द्वारा अनुमानित किया जा सकता है।

गॉसियन मॉडल पर आधारित इष्टतम अनुमान विधियां अक्सर रैखिक और गणितीय रूप से ट्रैक्टेबल समाधानों के परिणामस्वरूप होती हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.