यूनिट डिस्क पर "समान रूप से स्थानित" नमूनों से प्रतिगमन


9

मुझे यूनिट डिस्क पर एक जटिल प्रतिगमन समस्या को हल करने की आवश्यकता है। मूल प्रश्न ने कुछ दिलचस्प टिप्पणियों को आकर्षित किया, लेकिन दुर्भाग्य से कोई जवाब नहीं। इस बीच, मैंने इस समस्या पर कुछ और सीखा, इस प्रकार मैं मूल समस्या को उपप्रकारों में विभाजित करने की कोशिश करूंगा, और देखूंगा कि क्या इस बार मेरे पास बेहतर भाग्य है।

मेरे पास 40 तापमान सेंसर नियमित रूप से यूनिट डिस्क के अंदर एक संकीर्ण रिंग में स्थित हैं: यहाँ छवि विवरण दर्ज करें

ये सेंसर समय में तापमान प्राप्त करते हैं। हालांकि, चूंकि समय भिन्नता अंतरिक्ष भिन्नता की तुलना में बहुत छोटी है, इसलिए समय की परिवर्तनशीलता को नजरअंदाज करके समस्या को सरल बनाएं, और मान लें कि प्रत्येक सेंसर केवल मुझे एक समय औसत देता है। इसका मतलब है कि मेरे पास 40 नमूने हैं (प्रत्येक सेंसर के लिए एक) और मेरे पास बार-बार नमूने नहीं हैं।

मैं एक प्रतिगमन सतह बनाना चाहूंगा T=f(ρ,θ)+ϵसेंसर डेटा से। प्रतिगमन के दो लक्ष्य हैं:

  1. मुझे औसत रेडियल तापमान प्रोफ़ाइल का अनुमान लगाने की आवश्यकता है Tmean=g1(ρ)+ϵ। रैखिक प्रतिगमन के साथ, मैं पहले से ही एक सतह का अनुमान लगाता हूं जो औसत तापमान सतह है, इस प्रकार मुझे केवल अपनी सतह को सम्मान के साथ एकीकृत करने की आवश्यकता हैθ, सही? यदि मैं प्रतिगमन के लिए बहुपद का उपयोग करता हूं, तो यह कदम केक का एक टुकड़ा होना चाहिए।
  2. मुझे रेडियल तापमान प्रोफ़ाइल का अनुमान लगाने की आवश्यकता है T95=g2(ρ)+ϵ, जैसे कि प्रत्येक रेडियल स्थिति में, P(T(ρ)<T95(ρ))=.95

इन दो लक्ष्यों को देखते हुए, मुझे यूनिट डिस्क पर प्रतिगमन के लिए किस तकनीक का उपयोग करना चाहिए? बेशक, गाऊसी प्रक्रियाएं आमतौर पर स्थानिक प्रतिगमन के लिए उपयोग की जाती हैं। हालाँकि यूनिट डिस्क के लिए एक अच्छी कर्नेल की परिभाषा तुच्छ नहीं है, इसलिए मैं चीजों को सरल रखना चाहता हूं और बहुपद का उपयोग करना चाहता हूं, जब तक आपको नहीं लगता कि यह एक हार की रणनीति है। मैंने Zernike polynomials के बारे में पढ़ा है । जब वे आवधिक होते हैं, तब Zernike बहुपद इकाई डिस्क पर प्रतिगमन के लिए उपयुक्त लगते हैंθ

एक बार मॉडल चुनने के बाद, मुझे एक अनुमान प्रक्रिया चुनने की आवश्यकता है। चूंकि यह एक स्थानिक प्रतिगमन समस्या है, इसलिए विभिन्न स्थानों पर त्रुटियों को सहसंबद्ध किया जाना चाहिए। साधारण जानवर वर्ग असंबद्ध त्रुटियों को मानता है, इस प्रकार मुझे लगता है कि सामान्यीकृत कम से कम वर्ग अधिक उपयुक्त होंगे। जीएलएस एक अपेक्षाकृत सामान्य सांख्यिकीय तकनीक लगती है, यह देखते हुए कि glsमानक आर वितरण में एक फ़ंक्शन है। हालाँकि, मैंने कभी GLS का उपयोग नहीं किया है, और मुझे संदेह है। उदाहरण के लिए, मैं सहसंयोजक मैट्रिक्स का अनुमान कैसे लगाऊं? उदाहरण के लिए काम किया, यहां तक ​​कि सिर्फ कुछ सेंसर के साथ, यह बहुत अच्छा होगा।

PS मैंने Zernike polynomials और GLS का उपयोग करना चुना क्योंकि यह मुझे यहाँ करने के लिए तार्किक बात लगती है। हालांकि मैं कोई विशेषज्ञ नहीं हूं, और अगर आपको लगता है कि मैं गलत दिशा में जा रहा हूं, तो बिल्कुल अलग दृष्टिकोण का उपयोग करने के लिए स्वतंत्र महसूस करें।


आंकड़े पर, एक इंजन को एक आदर्श रेडियल समरूपता के रूप में दिखाया गया है। लेकिन क्या कुल्हाड़ियों की स्थिति किसी इंजन की कुछ भौतिक विशेषता से संबंधित है, या यह वास्तव में मनमाना है? दूसरे मामले में, चरθएक विशिष्ट इंजन के साथ संबंध में केवल एक अर्थ होगा।
यवस

जवाबों:


2

मुझे लगता है कि आप Zernike polynomials जैसी किसी चीज के बारे में सोचने में सही रास्ते पर हैं । जैसा कि उत्तर में jwimberly द्वारा उल्लेख किया गया है, ये एक डिस्क पर ऑर्थोगोनल आधार कार्यों की एक प्रणाली का एक उदाहरण है । मैं Zernike बहुआयामी पद है, लेकिन से परिचित नहीं हूँ कई (बेसल कार्यों सहित) के रूप में शास्त्रीय गणितीय भौतिकी में स्वाभाविक रूप से उठता है orthogonal कार्यों के अन्य परिवारों eigenfunctions कि लिंक के शीर्ष पर कुछ आंशिक अंतर समीकरणों के लिए (इस लेखन के समय में, एनीमेशन भी एक हिल ड्रम का एक उदाहरण दिखाता है)।

मेरे मन में दो सवाल आते हैं। सबसे पहले, यदि आप सभी के बाद रेडियल प्रोफाइल (θऔसत), तो स्थानिक पैटर्न पर आपको कितनी बाधा की आवश्यकता है? दूसरा, स्पैट-टेम्पोरल डेटा में किस प्रकार की परिवर्तनशीलता होती है?

पहले प्रश्न के संदर्भ में, दो चिंताएँ हैं जो दिमाग में आती हैं। ध्रुवीय निर्देशांक के कारण, प्रत्येक सेंसर के लिए समर्थन-क्षेत्र के साथ एक प्रवृत्ति हैr। दूसरी चिंता एलियासिंग की संभावना होगी , अनिवार्य रूप से पैटर्न के चरण (एक फूरियर / बेसेल सादृश्य का उपयोग करने के लिए) के सापेक्ष आपके सेंसर का गलत संरेखण। ध्यान दें कि अलियासिंग की संभावना पीक तापमान (यानी) को कसने में प्राथमिक अनिश्चितता होगीT95)।

इस दूसरे प्रश्न के संदर्भ में, डेटा परिवर्तनशीलता वास्तव में किसी भी अन्य समस्या के साथ मदद कर सकती है, अनिवार्य रूप से किसी भी गलत संरेखण को अलग-अलग मापों पर औसत करने की अनुमति देती है। (कोई व्यवस्थित पूर्वाग्रह नहीं मान रहा है ... लेकिन यह किसी भी विधि के लिए एक समस्या होगी, उदाहरण के लिए एक भौतिक मॉडल के बिना अधिक जानकारी देने के लिए)।

तो एक संभावना है कि आप अपने स्थानिक ऑर्थोगोनल कार्यों को शुद्ध रूप से सेंसर स्थानों पर परिभाषित करेंगे। इन "एम्पिरिकल ऑर्थोगोनल फंक्शंस" की गणना आपके स्पेटियोटेम्पोरल डेटा मैट्रिक्स पर पीसीए के माध्यम से की जा सकती है । (संभवतया आप चर सेंसर सपोर्ट क्षेत्रों के लिए खाते के लिए कुछ भार का उपयोग कर सकते हैं, लेकिन एकसमान ध्रुवीय ग्रिड और रेडियल औसत के लक्ष्य को देखते हुए, इसकी आवश्यकता नहीं हो सकती है।)

ध्यान दें कि अगर वहाँ है किसी भी शारीरिक मॉडलिंग तापमान में "उम्मीद" विविधताओं के लिए उपलब्ध डेटा, एक घने spatiotemporal कम्प्यूटेशनल ग्रिड पर उपलब्ध है, तो एक ही पीसीए प्रक्रिया को लागू किया जा सकता है कि निकाले जाते हैं orthogonal कार्यों के लिए डेटा। (इसे आमतौर पर इंजीनियरिंग में " प्रॉपर ऑर्थोगोनल डिकम्पोजिशन " कहा जाता है , जहां इसका इस्तेमाल मॉडल की कमी के लिए किया जाता है। उदाहरण के लिए एक महंगी कम्प्यूटेशनल फ्लूड डायनामिक्स मॉडल को आगे की डिजाइन गतिविधियों में उपयोग के लिए डिस्टिल्ड किया जा सकता है।)

एक अंतिम टिप्पणी, यदि आप समर्थन क्षेत्र (यानी ध्रुवीय सेल आकार) द्वारा सेंसर डेटा का वजन करने के लिए थे, तो यह जीएलएस के ढांचे में एक प्रकार का विकर्ण सहसंयोजक होगा । (यह आपकी भविष्यवाणी की समस्या पर अधिक लागू होगा, हालांकि भारित पीसीए बारीकी से संबंधित होगा।)

आशा है कि ये आपकी मदद करेगा!

अपडेट: सेंसर वितरण के आपके नए आरेख से मेरे विचार में चीजें काफी बदल जाती हैं। यदि आप डिस्क इंटीरियर पर तापमान का अनुमान लगाना चाहते हैं, तो आपको "यूनिट डिस्क पर ऑर्थोगोनल फ़ंक्शन के सेट" की तुलना में बहुत अधिक जानकारीपूर्ण होने की आवश्यकता होगी । सेंसर डेटा में अभी बहुत कम जानकारी है।

यदि आप वास्तव में डिस्क पर स्थानिक तापमान भिन्नता का अनुमान लगाना चाहते हैं, तो एक ही उचित तरीका मैं देख सकता हूं कि समस्या को डेटा आत्मसात के रूप में माना जाएगा । यहां आपको कम से कम कुछ भौतिकी-आधारित विचारों के आधार पर स्थानिक वितरण के पैरामीट्रिक फॉर्म को कम करने की आवश्यकता होगी (ये सिमुलेशन से हो सकते हैं, या समान गतिशीलता वाले सिस्टम में संबंधित डेटा से हो सकते हैं)।

मैं अपने विशेष आवेदन पता नहीं है, लेकिन अगर यह कुछ ऐसा है इस , तो मैं कल्पना कर सकते हैं एक व्यापक इंजीनियरिंग साहित्य है कि आप को आकर्षित कर सकता है उचित पूर्व की कमी चुनने के लिए नहीं है। (विस्तृत डोमेन ज्ञान के प्रकार के लिए, यह संभवतः पूछने के लिए सबसे अच्छा StackExchange साइट नहीं है।)


प्रभावशाली उत्तर! इसे पचाने के लिए कुछ समय चाहिए। आप दो प्रश्न पूछते हैं: मुझे यकीन नहीं है कि मैं पहले एक को समझता हूं ("स्थानिक पैटर्न पर आपको कितनी बाधा की आवश्यकता है?") मैंने सोचा कि सभी 40 सेंसर से डेटा का उपयोग करना परिधि दिशा के साथ औसत से बेहतर होगा? फिर फिटिंग ... क्या आप यह कह रहे हैं कि यह जरूरी नहीं है? दूसरे एक के लिए ("स्पैट-टेम्पोरल डेटा में किस प्रकार की परिवर्तनशीलता होती है"), अगले एक या दो दिनों में मैं पहले इंजन का विश्लेषण करूँगा (मेरे पास वास्तव में उनमें से 5 हैं! लेकिन यह एक विषय होगा भविष्य का प्रश्न ...) ctd ...
डेल्फी

... ctd, मैं डेटा को सामान्य करूंगा और मैं देखूंगा कि मैं एक सार्वजनिक साइट पर क्या प्रकाशित कर सकता हूं। कुछ स्थानिक पैटर्न और कुछ समय श्रृंखला ... मुझे लगता है कि वे आपको एक विचार देना चाहिए जो आप पूछ रहे हैं।
डेल्फी

1
मेरे पहले प्रश्न के लिए: यदि आपका अंतिम उद्देश्य अनिवार्य रूप से "नए इंजन के लिए सेंसर परिणामों की भविष्यवाणी करना है" (आपके अन्य प्रश्न से अनुमान लगाया गया है), तो क्या आपको वास्तव में "सेंसर के बीच" से कोई जानकारी चाहिए? एलियासिंग पर मेरी टिप्पणी इस बात का उदाहरण थी कि आपको ऐसी जानकारी की आवश्यकता क्यों होगी , जैसे कि यदिT95सेंसर पर मज़बूती से नहीं मापा जाता है।
जियोमैट

1
BTW अगर यह एक डिज़ाइन समस्या है, और इसमें CFD- प्रकार के सिमुलेशन जुड़े हुए हैं, तो यह वर्तमान प्रश्न से निहित जानकारी से काफी अधिक है। (उदाहरण के लिए, डेटा अस्मिता के रूप में समस्या का सामना करने वाले अलग-अलग तरीकों का उपयोग कर सकते हैं।)
GeoMatt22

आपका जवाब मुझे लगता है: प्रतिगमन के बजाय, क्या कोई 2 डी एक असतत फूरियर रूपांतरण के बराबर है जो किया जा सकता है? उदाहरण डेटा अंक का अभिन्न अंग n-वें बेसेल फ़ंक्शन (उचित रूप से संशोधित) को लेते हुए, और फिर एक ऑर्थोगोनल अपघटन हो रहा है? यहाँ चिंताएं 1) उचित असतत-आयत फ़ंक्शन को खोजने में होगी, संभवतः आपके उत्तर के समान रेखाओं के साथ, और 2) क्या यह बहुत कम संख्या के नमूने बिंदुओं के प्रति संवेदनशील होगा और अपघटन अधिक जटिल उच्च क्रम की शर्तों पर झुक जाएगा ।
jwimberley

2

Zernlike बहुपद एक बुरी पसंद की तरह नहीं लगता है, क्योंकि वे पहले से ही है r तथा θनिर्भरता और रूढ़िवादिता में पकाया जाता है। हालांकि, जब से आप तापमान का अध्ययन कर रहे हैं, तो यकीनन अधिक उपयुक्त और बेहतर ज्ञात विकल्प बेसेल फ़ंक्शन होंगे । ये बेलनाकार वस्तुओं / समन्वय प्रणालियों में गर्मी के प्रवाह के अध्ययन में आते हैं, और इसलिए एक मौका है कि वे शारीरिक रूप से अधिक उपयुक्त हैं। N-th बेसेल फ़ंक्शन ध्रुवीय निर्भरता के लिए संबंधित त्रिकोणमितीय फ़ंक्शन के साथ जुड़े रेडियल निर्भरता देगा; आप कई भौतिकी और पीडीई पाठ्यपुस्तकों में विवरण पा सकते हैं।


(+1) ध्रुवीय-निर्देशांक गर्मी समीकरण कनेक्शन एक अच्छा है। एक और शायद ध्यान देने योग्य बात यह है कि गौसियन प्रक्रियाओं के लिए मुझे आमतौर पर आयताकार ग्रिड पर पता चलता है कि सहसंयोजक मैट्रिक्स परिसंचारी है, और व्यावहारिक रूप से एफएफटी का उपयोग किया जाता है। इसलिए बेसेल फ़ंक्शन एक ध्रुवीय ग्रिड पर समान दृष्टिकोण के लिए एक संभावित उम्मीदवार होगा।
जियोमैट

एक दिलचस्प सुझाव! हालांकि, मैं ऑपरेटिंग तरल पदार्थ में तापमान को माप रहा हूं, इंजन के ठोस हिस्से में नहीं। इस प्रकार मैं संवहन समस्या में रुचि रखता हूं, जैसा कि चालन समस्या के विपरीत है। बेसल फ़ंक्शन निश्चित रूप से गर्मी चालन (फूरियर) समीकरण के समाधान हैं, लेकिन मुझे नहीं लगता कि वे गर्मी संवहन समीकरण का समाधान भी हैं, क्योंकि संवहन द्रव प्रवाह क्षेत्र पर निर्भर करता है। वैसे भी, मैं बहुत कम से कम उन्हें बनाम Zernike परीक्षण कर सकता है। GLS के बारे में क्या? क्या आप प्रश्न के उस हिस्से पर भी कुछ जोड़ सकते हैं?
डेल्टिव

@ डेल्टिव मैं जीएलएस से बहुत परिचित नहीं हूं, लेकिन एक सवाल - आप विभिन्न गोलाकार बिंदुओं पर त्रुटियों के संबंध में अपेक्षा क्यों करते हैं? मैं मानता हूं कि वास्तविक उतार-चढ़ाव अंक के बीच सहसंबद्ध होंगे, लेकिन मुझे लगता है कि त्रुटियां (यानी सेंसर रीडिंग में अनिश्चितता) असंबद्ध होगी। शायद प्रतिगमन उतार-चढ़ाव के लिए त्रुटियों के रूप में गिना जाता है? हालांकि, मैं दंड संबंधी शर्तों के बारे में कुछ जोड़ने पर विचार कर रहा हूं। आप जो भी आधार का उपयोग करते हैं, आपके पास नमूना संख्याओं की केवल एक सीमित संख्या होती है और बेसेल फ़ंक्शन से मेल खाने वाले कुछ बहुत ही उच्च क्रम मिल सकते हैं, इसलिए सबसे कम-क्रम की शर्तों को प्राथमिकता दी जानी चाहिए।
jwimberley

@DeltaIV फिर से उतार-चढ़ाव के बारे में, जो स्थानिक बिंदुओं के बीच सहसंबंधों को पेश करेगा: आपकी वस्तु एक तापमान मानचित्र प्राप्त करना है, है ना? क्या आप नहीं देखना चाहते हैं कि क्या उतार-चढ़ाव हो रहे हैं? और एक सांख्यिकीय मॉडल भी उनके लिए जिम्मेदार हो सकता है, क्योंकि उतार-चढ़ाव द्रव गतिशीलता से प्रेरित होगा और अंतरिक्ष और समय में जटिल होगा? (क्या यह आपके विश्लेषण के समय-निर्भर भाग से संबंधित है जिसे आपने सरलता के लिए छोड़ दिया है?)
jwimberley

गैलरी चैट बनाई गई
डेल्टावी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.