कार्यात्मक डेटा विश्लेषण और उच्च आयामी डेटा विश्लेषण के बीच अंतर क्या है


10

सांख्यिकीय साहित्य में " कार्यात्मक डेटा " (यानी डेटा जो घटता है), और समानांतर में, " उच्च आयामी डेटा " (यानी जब डेटा उच्च आयामी वैक्टर हैं) में बहुत सारे संदर्भ हैं। मेरा प्रश्न दो प्रकार के डेटा के बीच अंतर के बारे में है।

जब केस 1 में लागू होने वाले लागू आंकड़ों के तरीकों के बारे में बात की जा सकती है, तो कार्य 2 के एक परिमित आयामी उप-क्षेत्र में एक प्रक्षेपण के माध्यम से केस 2 से कार्यप्रणाली के रीफ़्रेशिंग के रूप में समझा जा सकता है, यह पॉलीनोम, स्प्लीन, वेवलेट, फूरियर, हो सकता है ... । और कार्यात्मक समस्या को एक परिमित आयामी सदिशीय समस्या में बदल देगा (क्योंकि लागू गणित में सब कुछ कुछ बिंदु पर परिमित हो जाता है)।

मेरा सवाल यह है: क्या हम कह सकते हैं कि कोई भी सांख्यिकीय प्रक्रिया जो कार्यात्मक डेटा पर लागू होती है, को उच्च आयाम डेटा पर भी (लगभग सीधे) लागू किया जा सकता है और यह कि उच्च आयामी डेटा को समर्पित कोई भी प्रक्रिया कार्यात्मक डेटा पर लागू की जा सकती है (लगभग सीधे)?

यदि उत्तर नहीं है, तो क्या आप इसका वर्णन कर सकते हैं?

EDIT / UPDATE साइमन बायरन के जवाब की मदद से:

  • स्पार्सिटी (एस-स्पार्स धारणा, बॉल और लिए कमजोर बॉल ) का उपयोग उच्च आयामी सांख्यिकीय विश्लेषण में एक संरचनात्मक धारणा के रूप में किया जाता है।एल पी पी < 1lplpp<1
  • "चिकनाई" का उपयोग कार्यात्मक डेटा विश्लेषण में एक संरचनात्मक धारणा के रूप में किया जाता है।

दूसरी ओर, उलटा फूरियर ट्रांसफॉर्म और उलटा वेवलेट ट्रांसफॉर्मेशन स्पार्सिटी को स्मूदनेस में बदल रहे हैं, और वेवलेट और फूरियर ट्रांसफॉर्म द्वारा स्मूथनेस को स्पैरिटी में बदल दिया जाता है। यह साइमन द्वारा उल्लिखित महत्वपूर्ण अंतर को इतना महत्वपूर्ण नहीं बनाता है?


1
चौरसाई कार्यात्मक डेटा विश्लेषण का एक बड़ा हिस्सा है, और इसे उचित आधार पर प्रक्षेपण द्वारा वेक्टर अर्थ अनुमान समस्या में परिवर्तित किया जा सकता है (जैसे फूरियर या वेवलेट), लेकिन कार्यात्मक डेटा विश्लेषण में अन्य समस्याएं हैं जो डॉन पर निर्भर करती हैं 'आसानी से अनुवाद नहीं। उदाहरण के लिए कार्यात्मक प्रतिगमन लें, जहां आप कोवरिएट से एक कार्यात्मक प्रतिक्रिया की भविष्यवाणी करने में रुचि रखते हैं।
vqv

जवाबों:


12

फ़ंक्शनल डेटा में अक्सर अलग प्रश्न शामिल होते हैं। मैं फंक्शनल डेटा एनालिसिस, रैमसे और सिल्वरमैन पढ़ रहा हूं, और वे कई बार कर्व रजिस्ट्रेशन, वर्किंग फंक्शंस और कर्व्स के डेरिवेटिव्स का आकलन करने पर चर्चा करते हैं। उच्च-आयामी डेटा का अध्ययन करने में रुचि रखने वाले लोगों की तुलना में ये बहुत अलग प्रश्न हैं।


पूरी तरह से सहमत ! जो प्रश्न पूछे जाते हैं वे अलग हैं। पंजीकरण, लैंडमार्किंग, डेरिवेटिव का अनुमान कार्यात्मक दृष्टिकोण से उत्पन्न हो सकता है। यह मुझे समझा! कार्यात्मक डेटा के साथ इतना बड़ा सौदा (जैसा कि यह सांख्यिकीय साहित्य में खड़ा है) यह नहीं होगा कि यह एक निरंतर सेट पर परिभाषित किया गया है, लेकिन अधिक यह एक निर्धारित सेट पर अनुक्रमित है?
रॉबिन जिरार्ड

यह सिर्फ इतना नहीं है कि यह एक निर्धारित सेट पर परिभाषित किया गया है। अन्यथा, आप कार्यात्मक डेटा विश्लेषण से समय श्रृंखला विश्लेषण को कैसे भेद करेंगे? मैं @ user549 से सहमत हूं कि यह उन प्रकार के प्रश्नों को उबालता है जो पूछे जाते हैं। वे डेटा की संरचना के लिए विशिष्ट हैं।
vqv

15

हां और ना। सैद्धांतिक स्तर पर, दोनों मामले समान तकनीकों और रूपरेखाओं का उपयोग कर सकते हैं (गॉसियन प्रक्रिया प्रतिगमन एक उत्कृष्ट उदाहरण)।

महत्वपूर्ण अंतर वह धारणा है जो ओवरफिटिंग (नियमितीकरण) को रोकने के लिए उपयोग की जाती है:

  • कार्यात्मक मामले में, आमतौर पर सहजता की कुछ धारणा होती है, दूसरे शब्दों में, एक दूसरे के करीब होने वाले मूल्य कुछ व्यवस्थित तरीके से समान होने चाहिए। इससे तकनीकों का उपयोग होता है जैसे स्प्लीन, लोस, गॉसियन प्रक्रियाएं आदि।

  • उच्च-आयामी मामले में, आमतौर पर विरलता की धारणा होती है: अर्थात, आयामों के केवल सबसेट के पास कोई संकेत होगा। इससे उन आयामों (लैस्सो, लार्स, स्लैब-एंड-स्पाइक पुजारी, इत्यादि) की पहचान करने के उद्देश्य से तकनीकें होती हैं।

अपडेट करें:

मैं वास्तव में तरंगिका / फूरियर विधियों के बारे में नहीं सोचता था, लेकिन हां, इस तरह के तरीकों के लिए उपयोग की जाने वाली थ्रॉल्डिंग तकनीक अनुमानित स्थान में दुर्लभता के लिए लक्ष्य है। इसके विपरीत, कुछ उच्च-आयामी तकनीकें कम-आयामी कई गुना (जैसे प्रमुख घटक विश्लेषण) पर एक प्रक्षेपण मानती हैं, जो एक प्रकार की चिकनाई धारणा है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.