गतिशील समय ताना और सामान्यीकरण


9

मैं "क्वेरी" और "टेम्प्लेट" वक्र से मिलान करने के लिए डायनेमिक टाइम वारिंग का उपयोग कर रहा हूं और इस प्रकार अब तक उचित सफलता पा रहा हूं, लेकिन मेरे पास कुछ बुनियादी प्रश्न हैं:

  1. मैं यह आंकलन करके "मैच" कर रहा हूं कि क्या DTW का परिणाम कुछ सीमा मूल्य से कम है, जो मैं उसके साथ आया हूं। क्या DTW का उपयोग करके "मैच" का निर्धारण करने का यह सामान्य तरीका है? यदि नहीं, तो कृपया समझाएं ...

    (1) के उत्तर को "हां" मान लें, तो मैं उलझन में हूँ, क्योंकि DTW परिणाम काफी संवेदनशील है) क के आयामों में अंतर और b) क्वेरी वेक्टर की लंबाई और लंबाई " टेम्पलेट "वेक्टर।

    मैं एक सममित कदम फ़ंक्शन का उपयोग कर रहा हूं, इसलिए (b) मैं M + N (DTW मैट्रिक्स की चौड़ाई + ऊंचाई) से विभाजित करके अपने DTW परिणाम को सामान्य कर रहा हूं। यह कुछ हद तक प्रभावी प्रतीत होता है, लेकिन ऐसा लगता है कि यह डीटीडब्ल्यू मैचों को दंडित करेगा जो तिरछे (यानी, डीटीडब्ल्यू मैट्रिक्स के माध्यम से एक लंबा रास्ता है) से आगे हैं। जो "सामान्यीकरण" दृष्टिकोण के लिए एक प्रकार का मनमाना लगता है। मैट्रिक्स के माध्यम से चरणों की संख्या से विभाजित करना सहज ज्ञान युक्त लगता है, लेकिन यह साहित्य के अनुसार करने का तरीका प्रतीत नहीं होता है।

  2. तो क्या क्वेरी और टेम्पलेट वैक्टर के आकार के लिए DTW परिणाम को समायोजित करने का एक बेहतर तरीका है?

  3. अंत में, मैं क्वेरी और टेम्पलेट वैक्टर के बीच आयाम में अंतर के लिए DTW परिणाम को सामान्य कैसे करूं?

जैसा कि यह है, विश्वसनीय सामान्यीकरण तकनीकों की कमी (या मेरी समझ की कमी) को देखते हुए, "मैच" को परिभाषित करने के लिए सर्वश्रेष्ठ थ्रेशोल्ड स्तर की पहचान करने के लिए नमूना डेटा के साथ काम करने में बहुत सारे मैनुअल प्रयास शामिल हैं। क्या मैं कुछ भूल रहा हूँ?

जवाबों:


8

कम से कम मेरे ज्ञान के लिए कोई "सामान्य दृष्टिकोण" मौजूद नहीं है। इसके अलावा आप किसी भी तरह एक दूरी मीट्रिक को कम करने की कोशिश कर रहे हैं। उदाहरण के लिए DTW कागजात की पोती में साको और चिबा (1978) का उपयोग करेंदो फीचर वैक्टर के बीच अंतर की माप के रूप में।||aibi||

जैसा कि आपने सही ढंग से पहचाना है कि आपको बॉक्स से बाहर काम करने के लिए समान अंक (आमतौर पर) की आवश्यकता है। मैं आपको समान आकार के पहले बनाने के लिए आपके घटता पर एक नीच () चिकनी / प्रक्षेपक का उपयोग करने का प्रस्ताव दूंगा। यह "वक्र आँकड़ों" के लिए बहुत मानक सामग्री है। आप चीयू एट अल में एक उदाहरण आवेदन देख सकते हैं (2003) ; लेखक इस काम में डीटीडब्ल्यू की परवाह नहीं करते हैं लेकिन यह एक अच्छा उदाहरण है कि असमान आकार के रीडिंग से कैसे निपटें।

इसके अतिरिक्त जैसा कि आप कहते हैं "आयाम" एक मुद्दा है। यह ईमानदार होने के लिए थोड़ा अधिक खुला हुआ है। आप इस पर ध्यान देने के लिए झांग और मुलर (2011) द्वारा प्रस्तावित एरिया-अंडर-द-कर्व दृष्टिकोण की कोशिश कर सकते हैं, लेकिन वास्तव में सुपर-मानक सामान्यीकरण (यानी। बदले साथ समय के प्रयोजनों के लिए। इस पेपर में भी Tang और Mueller (2009) द्वारा कर सकता है । मैं दूसरे का पालन करूंगा, लेकिन किसी भी मामले में जैसा कि आपने भी देखा कि नमूनों का सामान्यीकरण एक है। आवश्यकता।f(x)f(x)supy|f(x)|

आपके डेटा की प्रकृति के आधार पर आप अधिक एप्लिकेशन विशिष्ट साहित्य पा सकते हैं। मैं व्यक्तिगत रूप से सभी को सबसे अधिक सहज ज्ञान युक्त लक्ष्य वारिंग फ़ंक्शन के संबंध में न्यूनतम करने के दृष्टिकोण का पता लगाता हूं । तो कम करने के लिए लक्ष्य समारोह है: , जहां यह के बावजूद पूरी बात uncanniness है वास्तव में काफी स्पष्ट है: आप मुड़ने समारोह को खोजने के लिए खोजने की कोशिश कि कम करता विकृत क्वेरी वक्र के बेमेल की उम्मीद योग के लिए संदर्भ वक्र (शब्दgCλ(Yi,Yk,g)=E{T(Yi(g(t))Yk(t))2+λ(g(t)t)2dt|Yi,Yk}gYi(g(t))Yk(t)Yi(g(t))Yk(t)) उस युद्ध ( टर्म ) द्वारा आपके द्वारा लगाए गए समय-विरूपण के लिए कुछ सामान्यीकरण के अधीन । यह वही है जो MATLAB पैकेज पेस लागू कर रहा है। मुझे पता है कि जो रामसे एट अल द्वारा एक आर पैकेज एफडीए मौजूद है । यह भी मदद की हो सकती है, लेकिन मैंने व्यक्तिगत रूप से इसका उपयोग नहीं किया है (उस पैकेज के तरीकों के लिए मानक संदर्भ थोड़ा परेशान करने वाला है, कई मामलों में रामसे और सिल्वरमैन की उत्कृष्ट पुस्तक, कार्यात्मक डेटा विश्लेषण (2006) 2 डी एड।) और आपको परिमार्जन करना होगा। 400 पेज की किताब जो आप चाहते हैं उसे पाने के लिए; कम से कम यह वैसे भी अच्छा है)g(t)t

सांख्यिकी साहित्य में आप जिस समस्या का वर्णन कर रहे हैं उसे व्यापक रूप से " वक्र पंजीकरण " के रूप में जाना जाता है (उदाहरण के लिए गैसर और कनीप (1995) को इस मुद्दे के शुरुआती उपचार के लिए) और कार्यात्मक डेटा विश्लेषण तकनीकों के सामान्य छाता के अंतर्गत आता है ।

(अगर मैं लिंक पर उपलब्ध मूल कागज को लिंक पर उपलब्ध करवा सकता हूं, तो वहां से लिंक हो सकता है; अन्यथा लिंक एक सामान्य डिजिटल लाइब्रेरी को निर्देशित करता है। वर्णित लगभग सभी कागजात मुफ्त में संस्करणों का मसौदा तैयार करने के लिए मिल सकते हैं। मैंने अपनी मूल टिप्पणी को हटा दिया है। इस पद से अभिभूत।)


यह एक उत्कृष्ट और बहुत ही उपयोगी उत्तर है। संदर्भ विशेष रूप से सहायक हैं।
मिको

क्या आप जानते हैं कि dtw में "आयाम एक मुद्दा है" बताते हुए एक फिटिंग संदर्भ है? यह शायद इतना स्पष्ट है कि मैं एक संदर्भ खोजने के लिए संघर्ष कर रहा हूं, जो इसके बारे में स्पष्ट रूप से चर्चा करता है।
मिको

मुझे खुशी हुई आपको पसंद आया। जैसा कि मैंने कहा कि आयाम का उपचार "थोड़ा और अधिक समाप्त हो गया है" और मुझे नहीं लगता कि आप इसका उल्लेख करते हुए एक भी संदर्भ पाएंगे जब तक कि यह प्रश्न में आवेदन या कार्यप्रणाली से संबंधित न हो (उदाहरण के लिए जांग और मुलर के काम में ' 09)। जब आपके पास विभिन्न इकाइयों में डेटा मापा जाता है तो सामान्यीकरण आवश्यक है। आमतौर पर जो महत्वपूर्ण होता है वह कार्यात्मक प्रमुख / विहित / what_have_you घटकों का सामान्यीकरण होता है, इसलिए वे में एक आधार बनाते हैं । L2
us --r11852

पहले से ही वर्णित संसाधनों से शायद आपका सबसे अच्छा शर्त शायद रामसे और सिल्वरमैन, चैप्टर द्वारा एफडीए की किताब होगी। "कार्यात्मक डेटा के पंजीकरण और प्रदर्शन" पर 7। एक बहुत अच्छा संसाधन पुस्तक भी है: हॉर्वाथ और कोकोज़्का द्वारा "एप्लीकेशन के साथ कार्यात्मक डेटा के लिए इंजेक्शन"; भाग III "आश्रित कार्यात्मक डेटा" सामान्यीकरण के मुद्दे पर अधिकांशतः छूता है क्योंकि लोग परिवर्तन बिंदु का पता लगाते हैं।
us --r11852
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.