सांख्यिकीय रूप से महत्वपूर्ण शिखर के लिए जाँच करना


14

मेरे पास डेटा, और x का एक सेट है । मैं निम्नलिखित परिकल्पना का परीक्षण करना चाहूंगा: y में एक चोटी है ; जैसे ही x बढ़ता है, y पहले बढ़ता है और फिर घटता है।yxyxy

मेरा पहला विचार एक एसएलआर में और एक्स 2 फिटिंग था । यही है, अगर मुझे लगता है कि x से पहले गुणांक काफी सकारात्मक है और x 2 से पहले गुणांक काफी नकारात्मक है, तो मेरे पास परिकल्पना के लिए समर्थन है। हालांकि, यह केवल एक प्रकार के संबंध (द्विघात) की जांच करता है और जरूरी नहीं कि चोटी के अस्तित्व पर कब्जा कर सकता है।xx2xx2

तब मैं खोजने के बारे में सोचा , (अनुसार क्रमबद्ध का मान) की इस तरह के एक क्षेत्र एक्स , कि के बीच है एक और सी , के दो अन्य क्षेत्रों x कि के रूप में कई बिंदुओं के रूप में कम से कम होते हैं , और कहा कि ¯ y > ¯ y एक और ¯ y > ¯ y काफी। यदि परिकल्पना सच है, हम कई ऐसे क्षेत्रों की उम्मीद करनी चाहिए । इस प्रकार, यदि बी की संख्या पर्याप्त रूप से बड़ी है, तो परिकल्पना के लिए समर्थन होना चाहिए।bxbacxbyb¯>ya¯yb¯>yc¯bb

क्या आपको लगता है कि मैं अपनी परिकल्पना के लिए एक उपयुक्त परीक्षण खोजने के लिए सही रास्ते पर हूँ? या क्या मैं पहिया का आविष्कार कर रहा हूं और इस समस्या के लिए एक स्थापित विधि है? मैं आपके इनपुट की बहुत सराहना करूंगा।

अपडेट करें। मेरा आश्रित चर गिनती (गैर-नकारात्मक पूर्णांक) है।y


क्या x के साथ आसानी से बदलता है ? यदि ऐसा है तो आप एक मॉडल को फिट करने की कोशिश कर सकते हैं, जिसमें एक स्मूथ (जिसमें एक जीएएम भी शामिल है) और फिर फिट किए गए स्मूथ और उनके आत्मविश्वास के अंतराल के पहले डेरिवेटिव की गणना करें। यदि व्युत्पन्न साइनिफ बढ़ रहा है तो साइनिफ घटते हुए आपके पास एक उत्तर है। yx
मोनिका - जी। सिम्पसन

जवाबों:


6

मैं भी चौरसाई विचार के बारे में सोच रहा था। लेकिन प्रतिक्रिया सतह कार्यप्रणाली नामक एक पूरा क्षेत्र है जो शोर डेटा में चोटियों की खोज करता है (यह मुख्य रूप से डेटा के लिए स्थानीय द्विघात फिट का उपयोग करता है) और शीर्षक में "बम्प शिकार" के साथ एक प्रसिद्ध पेपर था जिसे मैं याद करता हूं। यहाँ प्रतिक्रिया सतह कार्यप्रणाली पर पुस्तकों के कुछ लिंक दिए गए हैं। रे मायर की पुस्तकें विशेष रूप से अच्छी तरह से लिखी गई हैं। मैं बम्प हंटिंग पेपर खोजने की कोशिश करूंगा।

प्रतिक्रिया भूतल कार्यप्रणाली: डिज़ाइन किए गए प्रयोगों का उपयोग करके प्रक्रिया और उत्पाद अनुकूलन

प्रतिक्रिया भूतल पद्धति और संबंधित विषय

प्रतिक्रिया सतह कार्यप्रणाली

अनुभवजन्य मॉडल-बिल्डिंग और प्रतिक्रिया सतहों

यद्यपि मैं जिस लेख की तलाश में था, वह नहीं है, यहाँ जेरी फ्रीडमैन और निक फिशर द्वारा एक बहुत ही प्रासंगिक लेख है जो इन विचारों से संबंधित है जो उच्च-आयामी डेटा पर लागू होते हैं।

यहाँ कुछ ऑनलाइन टिप्पणियों के साथ एक लेख है।

इसलिए मुझे उम्मीद है कि आप कम से कम मेरी प्रतिक्रिया की सराहना करेंगे। मुझे लगता है कि आपके विचार अच्छे हैं और सही रास्ते पर हैं, लेकिन मुझे लगता है कि आप पहिया को फिर से मजबूत कर सकते हैं और मुझे उम्मीद है कि आप और अन्य लोग इन उत्कृष्ट संदर्भों को देखेंगे।


3
मैं नीच लोगों में से नहीं था, लेकिन एसई साइटों पर उत्तर सामग्री के लिंक से अधिक होने की उम्मीद है। सामग्री को सारांशित करना या सारांश प्रतिक्रिया प्रदान करना तब आगे के विवरण के लिए सामग्री को जोड़ना बेहतर होगा।
मोनिका को बहाल करें - जी। सिम्पसन

2
मैं इस एक को बढ़ा रहा हूं क्योंकि (1) यह एक अच्छा विचार प्रस्तुत करता है; (२) इसमें कुछ टिप्पणी है; और (3) यह कुछ ध्यान से चुने गए लिंक के साथ समर्थित है, जिसमें स्वतंत्र रूप से उपलब्ध सामग्री शामिल है। हां, यह टाइपोग्राफिक रूप से बुरा लगता है, क्योंकि लिंक अधिक अच्छी तरह से स्वरूपित हो सकते हैं: लेकिन मुझे उम्मीद है कि लोग अपने मतदान निर्णयों में उत्तर के उस पहलू को भारी नहीं कर रहे हैं!
व्हिबर

1
@ जब मैं प्रोसेकिनटर द्वारा अच्छा प्रारूपण के कारण इसे स्पष्ट रूप से पढ़ने में सक्षम होने के बाद सहमत हूं। साथ ही +1। मुझे लगता है कि यहां पर्याप्त सारांश है और कुछ विषय मौलिक विचार से अधिक और आगे पढ़ने के लिए एक संदर्भ के लिए लगभग बहुत जटिल हैं।
एरिक

5
@MichaelChernick ध्यान दें कि मेरी ओर से कोई आलोचना नहीं की गई थी , बस लोगों को वोट देने के लिए एक कारण की पेशकश की। मैं उनसे सहमत नहीं होता अगर वह कारण था क्योंकि मुझे लगता है कि आपका जवाब हाजिर है, खासकर PRIM के साथ; मैं अपने Hastie et al (2009) के बारे में सलाह ले रहा था जैसा कि उसने PRIM पर कहा था। आप उस लिंक को उत्तर में जोड़ना चाह सकते हैं क्योंकि वहां PRIM पर दो सेक्शन हैं और PDF मुफ्त में उपलब्ध है।
मोनिका - जी। सिम्पसन

1
@ नीकिता औपचारिक सांख्यिकीय परिकल्पना है जिसे आप परीक्षण करना चाहते हैं? पहले आपको उन चोटियों को खोजना होगा जो इसका एक बड़ा हिस्सा है। क्या आप परीक्षण कर रहे हैं कि शिखर केवल शोर का परिणाम नहीं है? मुझे यकीन नहीं है कि इस समस्या को हल करने के लिए कौन सा साहित्य है, लेकिन मेरा विचार यह है कि आप डेटा के लिए एक बहुपद प्रतिगमन (शायद स्थानीय रूप से एक द्विघात) को फिट कर सकते हैं। उससे आपको अवशिष्ट विचरण का अनुमान होगा। द्विघात शब्द का सांख्यिकीय महत्व शिखर के महत्व के लिए एक परीक्षण होगा।
माइकल आर। चेरिक

1

भले ही आपने मेरे सवाल का जवाब नहीं दिया है, अगर मेरा अनुमान सही है तो आप सफेद शोर के परीक्षण की तलाश कर रहे हैं जो कि आवृत्ति डोमेन में यह दर्शाने के लिए है कि स्पेक्ट्रम सपाट है। तो फिशर के पीरियडोग्राम टेस्ट, जिसे इस संदर्भ में फिशर का कप्पा कहा जाता है, का इस्तेमाल किया जा सकता है। लिंक देखें।

http://www4.stat.ncsu.edu/~dickey/Spain/pdf_Notes/Spectral2.pdf

संदर्भ में बारलेट के परीक्षण का भी उल्लेख किया गया है। अब पीरियडोग्राम में एक महत्वपूर्ण शिखर खोजने के लिए अशक्त परिकल्पना राशियों को अस्वीकार करना। इसका मतलब यह होगा कि एक आवधिक घटक समय श्रृंखला में मौजूद है।

क्योंकि परीक्षण फ़्रीक्वेंसी डोमेन में है और इसमें शामिल है कि पीरियडोग्राम ऑर्डिनेट में निर्देश है कि शून्य परिकल्पना के तहत chi square 2 वितरण है और स्वतंत्र हैं। यह विशेष वितरण केवल आवृत्ति डोमेन में परिवर्तन के कारण आता है। यदि x समय थे तो यह समय डोमेन में काम नहीं करेगा या सामान्य रूप से ys के लिए वितरण स्वतंत्र ची वर्ग नहीं होगा।

m


y

तो y गणना डेटा है और xa निरंतर व्याख्यात्मक चर क्या है? मेरे पिछले सुझाव शायद उस मामले में नहीं हैं, लेकिन गिनती के मॉडल पर हालिया साहित्य है। इसलिए यदि आप डेटा और समस्या के बारे में थोड़ा अधिक विशिष्ट हो सकते हैं, तो शायद मैं किसी समाधान की ओर संकेत कर सकता हूं।
माइकल आर। चेरिक

yx

मुझे यकीन नहीं है कि यह मदद करेगा या नहीं लेकिन कैमरन और त्रिवेदी ने गिनती प्रतिगमन मॉडल पर एक पुस्तक प्रकाशित की और 2013 में एक दूसरा संस्करण सामने आया। यहां कुछ जानकारी के साथ एक लिंक दिया गया है: cameron.econ.ucdavis.edu/racd/count .html
माइकल आर। चर्निक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.