दिशात्मक स्वतंत्र चर द्वारा एक सामान्य रूप से वितरित DV के लिए संघ का परीक्षण?


10

वहाँ एक सामान्य रूप से वितरित निर्भर चर एक साथ जुड़ा हुआ है कि क्या का एक काल्पनिक परीक्षण है दिशात्मक वितरित चर?

उदाहरण के लिए, यदि दिन का समय व्याख्यात्मक चर है (और सप्ताह के दिन, वर्ष का महीना, इत्यादि चीजें अप्रासंगिक हैं) - तो इस तथ्य के लिए कैसे ध्यान रखें कि 11:00 1 बजे से 22 घंटे आगे है, और 2 एसोसिएशन के एक परीक्षण में 1 घंटे पीछे ? क्या मैं यह परीक्षण कर सकता हूं कि क्या दिन का निरंतर समय निर्भर चर को यह समझाए बिना कि रात 12:59 के बाद एक मिनट का पालन नहीं करता है?

क्या यह परीक्षण दिशात्मक ( मॉड्यूलर ?) व्याख्यात्मक चर को असतत करने के लिए भी लागू होता है ? या क्या इसके लिए एक अलग परीक्षण की आवश्यकता है? उदाहरण के लिए, यह कैसे परीक्षण किया जाए कि आश्रित चर वर्ष के महीने ( वर्ष के मौसम और वर्ष के मौसम, और विशिष्ट वर्ष या दशक अप्रासंगिक हैं) द्वारा समझाया गया है । वर्ष के उपचार महीने स्पष्ट रूप से आदेश की अनदेखी करता है। लेकिन वर्ष के महीने को एक मानक क्रमिक चर के रूप में माना जाता है (जनवरी = 1 ... दिसंबर = 12) कि जनवरी नवंबर के दो महीने बाद आता है।


1
जवाब एक किताब भर सकता है (और वहाँ उनमें से कई हैं)। आपके प्रश्न को और अधिक विशिष्ट बनाने से आपके लिए क्या मायने रखता है, इसके जवाबों पर ध्यान केंद्रित करने में मदद मिल सकती है।
whuber

@whuber Um ... gosh ... क्या आप मेरी मदद कर सकते हैं कि कैसे संकीर्ण हो? एक वितरण के लिए निर्दिष्ट DV? प्रतिगमन के बजाय केवल एक परीक्षण तक सीमित? मैं थोड़ा स्तब्ध हूँ और नहीं जानता कि कहाँ से शुरू करूँ ...
एलेक्सिस

@ जब भी मैंने प्रश्न को थोड़ा कम करने का प्रयास किया है, और किसी भी संकेत के लिए इसे अधिक उपयोगी बनाने के लिए आभारी होंगे (मैं वास्तव में मॉड्यूलर भविष्यवक्ताओं के बारे में सोचने के लिए एक प्रारंभिक स्थान चाहता हूं)। यदि यह अब सभ्य रूप में है, तो मुझे इस तरह के परीक्षण के बारे में एक समान प्रश्न के साथ पालन करने की संभावना है जो कि DV में वितरण-मुक्त है।
एलेक्सिस

@ वाउचर एक रिग्रेशन संदर्भ में असतत मॉड्यूलर IV पर मुलिंग: असतत मॉड्यूलर IV के साथ दो स्तर के मिश्रित मॉडल को स्तर -2 की पहचानकर्ता के रूप में प्रत्येक स्तर -2 इकाई के साथ प्री- और बाद के रैंडम मोड के बराबर होगा। संख्या प्रणाली में पूर्ववर्ती और बाद के मूल्य सही रास्ते पर होंगे?
एलेक्सिस

यहाँ देखें jstatsoft.org/article/view/v031i10/v31i10.pdf , पृष्ठ 16।
अमीबा

जवाबों:


9

सामान्य तौर पर, मुझे लगता है कि यह एक व्यापक और अलग सवाल पूछकर शुरू करने के लिए वैज्ञानिक और सांख्यिकीय रूप से अधिक फलदायी है, जो एक परिपत्र भविष्यवक्ता से कितनी दूर की प्रतिक्रिया हो सकती है। मैं कहता हूं कि यहां दिशात्मक के बजाय परिपत्र , आंशिक रूप से क्योंकि उत्तरार्द्ध में गोलाकार और यहां तक ​​कि अधिक शानदार स्थान शामिल हैं, जिन्हें सभी एक ही उत्तर में कवर नहीं किया जा सकता है; और आंशिक रूप से क्योंकि आपके उदाहरण, दिन का समय और वर्ष का समय , दोनों परिपत्र हैं। एक और प्रमुख उदाहरण कम्पास दिशा (हवाओं, जानवरों या मानव आंदोलनों, संरेखण, आदि) के लिए प्रासंगिक है, जो कई परिपत्र समस्याओं में विशेषता है: वास्तव में, कुछ वैज्ञानिकों के लिए यह एक अधिक स्पष्ट प्रारंभिक बिंदु है।

जब भी आप इससे दूर हो सकते हैं, किसी प्रकार के प्रतिगमन मॉडल में समय के साइन और कोसाइन कार्यों का उपयोग करके मॉडलिंग पद्धति को लागू करना एक सरल और आसान है। यह कई जैविक और / या पर्यावरणीय उदाहरणों के लिए कॉल का पहला पोर्ट है। (दो प्रकार अक्सर एक साथ होते हैं, क्योंकि आम तौर पर मौसमी दिखाई देने वाली जैविक घटनाएं जलवायु या मौसम के लिए प्रत्यक्ष या अप्रत्यक्ष रूप से प्रतिक्रिया दे रही हैं।)

समवर्ती के लिए, 24 घंटे या 12 महीनों में समय माप की कल्पना करें, ताकि उदा

sin[2π(hour/24)],  cos[2π(hour/24)]

sin[2π(month/12)],  cos[2π(month/12)]

प्रत्येक पूरे दिन या वर्ष में एक चक्र का वर्णन करता है। एक मापा या गिनती की गई प्रतिक्रिया और कुछ परिपत्र समय के बीच कोई संबंध नहीं होने का एक औपचारिक परीक्षण तब एक मानक परीक्षण होगा कि क्या साइन और कोसाइन के गुणांक संयुक्त रूप से एक सामान्यीकृत रेखीय मॉडल में हैं, जो कि भविष्यवाणियों के रूप में साइन और कॉज़िन के साथ एक उपयुक्त लिंक और परिवार हैं। प्रतिक्रिया की प्रकृति के अनुसार चुना जा रहा है।

प्रतिक्रिया (सामान्य या अन्य) के सीमांत वितरण का प्रश्न इस दृष्टिकोण में है माध्यमिक और / या परिवार की पसंद से नियंत्रित किया जाना है।

साइन और कोसाइन की योग्यता स्वाभाविक रूप से है कि वे आवधिक हैं और स्वचालित रूप से चारों ओर लपेटते हैं, इसलिए प्रत्येक दिन या वर्ष की शुरुआत और अंत में मूल्य आवश्यक रूप से एक और एक ही होते हैं। सीमा की स्थिति के साथ कोई समस्या नहीं है, क्योंकि कोई सीमा नहीं है।

इस दृष्टिकोण को परिपत्र, आवधिक, त्रिकोणमितीय और फूरियर प्रतिगमन कहा गया है। एक परिचयात्मक ट्यूटोरियल समीक्षा के लिए, यहां देखें

प्रयोग में,

  1. जब भी हम मौसमी की उम्मीद करते हैं तो ऐसे परीक्षण आमतौर पर पारंपरिक स्तरों पर अत्यधिक महत्वपूर्ण परिणाम दिखाते हैं। अधिक दिलचस्प सवाल तब सटीक मौसमी वक्र का अनुमान है, और क्या हमें अन्य साइनसोइडल शर्तों के साथ अधिक जटिल मॉडल की आवश्यकता है।

  2. अन्य भविष्यवक्ताओं के लिए भी कुछ भी नियम नहीं है, जिस स्थिति में हमें अन्य भविष्यवक्ताओं के साथ और अधिक व्यापक मॉडल की आवश्यकता होती है, सीज़न और अन्य सभी भविष्यवाणियों के लिए कोसाइन कहते हैं।

  3. कुछ बिंदु पर, डेटा, समस्या और शोधकर्ता के स्वाद और अनुभव पर संयुक्त रूप से निर्भर करते हुए, समस्या के समय श्रृंखला पहलू पर जोर देना और स्पष्ट समय निर्भरता के साथ एक मॉडल का निर्माण करना अधिक स्वाभाविक हो सकता है। वास्तव में, कुछ सांख्यिकीय रूप से दिमाग वाले लोग इस बात से इनकार करेंगे कि इसके पास पहुंचने का कोई और तरीका है।

जिसे आसानी से प्रवृत्ति के रूप में नामित किया गया है (लेकिन हमेशा आसानी से पहचाने जाने योग्य नहीं) या तो # 2 या # 3 या दोनों के अंतर्गत आता है।

कई अर्थशास्त्री और अन्य सामाजिक वैज्ञानिक बाजारों, राष्ट्रीय और अंतर्राष्ट्रीय अर्थव्यवस्थाओं, या अन्य मानव घटनाओं में मौसमी से संबंधित हैं, आमतौर पर प्रत्येक दिन या (अधिक सामान्यतः) वर्ष के भीतर अधिक जटिल परिवर्तनशीलता की संभावनाओं से प्रभावित होते हैं। अक्सर, हालांकि, हमेशा नहीं, जैविकता और पर्यावरण वैज्ञानिकों के विपरीत मौसमी एक उपद्रव को हटाने या समायोजित करने के लिए एक उपद्रव है, जो अक्सर मौसमीता को दिलचस्प और महत्वपूर्ण मानते हैं, यहां तक ​​कि एक परियोजना का मुख्य फोकस भी। कहा गया कि, अर्थशास्त्री और अन्य लोग भी अक्सर प्रतिगमन-प्रकार का तरीका अपनाते हैं, लेकिन बारूद के साथ संकेतक (डमी) चर का एक बंडल, सबसे साधारण रूप से प्रत्येक महीने के लिए 1 चर या साल के प्रत्येक तिमाही में।0,1। यह नामित छुट्टियों, छुट्टी की अवधि, स्कूल के वर्षों के दुष्प्रभावों, आदि, साथ ही जलवायु या मौसम की उत्पत्ति के प्रभावों या झटके को पकड़ने की कोशिश करने का एक व्यावहारिक तरीका हो सकता है। उन मतभेदों के साथ, ऊपर दिए गए अधिकांश टिप्पणियां अर्थशास्त्र और सामाजिक विज्ञान में भी लागू होती हैं।

रुग्णता, मृत्यु दर, अस्पताल में प्रवेश, क्लिनिक के दौरे, और इस तरह से संबंधित महामारी विज्ञानियों और चिकित्सा सांख्यिकीविदों के दृष्टिकोण, इन दो चरम सीमाओं के बीच में आते हैं।

मेरे विचार में बंटवारे के दिनों या वर्षों को तुलना करने के लिए आमतौर पर मनमाना, कृत्रिम और सबसे अजीब होता है। यह डेटा में आम तौर पर मौजूद चिकनी संरचना की अनदेखी भी है।

संपादित करें खाता अब तक असतत और निरंतर समय के बीच अंतर को संबोधित नहीं करता है, लेकिन मैं अपने अनुभव से इसे व्यवहार में बड़ा सौदा नहीं मानता हूं।

लेकिन सटीक विकल्प इस बात पर निर्भर करते हैं कि डेटा कैसे आता है और परिवर्तन के पैटर्न पर।

यदि डेटा त्रैमासिक और मानव थे, तो मैं संकेतक चर का उपयोग करना चाहता हूं (जैसे कि क्वार्टर 3 और 4 अक्सर अलग होते हैं)। यदि मासिक और मानव, पसंद स्पष्ट नहीं है, लेकिन आपको अधिकांश अर्थशास्त्रियों को साइन और कॉशन बेचने के लिए कड़ी मेहनत करनी होगी। यदि मासिक या महीन और जैविक या पर्यावरणीय, निश्चित रूप से साइन और कोजाइन।

EDIT 2 त्रिकोणमितीय प्रतिगमन पर अधिक जानकारी

त्रिकोणमितीय प्रतिगमन का एक विशिष्ट विवरण (यदि आप चाहें तो किसी अन्य तरीके से नाम दिया गया है) यह है कि लगभग हमेशा साइन और कोसाइन शब्द जोड़े में एक मॉडल के लिए सबसे अच्छे रूप में प्रस्तुत किए जाते हैं। हम दिन का पहला पैमाना समय, वर्ष का समय या कम्पास दिशा में रखते हैं ताकि इसे रेडियन में वृत्त पर कोण के रूप में दर्शाया जाए , इसलिए अंतराल पर [ 0 , 2 day ] । फिर हम जोड़े में से कई के रूप में उपयोग पाप कश्मीर θ , क्योंकि कश्मीर θ , कश्मीर = 1 , 2 , 3 , ...θ[0,2π]sinkθ,coskθ,k=1,2,3,जैसा कि एक मॉडल में आवश्यक हैं। (परिपत्र आंकड़ों में, त्रिकोणमितीय सम्मेलनों ट्रम्प सांख्यिकीय सम्मेलनों के लिए करते हैं, तो यह है कि इस तरह के रूप यूनानी प्रतीकों चर के साथ ही पैरामीटर के लिए उपयोग किया जाता है।)θ,ϕ,ψ

हम इस तरह के रूप भविष्यवक्ताओं की एक जोड़ी प्रस्तुत करते हैं एक प्रतिगमन की तरह मॉडल है, तो हम गुणांक अनुमान है, कहने के लिए 1 , बी 2 ,, मॉडल में शब्दों के लिए अर्थात् 1 पाप θ , 2 क्योंकि θ । यह एक आवधिक संकेत के साथ-साथ फिटिंग चरण का एक तरीका है। अन्यथा इस तरह के रूप में कहें, एक समारोह पाप ( θ + φ ) के रूप में लिखा जा सकता हैsinθ,cosθb1,b2b1sinθ,b2cosθsin(θ+ϕ)

sinθcosϕ+cosθsinϕ,

लेकिन और पाप φ चरण का प्रतिनिधित्व मॉडल फिटिंग का अनुमान है। इस तरह हम एक गैर-रैखिक अनुमान समस्या से बचते हैं।cosϕsinϕ

हम उपयोग करते हैं परिपत्र भिन्नता मॉडल करने के लिए है, तो स्वचालित रूप से अधिकतम और उस भीड़ में सबसे न्यूनतम अलग आधे से एक चक्र है। यह अक्सर जैविक या पर्यावरणीय विविधताओं के लिए एक बहुत अच्छा सन्निकटन है, लेकिन इसके विपरीत हमें विशेष रूप से आर्थिक मौसमी को पकड़ने के लिए कई और शर्तों की आवश्यकता हो सकती है। इसके बजाय सूचक चर का उपयोग करने का एक बहुत अच्छा कारण हो सकता है, जो गुणांकों की सरल व्याख्याओं के लिए तुरंत नेतृत्व करता है।b1sinθ+b2cosθ


मैं @ केल्विन से जवाब के साथ कुछ अचूक ओवरलैप नोट करता हूं।
निक कॉक्स

+1 (Esp "शानदार" का उपयोग करने के लिए है जैसा आपने किया था! :) निक कॉक्स, क्या आप इतने दयालु होंगे कि मेरे प्रश्न के अनुसार स्पष्ट रूप से असतत परिपत्र चर के लिए भी मामला बना सकें ? क्या आप "त्रिकोणमितीय मॉडलिंग" दृष्टिकोण के रूप में सरल होंगे जो आप समय के असतत उपाय का उपयोग करके वर्णन करेंगे? या कुछ प्रकार की "निरंतरता सुधार" होने की आवश्यकता होगी?
एलेक्सिस

जहां तक ​​मुझे पता है, असतत और निरंतर परिपत्र चर के बीच एकमात्र अंतर असतत अंक (जैसे, दोपहर 2 बजे से 14.12345hrs) के मूल्यों के गोलाई में है, गैर-परिपत्र चर के साथ, इसलिए बहुत अंतर नहीं होगा जब तक आप समग्र अवधि के सापेक्ष छोटे चरणों के साथ कम गोलाई लागू करते हैं। मूल रूप से, यह केवल कुछ राउंडिंग त्रुटि होने या न होने की बात है। सबसे अच्छा नहीं, अगर आप इससे बच सकते हैं।
केल्विन

मैं सहमत हूं कि असतत और निरंतर बहुत अलग नहीं हैं। व्यवहार में, कई माप कम या ज्यादा होते हैं, केवल तिमाहियों, अर्ध-वर्षों, महीनों, दिनों, आदि में या (N. S) से लेकर (N, E, S, W) तक किसी भी महीन संकल्प पर रिपोर्ट करके कम्पास दिशाओं के लिए। विस्तार से, बिंदु माप (सटीक समय पर तापमान) और अंतराल माप (जैसे कुल मासिक बिक्री) के बीच अंतर हैं। मैं राउंडिंग त्रुटि के रूप में इस तरह के सभी विवरणों को एक साथ नहीं लूँगा, क्योंकि कभी-कभी एग्रेशन या औसत के रूप में कोई त्रुटि नहीं होती है।
निक कॉक्स

4

यहाँ एक वितरण-मुक्त विकल्प है, क्योंकि ऐसा लगता है कि आप वैसे भी क्या देख रहे हैं। यह परिपत्र आँकड़ों के क्षेत्र के लिए विशेष रूप से नहीं है, जिनमें से मैं काफी अज्ञानी हूं, लेकिन यह यहां और कई अन्य सेटिंग्स में लागू है।

X

YRdd1

Z:=(X,Y)mzi=(xi,yi)

अब, निम्नलिखित पेपर की तरह, हिल्बर्ट श्मिट इंडिपेंडेंस मानदंड (HSIC) का उपयोग करके एक परीक्षण करें:

ग्रेट्टन, फुकुमिजू, टीओ, सॉन्ग, श्लोकोफ़ और स्मोला। स्वतंत्रता का एक कर्नेल सांख्यिकीय परीक्षण। एनआईपीएस 2008. ( पीडीएफ )

अर्थात्:

  • kX

    • XR2k(x,x)=exp(12σ2xx2)σX
    • X[π,π]k(x,x)=exp(κcos(xx))κ
  • lYYRn

  • HKLm×mKij=k(xi,xj)Lij=l(yi,yj)H H=I1m11T1m2tr(KHLH)

RBF गुठली के साथ इसे बाहर ले जाने के लिए मतलाब कोड यहाँ पहले लेखक से उपलब्ध है


यह दृष्टिकोण अच्छा है क्योंकि यह सामान्य है और अच्छा प्रदर्शन करता है। मुख्य कमियां हैं:

  • m2
  • mm
  • kl


k(xx)[π,π]


3

आप अवधि के विपरीत "आधा" से माध्य के बीच टी -टेस्ट चला सकते हैं , उदाहरण के लिए, दोपहर 12 बजे से 12 बजे के बीच औसत मान के साथ दोपहर 12 बजे से मध्यमान मूल्य की तुलना करके। और फिर 6 से शाम 6 बजे के बीच के माध्य मान के साथ शाम 6 से शाम 6 बजे के बीच की तुलना करें।

या यदि आपके पास पर्याप्त डेटा है, तो आप अवधि की तुलना छोटे (जैसे, प्रति घंटा) सेगमेंट में कर सकते हैं और कई तुलनाओं के लिए सही करते हुए, प्रत्येक सेगमेंट के प्रत्येक सेगमेंट के बीच एक टी- सेस्ट कर सकते हैं।

वैकल्पिक रूप से, एक अधिक "निरंतर" विश्लेषण के लिए (यानी, मनमाना विभाजन के बिना), आप अपने दिशात्मक चर (सही अवधि के साथ) के साइन और कोसाइन कार्यों के खिलाफ रैखिक प्रतिगमन चला सकते हैं, जो आपके डेटा को स्वचालित रूप से "परिपत्र" करेगा।

x=sin(x2π/period)
x=cos(x2π/period)

a

x=sin((x+a)2π/period)

a

yxx

किसी भी मामले में, मुझे लगता है कि आपको अवधि के संबंध में कुछ धारणाएं बनानी चाहिए, और फिर उसके अनुसार परीक्षण करना चाहिए।


केल्विन, आपके द्वारा बताए गए परिपत्र डेटा को "ब्रेकिंग" कर रहा है कि मैं मॉड्यूलर ऑर्डर के बारे में उठाए गए मुद्दे को ठीक से अनदेखा करता हूं।
एलेक्सिस

क्या आपने मेरे उत्तर के उत्तरार्ध को पढ़ा, जिसमें कई प्रतिगमन द्वारा निरंतर विश्लेषण का वर्णन है?
केल्विन

आप साइन और कोसाइन के बारे में सही हैं। यह मेरे उत्तर में आगे समझाया गया है और 2006 के पेपर में यह हवाला देता है और आगे के संदर्भों में जो बताता है।
निक कॉक्स

@ निक - मैंने आपका जवाब नहीं देखा था जैसा कि आपने मेरे पिछले एडिट के बाद पोस्ट किया था, लेकिन अच्छा है कि हम स्वतंत्र रूप से उसी उत्तर में आए जैसे कि मैं अभी रचनात्मक हो रहा था (लगभग ज़ोर से सोच रहा था) और वास्तव में ऐसा पहले कभी नहीं देखा था।
केल्विन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.