दो पैरामीटर्स के लिए पॉइसन हाइपोथिसिस परीक्षण


9

इसलिए, मनोरंजन के लिए, मैं जिस कॉल सेंटर पर काम करता हूं, वहां से कॉल के कुछ डेटा ले रहा हूं और उन पर कुछ परिकल्पना परीक्षण करने की कोशिश कर रहा हूं, विशेष रूप से एक सप्ताह में प्राप्त कॉल की संख्या, और इसे फिट करने के लिए एक पॉइसन वितरण का उपयोग कर रहा हूं। मेरी नौकरी के विषय के कारण, दो प्रकार के सप्ताह हैं, चलो उनमें से एक को सप्ताह में बुलाते हैं जहां मैं परिकल्पना करता हूं वहां अधिक कॉल होते हैं, और ऑफ-सप्ताह में जहां मैं परिकल्पना करता हूं वहां कम हैं।

मेरा एक सिद्धांत है कि ऑन-हफ़्ते से (चलो इसे ) ऑफ-हफ़्ते में से एक की तुलना में बड़ा है (चलो इसे )λλ1λ2

इसलिए मैं जिस परिकल्पना का परीक्षण करना चाहता हूं वह हैH0:λ1>λ2,H1:λ1λ2

मुझे पता है कि एक पैरामीटर के लिए परीक्षण कैसे करें ( ) का परीक्षण करें लेकिन इतना निश्चित नहीं है कि 2 डेटा सेट दिए जाने के बारे में कैसे जाना जाए। मान लें कि मैं प्रत्येक एक से दो सप्ताह का डेटा प्रत्येक सप्ताह के लिए और ऑफ-सप्ताह के लिए और और ऑन-सप्ताह के लिए। क्या कोई मुझे चलने में मदद कर सकता है हालांकि यह सरल संस्करण ऐसा है कि मैं इसे बड़े डेटा सेट पर लागू कर सकता हूं? किसी भी मदद की सराहना की है, धन्यवाद।H0:λ1>1,H1:λ11X1=2X2=3Y1=2Y2=6


3
क्या वास्तव में कॉलिस वितरित किए गए हैं? यदि कई कॉल हैं तो वे लगभग सामान्य के रूप में मॉडलिंग कर सकते हैं। लेकिन यह मज़ा को मार सकता है।
RegressForward

1
खैर क्या यह निर्धारित करता है कि आप इसे सही कैसे फ्रेम करते हैं? मुझे आयु इकाई समय सीमा में असतत कॉल की x संख्या प्राप्त हो रही है। मैं इसे एक सामान्य वितरण सुनिश्चित के रूप में कर सकता था, लेकिन वह पूरी बात यह है कि मैं इसे पॉइसन के साथ आज़माना चाहूंगा क्योंकि यह फिट बैठता है।
जेम्स स्नाइडर

यदि आप मानते हैं कि काउंट्स पॉइसन हैं तो आप केवल काउंट्स जोड़ सकते हैं (यदि मैं गलत हूं तो मुझे सही करें)। वह यह है कि आपको X = 2 + 3 और Y = 2 + 6 मिलेगा। फिर आप एक अंतर का उपयोग करके परीक्षण कर सकते हैं, उदाहरण के लिए, R में isspoisson.test R। यदि आप एक बायेसियन विश्लेषण पर जाना चाहते हैं तो मेरे पास उस पर एक ब्लॉग पोस्ट भी है: sumsar.net/blog/2014/ 09 /
बेयसियन

जवाबों:


4

ध्यान दें कि सामान्य रूप से समानता शून्य (अच्छे कारण के साथ) में जाती है।

एक तरफ यह मुद्दा है, मैं इस तरह की परिकल्पना के परीक्षण के लिए कुछ दृष्टिकोणों का उल्लेख करूंगा

  1. एक बहुत ही सरल परीक्षण: कुल देखे गए गणना पर स्थिति , जो इसे अनुपात के द्विपद परीक्षण में परिवर्तित करती है। कल्पना करें कि सप्ताह और ऑफ- और सप्ताह संयुक्त हैं।nwonwoffw

फिर शून्य के तहत, अपेक्षित अनुपात और हैं। आप अनुपात पर एक-पुच्छ परीक्षण सप्ताह में काफी आसानी से कर सकते हैं।wonwwoffw

  1. आप एक संभावना-अनुपात परीक्षण से संबंधित सांख्यिकीय को अपनाकर एक पूंछित परीक्षा का निर्माण कर सकते हैं; Wald-परीक्षण या एक स्कोर परीक्षण के z के रूप किया एक उदाहरण के लिए पूंछ हो सकता है और बड़ा सा के लिए अच्छी तरह से काम करना चाहिए ।λ

इस पर अन्य टेक हैं।


1

क्या सिर्फ Poisson त्रुटि संरचना और लॉग-लिंक के साथ GLM का उपयोग किया जाता है ??? लेकिन द्विपद के बारे में विचार अधिक शक्तिशाली हो सकता है।


वर्तमान में, यह एक जवाब की तुलना में अधिक टिप्पणी है। क्या आपने इसे एक टिप्पणी, स्पष्टीकरण के लिए एक प्रश्न या एक उत्तर के रूप में बताया था? यदि उत्तरार्द्ध, तो क्या आप इसे उत्तर के अधिक विस्तार में ले सकते हैं? हम इसे आपके लिए एक टिप्पणी में भी बदल सकते हैं।
गूँग - मोनिका

1

मैं इसे प्यासी या क्वैसी-पॉइसन GLM के साथ क्वैसी-पोइसन या नकारात्मक द्विपद के लिए प्राथमिकता के साथ निपटाऊंगा।

पारंपरिक पोइसन का उपयोग करने में समस्या यह है कि इसमें विचरण की आवश्यकता होती है और इसका मतलब बराबर होता है जो कि बहुत संभव नहीं है। अर्ध-पॉइसन या एनबी अनुमान से अप्रतिबंधित विचरण का अनुमान लगाता है।

आप इनमें से कोई भी R में बहुत आसानी से कर सकते हैं।

# week on = 1, week off = 0
week.status <- c(1, 1, 0, 0)
calls <- c(2, 6, 2, 3)
model <- glm(calls ~ week.status, family = poisson())
# or change the poisson() after family to quasipoisson() 
# or use the neg binomial glm from the MASS package

जीएलएम दृष्टिकोण फायदेमंद है और जैसा कि आप अतिरिक्त चर (जैसे, वर्ष का महीना) को शामिल करने के लिए विस्तार कर सकते हैं जो कॉल वॉल्यूम को प्रभावित कर सकते हैं।

हाथ से करने के लिए, मैं शायद एक सामान्य सन्निकटन और एक दो नमूना टी परीक्षण का उपयोग करूँगा।


1

हम पोइसन पैरामीटर के लिए अधिकतम संभावना अनुमान के साथ शुरू करते हैं, जिसका मतलब है।

तो,λ^1=Y¯  and  λ^2=X¯

अब, आप केवलY¯X¯N(λ1λ2,λ1n1+λ2n2)

और फिर Z-Value =(Y¯X¯)λ1λ2λ1n1+λ2n2

नोट: -जेक्शन मानदंडZ<Critical Value


0

Casella की परीक्षण सांख्यिकीय परिकल्पना के पृष्ठ 125 से शुरू करके आपके द्वारा तैयार किए गए प्रश्न के प्रकार का उत्तर दिया गया है। मैंने आपके संदर्भ के लिए पीडीएफ के लिए एक लिंक संलग्न किया है। Casella का सांख्यिकीय सांख्यिकीय परिकल्पना, तीसरा संस्करण


नाइस पॉइंटर, हालांकि लिंक-ओनली-जवाब क्रॉस वैलिडेट पर हतोत्साहित किए जाते हैं। क्या आप अपने उत्तर में संकल्प को स्केच कर सकते हैं? धन्यवाद।
शीआन

क्षमा करें, मुझे उस नियम के बारे में पता नहीं था। मुझे बताने के लिए धन्यवाद। :) जितनी जल्दी हो सके एक व्यापक जवाब देने की कोशिश करेंगे।
नुझी मेयन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.