अगर मेरे पास कई सकारात्मक, महत्वहीन परिणाम हैं, तो क्या मैं कम से कम परीक्षण कर सकता हूं


9

मान लीजिए कि मैंने एक ही प्रतिगमन को 100 अलग-अलग व्यक्तियों के लिए अलग-अलग चलाया है। मेरी रुचि के गुणांक सकारात्मक हैं (और एक दूसरे से काफी अलग हैं) लेकिन सभी 100 परिणामों में सांख्यिकीय रूप से महत्वहीन हैं (प्रत्येक पी-मूल्य = 0.11 कहते हैं)।

क्या पी = 0.11 से अधिक महत्व के साथ "इन परिणामों के कम से कम 80 सकारात्मक हैं" निष्कर्ष निकालने के लिए इन पी-मूल्यों को संयोजित करने का एक तरीका है? मेरी ऑनलाइन खोजों ने मुझे केवल दिखाया है कि फिशर या इसी तरह के परीक्षण के माध्यम से "इन परिणामों में से कम से कम 1 सकारात्मक है", लेकिन मैं उस परिणाम को सामान्य नहीं कर पाया। मैं "H0 = सभी 100 प्रभाव का परीक्षण करना चाहता हूं" 0 पर "HA = कम से कम 80 प्रभाव सकारात्मक हैं।"

मेरा लक्ष्य यह नहीं कहना है कि औसत पर एक सकारात्मक गुणांक है, और न ही यह विशेष रूप से गुणांक को मापने के लिए है। मेरा लक्ष्य, महत्व के साथ यह प्रदर्शित करना है कि कम से कम 80 लोगों ने व्यक्तिगत रूप से कुछ सकारात्मक प्रभाव का सामना किया, जिनमें से 80 की परवाह किए बिना और प्रत्येक व्यक्ति द्वारा महसूस किए गए प्रभाव की भयावहता की परवाह किए बिना।


2
"100 व्यक्तियों के लिए एक ही प्रतिगमन को अलग से चलाने" से आपके कहने का क्या मतलब है? - क्या इसका मतलब है कि आपके पास 100 डेटासेट हैं, प्रत्येक प्रतिक्रिया चर और व्याख्यात्मक चर के एक ही सेट पर कई टिप्पणियों के साथ है? सुनिश्चित नहीं है कि यह कैसे काम करता है जैसे यदि आप व्यक्तियों की ऊंचाई और वजन की तुलना करने में रुचि रखते हैं, तो आपके पास प्रत्येक व्यक्ति के लिए केवल एक अवलोकन है ताकि एक प्रतिगमन कैसे फिट हो? क्या आपके पास शायद प्रत्येक व्यक्ति के लिए एक समय श्रृंखला है - जिस स्थिति में आपको और अधिक परिष्कृत तकनीकों की आवश्यकता है। यदि आप खोज शब्द खोज रहे हैं तो यह अनुदैर्ध्य विश्लेषण का एक रूप होगा।
पीटर एलिस

जवाबों:


8

आपको सभी 100 विश्लेषणों को एकल मिश्रित प्रभाव वाले मॉडल के रूप में करना चाहिए, अपने गुणांक के साथ यादृच्छिक यादृच्छिक स्वयं। इस तरह आप उन गुणांकों के वितरण का अनुमान लगा सकते हैं, जिनमें उनके समग्र अर्थ भी शामिल हैं, जो आपको उस तरह की व्याख्या देंगे, जो मुझे लगता है कि आप खोज रहे हैं।

यह देखते हुए कि, जैसा कि मुझे संदेह है कि मामला है, आपके पास प्रत्येक व्यक्ति के लिए एक समय श्रृंखला है, आपको अवशिष्टों के स्वतःसंक्रमण के लिए भी सही करने की आवश्यकता होगी।


आपके समय के लिए धन्यवाद, बहुत सराहना की। अगर मैं स्पष्ट कर सकता हूं, तो यह एक समय श्रृंखला है। कहते हैं कि मेरे पास 5 वर्षों में सभी 100 व्यक्तियों के लिए डेटा है, और तीसरे वर्ष में सभी 100 व्यक्तियों के लिए एक ही समय में एक डमी चर (स्वतंत्र रूप से मुझे दिलचस्पी है) 1 में बदल जाता है। मैं प्रत्येक व्यक्ति पर उस परिवर्तन के सटीक प्रभाव या औसत प्रभाव की परवाह नहीं करता। बल्कि, मैं केवल यह स्थापित करना चाहता हूं कि कम से कम 80 लोग प्रत्येक प्रभावित थे। गुणांक सभी 100 पर सकारात्मक है, लेकिन प्रत्येक महत्वहीन है। मुझे यकीन नहीं है कि गुणांक के वितरण को मापने से यह पूरा हो जाएगा।
user28239

1
यही मैंने अनुमान लगाया है कि आपके पास था। मुझे लगता है कि मेरा अनुशंसित दृष्टिकोण सही है। फिर आप मॉडल का उपयोग भविष्यवाणियों या किसी अन्य व्याख्यात्मक चीज़ को करने के लिए कर सकते हैं जो आप चाहते हैं।
पीटर एलिस

4

सबसे सरल बात शायद साइन टेस्ट होगी। अशक्त परिकल्पना यह है कि प्रत्येक परिणाम में सकारात्मक या नकारात्मक होने की समान संभावना होती है (जैसे कि एक उचित सिक्का फ़्लिप करना)। आपका लक्ष्य यह निर्धारित करना है कि क्या इस शून्य परिकल्पना के तहत अवलोकन किए गए परिणाम पर्याप्त संभावना नहीं होंगे कि आप इसे अस्वीकार कर सकते हैं।

एक निष्पक्ष सिक्के के 100 फ़्लिप में से 80 या अधिक सिर प्राप्त करने की संभावना क्या है? आप द्विपद वितरण का उपयोग करके इसकी गणना कर सकते हैं। में R, संबंधित फ़ंक्शन को कहा जाता है pbinom, और आप कोड की निम्न पंक्ति का उपयोग करके एक (एक तरफा) पी-मूल्य प्राप्त कर सकते हैं:

pbinom(80, size = 100, prob = 0.5, lower.tail = FALSE)

इस परीक्षण के अनुसार, आपका अंतर्ज्ञान सही है, यदि आप उपचार का कोई प्रभाव नहीं डालते हैं, तो आपको 80 सकारात्मक परिणाम प्राप्त होने की संभावना नहीं है।

एक निकट संबंधी विकल्प विलकॉक्सन हस्ताक्षरित रैंक परीक्षण जैसे कुछ का उपयोग करना होगा ।


एक बेहतर दृष्टिकोण, यदि आप वास्तव में प्रभाव के आकार का अनुमान लगाना चाहते हैं (केवल यह निर्धारित करने के बजाय कि यह शून्य से अधिक है या नहीं), तो शायद एक पदानुक्रमित ("मिश्रित") मॉडल होगा।

यहां, मॉडल कहता है कि आपके 100 व्यक्तियों के परिणाम एक वितरण से आते हैं, और आपका लक्ष्य यह देखना है कि उस वितरण का मतलब (विश्वास अंतराल के साथ) कहां है।

मिश्रित मॉडल आपको अपने प्रभाव आकारों के बारे में कुछ और बताते हैं: मॉडल को फिट करने के बाद, आप कुछ ऐसा कह सकते हैं "हम अनुमान लगाते हैं कि हमारा उपचार औसत तीन इकाइयों द्वारा परिणामों में सुधार करता है, हालांकि डेटा वास्तविक औसत के अनुरूप है। प्रभाव का आकार 1.5 से 4.5 यूनिट तक कहीं भी हो सकता है। इसके अलावा, व्यक्तियों में कुछ भिन्नता है, इसलिए किसी दिए गए व्यक्ति को कहीं भी -0.5 से +6.5 यूनिट तक प्रभाव दिखाई दे सकता है।

यह बयानों का एक बहुत ही सटीक और उपयोगी सेट है - बहुत बेहतर है "प्रभाव संभवतः सकारात्मक है, औसतन", यही कारण है कि यह दृष्टिकोण सांख्यिकीविदों का पक्षधर है। लेकिन अगर आपको उस सभी विवरण की आवश्यकता नहीं है, तो मैंने जो पहला दृष्टिकोण बताया है वह ठीक भी हो सकता है।


0

हो सकता है कि मुझे वह पूरी तरह से गलत लगे, लेकिन मुझे जो लगता है, वह यह है कि आप बार-बार एनोवा को करने की कोशिश कर रहे हैं। बस इस "डमी" को एक विषय-कारक के रूप में परिभाषित करें, और मॉडल बाकी काम करेगा। महत्व स्वयं बहुत जानकारीपूर्ण नहीं है; यह आवश्यक है लेकिन पर्याप्त नहीं है; किसी भी मॉडल को पर्याप्त संख्या में टिप्पणियों के साथ महत्वपूर्ण मिलेगा। आप प्रभाव आकार प्राप्त कर सकते हैं, जैसे (आंशिक) एटा-स्क्वेर, यह अनुमान लगाने के लिए कि आपका प्रभाव कितना "बड़ा" है। मेरे 2 सेंट।


0

यह एक साधारण ANCOVA गणना जितना आसान हो सकता है, लेकिन आपके डेटा का विश्लेषण करने का उपयुक्त तरीका भौतिक स्थिति पर निर्भर करेगा और आपने इन विवरणों की आपूर्ति नहीं की है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.