मैं 2 साधनों की तुलना कैसे कर सकता हूं जो लाप्लास वितरित हैं?


10

मैं 1-मिनट-स्टॉक रिटर्न के लिए 2 नमूना साधनों की तुलना करना चाहता हूं। मुझे लगता है कि वे लाप्लास वितरित (पहले से ही जांचे गए) हैं और मैंने रिटर्न को 2 समूहों में विभाजित किया है। मैं कैसे जांच सकता हूं कि क्या वे काफी भिन्न हैं?

मुझे लगता है कि मैं उन्हें एक सामान्य वितरण की तरह व्यवहार नहीं कर सकता, क्योंकि भले ही वे 300 से अधिक मूल्य हैं, क्यूक्यू-प्लॉट से पता चलता है कि एक सामान्य वितरण में बहुत बड़ा अंतर है


कोड / पैकेज के लिए पूछना यहाँ विषय से परे है, लेकिन आपके पास यहाँ दफन एक वास्तविक सांख्यिकीय प्रश्न है। आप अंतर्निहित सांख्यिकीय समस्या को स्पष्ट करने के लिए अपने प्रश्न को संपादित करना चाह सकते हैं। आप पा सकते हैं कि जब आप शामिल सांख्यिकीय अवधारणाओं को समझते हैं, तो सॉफ़्टवेयर-विशिष्ट तत्व स्वयं स्पष्ट हैं या कम से कम प्रलेखन से प्राप्त करना आसान है।
गंग - मोनिका

जब आप कहते हैं कि "भिन्न" क्या आप केवल साधनों के अंतर में रुचि रखते हैं , और यदि ऐसा है, तो क्या आप मान रहे हैं कि स्प्रेड समान हैं?
Glen_b -Reinstate मोनिका

हां, मैं यह जानना चाहता हूं कि क्या साधन काफी भिन्न हैं और मुझे लगता है कि वितरण समान है। मैं nessecaraly भी मानक विचलन मान नहीं समान होना है, लेकिन मुझे लगता है कि ठीक हो जाएगा
रोब

2
कृपया 1-मिनट-स्टॉक रिटर्न के बारे में अधिक जानकारी प्रदान करें। क्या आप अस्थायी रूप से सहसंबद्ध डेटा के साधनों की तुलना करना चाहते हैं?
माइकल एम

2
ध्यान दें कि आपके द्वारा जांचे जाने वाले मानों की संख्या वितरण को नहीं बदलती है; आप नमूना साधनों के वितरण के बारे में सोच रहे होंगे , जो एक लैपल्स के लिए पर सामान्य के बहुत करीब होगा। n=300
Glen_b -Reinstate मोनिका

जवाबों:


12

मान लें कि दोनों लैपलेस डिस्ट्रीब्यूशन का एक ही प्रकार है,

क) संभावना अनुपात परीक्षण में एक परीक्षण आँकड़ा शामिल होगा:

एल=Πमैं=1n12τ^exp(-|एक्समैं-μ^|τ^)Πमैं=1n112τ^1exp(-|एक्समैं-μ^1|τ^1)Πमैं=n1+1n12τ^2exp(-|एक्समैं-μ^2|τ^2)

लॉग लेना, रद्द करना / सरलीकृत करना और गुणा करना ।-2

-2एल=2(nलॉग(τ^)-n1लॉग(τ^1)-n2लॉग(τ^2)) (जहां )एल=लॉग(एल)

जहाँ , संयुक्त नमूने में माध्यिका से औसत निरपेक्ष विचलन और , नमूना में माध्यिका से निरपेक्ष विचलन । τ मैं=मीटरमैंमैंτ^=τ^मैं=मैंमैं

विल्क्स के प्रमेय के अनुसार, यह असमान रूप से null के तहत के रूप में वितरित किया जाता है , इसलिए 5% परीक्षण के लिए यदि आप अधिक हो तो आप अस्वीकार कर देंगे । 3.84χ123.84

सिमुलेशन प्रयोगों से पता चलता है कि परीक्षण छोटे नमूने के आकार में एंटीकॉन्सेर्वेटिव है (अस्वीकार करने की संभावना नाममात्र की तुलना में कुछ अधिक है), लेकिन लगभग n = 100 तक, यह कम से कम उचित लगता है (आप 5.3% के ऑर्डर पर प्राप्त करते हैं: 5.4%) नाममात्र 5% परीक्षण के लिए नल के तहत अस्वीकृति दर, उदाहरण के लिए ; यह 5.25% के करीब लगता है)।n1,n2>300

b) हम यह भी उम्मीद करेंगे कि एक अच्छा परीक्षण आँकड़ा होगा (जहाँ प्रतिनिधित्व करता है नमूना माध्यिका और ); अगर मैंने वहां कोई त्रुटि नहीं की है, तो आपके जैसे बड़े नमूनों में यह लगभग 0 और वैरिएंट 1 के साथ शून्य के तहत वितरित किया जाएगा, जहां वर्ग के आधार पर हो सकता है संयुक्त नमूने में माध्य से पूर्ण विचलन का मतलब है, , हालांकि मुझे उम्मीद है कि यह दो नमूना के नमूना-भारित औसत पर बेहतर तरीके से काम करने की प्रवृत्ति को । ~μv=2τ2(1μ~1-μ~2vμ~ τ 2मीटर2मीटर 2 मैंv=2τ^2(1n1+1n2)τ^22मैं2

(संपादित करें: सिमुलेशन बताता है कि सामान्य सन्निकटन ठीक है, लेकिन विचरण गणना ऊपर सही नहीं है; मैं देख सकता हूं कि समस्या अभी क्या है, लेकिन मुझे अभी भी इसे ठीक करना है। इस परीक्षण का क्रमपरिवर्तन संस्करण (आइटम देखें) (c) अभी भी ठीक होना चाहिए)।

ग) एक अन्य विकल्प उपरोक्त आंकड़ों में से किसी एक के आधार पर क्रमपरिवर्तन परीक्षण करना होगा। ( यहां दिए गए उत्तरों में से एक यह भी बताता है कि मध्यस्थों में अंतर के लिए क्रमपरिवर्तन परीक्षण को कैसे लागू किया जाए।)

डी) आप हमेशा एक विलकॉक्सन / मान-व्हिटनी परीक्षण कर सकते हैं; यह लाप्लास में टी-टेस्ट का उपयोग करने की तुलना में काफी अधिक कुशल होगा।

ई) लाप्लास डेटा के लिए (डी) से बेहतर मूड का औसत परीक्षण होगा; अक्सर किताबों के खिलाफ सिफारिश की जाती है, जब लाप्लास डेटा के साथ काम करते हुए यह अच्छी शक्ति दिखाएगा। मुझे उम्मीद है कि यह मध्यस्थों में अंतर के स्पर्शोन्मुख परीक्षण के क्रमपरिवर्तन संस्करण के समान शक्ति होगी ((सी) में उल्लिखित परीक्षणों में से एक)।

यहां प्रश्न एक आर कार्यान्वयन देता है जो फिशर टेस्ट का उपयोग करता है, लेकिन उस कोड को इसके बजाय ची-स्क्वायर टेस्ट का उपयोग करने के लिए अनुकूलित किया जा सकता है (जो मैं यहां तक ​​कि मध्यम नमूनों में भी सुझाव दूंगा); वैकल्पिक रूप से इसके लिए उदाहरण कोड (नहीं एक समारोह के रूप में) है यहाँ

माध्यिका परीक्षण की चर्चा यहां विकिपीडिया में की गई है , हालाँकि बहुत गहराई में नहीं (लिंक किए गए जर्मन अनुवाद में थोड़ी और जानकारी है)। नॉनपरमेट्रिक्स पर कुछ किताबें इसकी चर्चा करती हैं।


बहुत धन्यवाद! क्या मैं आपके द्वारा उपयोग किए गए परीक्षण सांख्यिकीय का उपयोग कर सकता हूं और इसे अस्वीकार कर सकता हूं, अगर मतलब के लिए लाप्लास क्वांटाइल = 0 और मानक विचलन = 1 से अधिक है जैसे मैं सामान्य वितरण परीक्षण के साथ करूंगा?
रोब

मुझे क्षमा करें, वास्तव में मुझे नहीं पता कि आप वहां क्या पूछ रहे हैं, इसलिए आपको विस्तार से समझाने की आवश्यकता होगी कि इसका क्या मतलब है। आप किस टेस्ट स्टेटिस्टिक की बात कर रहे हैं? [आपको (a), (c) या (d) में बताए गए परीक्षणों से चिपके रहना चाहिए, क्योंकि दूसरे में मेरे परिकलित विचरण के साथ कुछ गड़बड़ है, asymptotic एक लेबल (b), जैसा कि मेरे "a" " के साथ चिह्नित किया गया है। स्पष्ट रूप से बताता है। मुझे अभी भी उस मामले को ठीक करना है लेकिन मैं इसे जल्दी से ठीक नहीं कर सकता ..
Glen_b -Reinstate Monica

@Glen_b। उपयोगी उत्तर धन्यवाद (+1) लेकिन अशक्त मॉडल में 2 पैरामीटर ( और ) हैं जबकि विकल्प 4 है। तो यह होना चाहिए ? (हालांकि छोटे-मध्यम नमूना आकार के मामले के लिए मैं देख रहा हूं कि मैं वैसे भी सिमुलेशन द्वारा मूल्यों को τ χ 2 2μ^τ^χ22
सारणीबद्ध कर

या हो सकता है कि आपने वैकल्पिक मॉडल में पैमाने के लिए एक अनुमान लगाया हो?
P.Windridge

@ P.Windridge यह एक उत्कृष्ट बिंदु है। हां, जैसा कि मेरे पास बीजगणितीय अभिव्यक्ति है जो शून्य से विकल्प तक जाने में 2 मुक्त मापदंडों की कमी है (लेकिन वास्तव में मैं उसी पैमाने को संभालने के बारे में सोच रहा था जब मैंने लिखा था )। मुझे यह तय करने की आवश्यकता है कि यह सब सुसंगत है (और जब मैं इस पर हूं तो मुझे इसे ठीक करने के लिए फिर से काम करना चाहिए, जो भी अन्य मुद्दा था जिसे मैंने संपादित किया था)χ12
Glen_b -Reate Monica
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.