छोटे


62

में कुछ परीक्षणों के लिए R, के गणना पर कम सीमा है । मुझे यकीन नहीं है कि यह संख्या क्यों है, अगर इसके लिए एक अच्छा कारण है या यदि यह सिर्फ मनमाना है। बहुत सारे अन्य आँकड़े पैकेज में जाते हैं , इसलिए यह बहुत अधिक सटीक स्तर है। लेकिन मैंने बहुत सारे कागजात या रिपोर्टिंग नहीं देखी है ।2.2210160.0001p<2.221016p=2.221016

क्या इस गणना किए गए मूल्य की रिपोर्ट करना एक सामान्य / सर्वोत्तम अभ्यास है या कुछ और (जैसे p < 0.000000000000001) रिपोर्ट करना अधिक विशिष्ट है ?


यदि आपको ऐसे छोटे पी-मूल्य मिलते हैं और वास्तविक पी-मूल्य की गणना करना चाहते हैं, तो आप इस फ़ंक्शन का उपयोग एक्सेल = टीडीआईएसटी (टी, डीएफ, 2) में कर सकते हैं और अपने 'टी' और डीएफ के मूल्यों को जोड़ सकते हैं और आपको वास्तविक मिलेगा पी-वैल्यू टा

7
@ तजबीब कोई कारण है कि एक्सेल अधिक सटीक अनुमान लौटाएगा तो आर ..? जहाँ तक मुझे पता है, यह बहुत कम सटीक है।
टिम

...But I haven't seen too many papers reporting p<2.22⋅10−16....कुछ जीडब्ल्यूएएस के कागजात देखें , सैकड़ों में पैवेल्यू के परिणाम दिखाने वाले कई पेपर हैं, जैसे: प्रोस्टेट कैंसर केएलके क्षेत्र, पी = 9x10 ^ -186।
zx8754

1
व्हिबर का उत्तर यहां भी देखें: आंकड़े.स्टैकएक्सचेंज . com / questions / 11812
अमीबा का कहना है कि 9:56

जवाबों:


87

इसका एक अच्छा कारण है।

मूल्य के माध्यम से पाया जा सकता है noquote(unlist(format(.Machine)))

           double.eps        double.neg.eps           double.xmin 
         2.220446e-16          1.110223e-16         2.225074e-308 
          double.xmax           double.base         double.digits 
        1.797693e+308                     2                    53 
      double.rounding          double.guard     double.ulp.digits 
                    5                     0                   -52 
double.neg.ulp.digits       double.exponent        double.min.exp 
                  -53                    11                 -1022 
       double.max.exp           integer.max           sizeof.long 
                 1024            2147483647                     4 
      sizeof.longlong     sizeof.longdouble        sizeof.pointer 
                    8                    12                     4 

यदि आप सहायता देखते हैं, ( ?".Machine"):

double.eps  

the smallest positive floating-point number x such that 1 + x != 1. It equals 
double.base ^ ulp.digits if either double.base is 2 or double.rounding is 0; 
otherwise, it is (double.base ^ double.ulp.digits) / 2. Normally 2.220446e-16.

यह अनिवार्य रूप से एक मूल्य है जिसके नीचे आप काफी आश्वस्त हो सकते हैं कि मूल्य बहुत संख्यात्मक रूप से निरर्थक होगा - इसमें किसी भी छोटे मूल्य की गणना करने के प्रयास के मूल्य की सटीक गणना होने की संभावना नहीं है। (थोड़ा संख्यात्मक विश्लेषण का अध्ययन करने के बाद, विशिष्ट प्रक्रिया द्वारा क्या संगणनाएं की जाती हैं, इस पर निर्भर करता है कि एक अच्छा मौका संख्यात्मक अर्थहीनता से ऊपर आता है।)

लेकिन सांख्यिकीय अर्थ बहुत पहले खो गए होंगे। ध्यान दें कि पी-मान मान्यताओं पर निर्भर करते हैं, और चरम पूंछ में आगे निकलकर आप अधिक भारी पी-वैल्यू पर जाते हैं (नाममात्र मूल्य की हम गणना करते हैं) गलत धारणाओं से प्रभावित होंगे, कुछ मामलों में भी जब वे 'थोड़ा ही गलत है। चूँकि धारणाएँ बिलकुल संतुष्ट नहीं होने वाली हैं, इसलिए पी-वैल्यू की नकल करना काफी हद तक सही हो सकता है (सापेक्ष सटीकता के संदर्भ में, शायद केवल मामूली अंश से बाहर), लेकिन बहुत छोटे पी-वैल्यू कई आदेशों द्वारा बाहर हो सकते हैं परिमाण।

यह कहना है कि सामान्य अभ्यास (कुछ ऐसा "<0.0001" जो आप कहते हैं कि पैकेजों में आम है, या APA नियम है कि जाप ने अपने उत्तर में उल्लेख किया है) संभवत: समझदार अभ्यास से दूर नहीं है, लेकिन किन चीजों पर अनुमानित बिंदु ' यह बहुत छोटा है ' कहने से परे अर्थ खोना निश्चित रूप से परिस्थितियों के आधार पर काफी भिन्न होता है।

यह एक कारण है कि मैं एक सामान्य नियम का सुझाव क्यों नहीं दे सकता - एक भी नियम नहीं हो सकता है जो सभी परिस्थितियों में हर किसी के लिए दूर से उपयुक्त हो - परिस्थितियों को थोड़ा बदल दें और व्यापक ग्रे लाइन को कुछ हद तक सार्थक से बदलाव को चिह्नित करें। निरर्थक बदल जाएगा, कभी-कभी लंबे रास्ते से।

आप (जैसे कि यह एक प्रतिगमन है, के साथ सटीक परिस्थितियों के बारे में पर्याप्त जानकारी निर्दिष्ट करने के लिए थे, तो यह बहुत nonlinearity, कि यह स्वतंत्र चर में परिवर्तन की राशि, इस तरह की और त्रुटि अवधि में निर्भरता की राशि, कि किस तरह और heteroskedasticity की राशि, त्रुटि वितरण का यह आकार), मैं नाममात्र पी-मूल्यों के साथ तुलना करने के लिए आपके लिए 'सही' पी-मूल्यों का अनुकरण कर सकता हूं, इसलिए आप देख सकते हैं कि जब वे किसी भी अर्थ को ले जाने के लिए नाममात्र मूल्य के लिए बहुत अलग थे।

लेकिन यह हमें दूसरे कारण की ओर ले जाता है - भले ही आपने सच्चे पी-मूल्यों को अनुकरण करने के लिए पर्याप्त जानकारी निर्दिष्ट की हो - मैं अभी भी जिम्मेदारी से उन परिस्थितियों के लिए कट-ऑफ नहीं बता सकता।

p106

105104103

उनकी प्राथमिकता के कार्यों और नियमों के ज्ञान के अभाव में, और अपनी स्वयं की उपयोगिताओं के ज्ञान की अनुपस्थिति में, मैं जिम्मेदारी से किसी भी सामान्य विकल्प का सुझाव कैसे देता हूं?

मैं कम से कम आपको उन चीजों के प्रकार बता सकता हूं जो मैं करता हूं (और मेरा सुझाव है कि यह आपके लिए एक अच्छा विकल्प नहीं है):

106105104

यह निश्चित रूप से एक विकल्प को सूचित करने में सहायक है - लेकिन मैं अनुकरण के परिणामों पर चर्चा करने की संभावना रखता हूं क्योंकि उन्हें कट-ऑफ-वैल्यू चुनने के लिए उपयोग करना है, जिससे दूसरों को अपना खुद का चयन करने का मौका मिलता है।

सिमुलेशन का एक विकल्प कुछ प्रक्रियाओं को देखना है जो धारणा के विभिन्न संभावित विफलताओं के लिए अधिक मजबूत हैं * और देखें कि पी-मूल्य में कितना अंतर हो सकता है। उनके पी-वैल्यू भी विशेष रूप से सार्थक नहीं होंगे, लेकिन वे कम से कम कुछ समझ देते हैं कि इसका कितना प्रभाव हो सकता है। यदि कुछ नाममात्र से बहुत अलग हैं, तो यह एक विचार के बारे में भी बताता है जो प्रभाव के प्रभाव की जांच करने के लिए मान्यताओं का उल्लंघन करता है। यहां तक ​​कि अगर आप उन विकल्पों में से किसी को भी रिपोर्ट नहीं करते हैं, तो यह एक बेहतर तस्वीर देता है कि आपका छोटा पी-मूल्य कितना सार्थक है।

* ध्यान दें कि यहां हमें वास्तव में ऐसी प्रक्रियाओं की आवश्यकता नहीं है जो कुछ धारणा के सकल उल्लंघन के लिए मजबूत हैं; जो लोग प्रासंगिक धारणा के अपेक्षाकृत हल्के विचलन से कम प्रभावित होते हैं उन्हें इस अभ्यास के लिए ठीक होना चाहिए।

मैं कहूंगा कि जब / यदि आप इस तरह के सिमुलेशन करने के लिए आते हैं, यहां तक ​​कि काफी हल्के उल्लंघनों के साथ, कुछ मामलों में यह आश्चर्यचकित हो सकता है कि कितनी दूर भी नहीं है-छोटे-पी-मान गलत हो सकते हैं। जिस तरह से मैंने व्यक्तिगत रूप से पी-मूल्य की व्याख्या करने के तरीके को बदलने के लिए अधिक किया है उससे अधिक विशिष्ट कट-ऑफ को स्थानांतरित कर दिया है जो मैं उपयोग कर सकता हूं।

एक पत्रिका के लिए वास्तविक परिकल्पना परीक्षण के परिणाम प्रस्तुत करते समय, मैं यह पता लगाने की कोशिश करता हूं कि क्या उनके पास कोई नियम है। यदि वे नहीं करते हैं, तो मैं खुद को खुश करता हूं, और फिर रेफरी को शिकायत करने की प्रतीक्षा करता हूं।


11
मैं विशेष रूप से सांख्यिकीय अर्थ पर टिप्पणी पसंद करता हूं जो बहुत पहले खो गया था।
us --r11852

बहुत बढ़िया जवाब! मैं इस पर सभी विवरण की सराहना करता हूं, यह स्पष्ट करता है कि आर यह संख्या क्यों देता है। लेकिन यह वास्तव में इस सवाल का जवाब नहीं देता है कि क्या रिपोर्ट करना है।
पॉल

1
मैंने महसूस किया कि मैंने इस मुद्दे को संबोधित किया था, इस अर्थ में कि मैंने बताया कि क्यों यह एक विशिष्ट सुझाव देने के लिए जिम्मेदार नहीं था। ध्यान दें कि मैं इस बात पर चर्चा करता हूं कि कुछ संकुल में "प्रथा 0.0001" जैसा क्यों है? कुछ कारणों से मैं एक विशिष्ट संख्या का सुझाव नहीं देता - जिनमें से पहला मैंने दिया था। मैं उस कारण पर विस्तार करूंगा और एक संपादन में दूसरा।
Glen_b

पॉल, मैंने कुछ और महत्वपूर्ण चर्चा जोड़ी है।
Glen_b

2
हां, आपको कुछ करने की जरूरत है; मेरी अधिक व्यापक टिप्पणी का मुद्दा यह था कि मैं आपको बता नहीं सकता कि आपको क्या करना चाहिए, मैं केवल उन मुद्दों पर चर्चा कर सकता हूं जो आपकी पसंद में आते हैं। मुझे आशा है कि मैंने ऐसा किया है, लेकिन मैं आगे किसी भी मुद्दे को स्पष्ट करने की कोशिश करने में खुश हूं अगर मैं कर सकता हूं।
Glen_b

27

सामान्य अभ्यास आपके शोध के क्षेत्र पर निर्भर हो सकता है। अमेरिकन साइकोलॉजिकल एसोसिएशन (एपीए) का मैनुअल, जो सबसे अधिक इस्तेमाल की जाने वाली प्रशस्ति पत्र शैलियों में से एक है, राज्यों (पृष्ठ 139, 6 वें संस्करण):

P <0.001 से छोटे किसी भी मूल्य का उपयोग न करें


8
हालांकि यह वही है जो मैं आमतौर पर (+1) का हवाला देता हूं, मुझे यकीन नहीं है कि पीएनएएस में वैलेन जॉनसन की हाल की सिफारिश को देखते हुए किसी एक दशमलव स्थान पर इस सिफारिश को संशोधित करने की आवश्यकता है या नहीं : "0.005 महत्व का डिफ़ॉल्ट स्तर बनाएं" ...]। P मान के साथ अत्यधिक महत्वपूर्ण परीक्षा परिणाम जोड़ें जो 0.001 से कम हैं। "
हेनरिक

3
अच्छा उत्तर। मेरे क्षेत्र में कोई स्टाइल गाइड और कोई वास्तविक मानक नहीं है, कम से कम पी-वैल्यू के लिए नहीं। मैं अंतःविषय कार्य करता हूं लेकिन मुझे लगता है कि कंप्यूटर विज्ञान और एचसीआई इसके लिए क्षेत्र होगा। मुझे लगता है कि एपीए शैली वह जगह होगी जहां लेखक बारी करेंगे, क्योंकि आमतौर पर संज्ञानात्मक मनोवैज्ञानिक या अन्य क्षेत्रों से उधार लिया जाता है जो एपीए कवर करेगा।
पॉल

10
5σp<106

1
5σzpp0.0001zp

@amoeba हाँ, मुझे लगता है कि तुम सही हो।
Glen_b

14

ऐसे चरम पी-मान बहुत अधिक मात्रा में डेटा वाले क्षेत्रों में अधिक बार होते हैं, जैसे कि जीनोमिक्स और प्रक्रिया निगरानी। उन मामलों में, कभी-कभी इसे -log 10 (पी-मान) के रूप में सूचित किया जाता है । उदाहरण के लिए, प्रकृति का यह आंकड़ा , जहाँ p-मान 1e-26 से नीचे जाते हैं।

-लॉग 10 (पी-वैल्यू) को सांख्यिकीविदों द्वारा "लॉगवर्थ" कहा जाता है जिसे मैं जेएमपी के साथ काम करता हूं।


21
ppp

8
@BenBolker वास्तव में, "एनएसए आपके डेटा के साथ छेड़छाड़" की तुलना में कम संभावित है, यहां तक ​​कि "ए कॉस्मिक किरण आपके डेटा में कई महत्वपूर्ण बिट्स फ़्लिप" जैसी घटनाएं दूर हैं, उन संभावनाओं की तुलना में कहीं अधिक संभावना है।
ग्लेन_ब

6
p<10100ρ0.9n500

8
p=2.2×10226

9
स्लेट स्टार कोडेक्स टिप्पणी अनुभाग में @amoeba ओवर, डैनियल वेल्स ने नोट किया कि विज्ञान। sciencemag.org/content/363/6425/eaau1043 ने पीए का मान 3.6e-2382 ("एक टाइपो, दो हजार नहीं " कहा, डैनियल कहते हैं) ), जो आपके द्वारा काफी अंतर से धड़कता है!
मार्क अमेरी

-3

आर में, "<2e-16" का शाब्दिक अर्थ <2e-16 नहीं है, लेकिन इसके बजाय, इसका मतलब है कि मूल्य इतना छोटा है कि R इसे रिकॉर्ड या प्रदर्शित नहीं कर सकता है।

प्रतिगमन परीक्षण में, मुझे अक्सर 4.940656e-324 के रूप में छोटा होता है, जब यह "<2e-16" आउटपुट करता है, यह संख्या 4.940656e-324 से भी छोटी है


कौन सी संख्या " 4.940656e-324 से भी छोटी है "?
स्वेन होइनस्टीन

8
आपका कथन " R में," <2e-16 "का शाब्दिक अर्थ नहीं है <2e-16 " गलत है। आर को प्रदर्शित करता है <2e-16, मूल्य है की तुलना में छोटे 2e-16, सचमुच।
स्वेन हॉन्स्टीन

आपने मेरी कही बात को गलत समझा। जब R ने कहा कि "<2e-16", p-value 2e-16 से छोटा है, लेकिन इसका मतलब यह नहीं है कि 2e-16 से छोटा p- मान "<2e-16" के रूप में प्रदर्शित किया जाएगा। जैसा कि मैंने दिखाया है, आर को [4.940656e-324, 2e-16] के बीच किसी भी संख्या के एलएम सारांश पी-मूल्य में प्रदर्शित करने के लिए कोई समस्या नहीं है, जबकि बाईं सीमा 2 ^ -1074 है। इसलिए मैं मानता हूं, केवल जब पी-मान 2 ^ -1074 से छोटा है, तो आर कहेंगे कि पी-मान एक छोटे डेल्टा मूल्य से छोटा है। यह सिर्फ ऐसा होता है कि आर इस डेल्टा मान को 2e-16 के रूप में प्रदर्शित करता है। तो मेरा अनुमान है "<2e-16" वास्तव में "<2 ^ -1074" का अर्थ पी-मूल्यों में है
user3590816

6
हालाँकि, आपका अनुमान गलत है: यही @Sven आपको बताने की कोशिश कर रहा है। के रूप में के लिए मदद देखें format.pvalया बस इसे बाहर की कोशिश करो format.pval(1e-16)
व्हिबर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.