प्रथम मानक सामान्य तालिका किसने बनाई?


61

मैं अपने परिचयात्मक सांख्यिकी वर्ग में मानक सामान्य तालिका पेश करने वाला हूं, और मुझे आश्चर्य हो रहा है: पहला मानक सामान्य तालिका किसने बनाई? कंप्यूटर के साथ आने से पहले उन्होंने इसे कैसे किया? मैं हाथ से एक हजार Riemann रकम कंप्यूटिंग किसी जानवर-बल के बारे में सोचने के लिए कंपकंपी।


5
ऐतिहासिक रूप से सूचित शिक्षण के इच्छुक किसी व्यक्ति को देखकर अच्छा लगा।
mdewey 16

जवाबों:


62

लाप्लास सारणीकरण के साथ आने वाले सारणीकरण की आवश्यकता को पहचानने वाला पहला व्यक्ति था:

G(x)=xet2dt(1)=1x12x3+134x51358x7+135716x9+

सामान्य वितरण का पहला आधुनिक तालिका बाद में फ्रेंच खगोलशास्त्री द्वारा बनाया गया था क्रिश्चियन क्रैं्प में विश्लेषण des refractions Astronomiques एट Terrestres (सममूल्य ले citoyen Kramp, Professeur डी Chymie एट डे काया expérimentale à l'École Centrale डु डिपामेंट डे ला Roer, 1799)सामान्य वितरण से संबंधित तालिकाओं से : एक लघु इतिहास लेखक (ओं): हर्बर्ट ए डेविड स्रोत: द अमेरिकन स्टेटिस्टिशियन, वॉल्यूम। 59, नंबर 4 (नवम्बर, 2005), पीपी। 309-311 :

अंतरपणन के लिए आवश्यक अंतरों के साथ, क्रैम्प ने एक्स-1.24 डी से डी से और डी से आठ-दशमलव ( डी) टेबल दिए । के पहले छह डेरिवेटिव नीचे लेखन वह बस के एक टेलर श्रेणी प्रसार का उपयोग करता है के बारे में के साथ में अवधि के लिए ऊपरयह उसे से को गुणा करने पर से कदम आगे बढ़ने में सक्षम बनाता है8x=1.24, 91.50, 101.99,113.00G(x),G(x+h)G(x),h=.01,h3.x=0x=h,2h,3h,,hex2

1hx+13(2x21)h216(2x33x)h3.
इस प्रकार, यह उत्पाद ताकिx=0
.01(113×.0001)=.00999967,
G(.01)=.88622692.00999967=.87622725.


यहाँ छवि विवरण दर्ज करें

यहाँ छवि विवरण दर्ज करें

यहाँ छवि विवरण दर्ज करें

लेकिन ... वह कितना सही हो सकता है? ठीक है, चलो एक उदाहरण के रूप में लेते हैं :2.97

यहाँ छवि विवरण दर्ज करें

गजब का!

आइए गॉसियन पीडीएफ की आधुनिक (सामान्यीकृत) अभिव्यक्ति पर जाएं:

का pdf है:N(0,1)

fX(X=x)=12πex22=12πe(x2)2=12πe(z)2

जहाँ । और इसलिए, ।z=x2x=z×2

तो चलो R पर जाएं, और ... ठीक है, इतनी जल्दी नहीं। पहले हमें यह याद रखना होगा कि जब एक घातांक फ़ंक्शन में घातांक को लगातार गुणा करना है , तो अभिन्न को उस घातांक से विभाजित किया जाएगा: । हम पुराने तालिकाओं में परिणाम नकल पर निशाना कर रहे हैं के बाद से, हम वास्तव में के मूल्य को गुणा कर रहे हैं द्वारा जो हर में प्रकट करने के लिए होगा,।PZ(Z>z=2.97)eax1/ax2

इसके अलावा, क्रिस्चियन क्रैम्प सामान्य नहीं हुआ, इसलिए हमें R द्वारा दिए गए परिणामों को सही करना होगा, गुणा करना होगा । अंतिम सुधार इस तरह दिखेगा:2π

2π2P(X>x)=πP(X>x)

उपरोक्त मामले में, और । अब चलते हैं आर:z=2.97x=z×2=4.200214

(R = sqrt(pi) * pnorm(x, lower.tail = F))
[1] 0.00002363235e-05

बहुत खुबस!

चलो मस्ती के लिए टेबल के शीर्ष पर जाते हैं, कहते हैं ...0.06

z = 0.06
(x = z * sqrt(2))

(R = sqrt(pi) * pnorm(x, lower.tail = F))
[1] 0.8262988

क्या कहते हैं क्रैम्प? ।0.82629882

बहुत करीब...


बात यह है ... कैसे करीब, बिल्कुल? सभी अप-वोट प्राप्त होने के बाद, मैं वास्तविक उत्तर को लटका नहीं सकता था। समस्या यह थी कि मैंने जो सभी ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) एप्लिकेशन की कोशिश की थी, वे अविश्वसनीय रूप से बंद थे - आश्चर्य नहीं अगर आपने मूल पर एक नज़र डाली हो। इसलिए, मैंने क्रिस्चियन क्रैम्प को उनके काम के तप के लिए सराहना करना सीखा क्योंकि मैंने व्यक्तिगत रूप से उनके टेबल प्रेमवीर के पहले कॉलम में टाइप किया था ।

@ गलेन_ बी से कुछ मूल्यवान मदद के बाद, अब यह बहुत अच्छी तरह से सटीक हो सकता है, और यह इस GitHub लिंक में R कंसोल पर कॉपी और पेस्ट करने के लिए तैयार है ।

यहां उनकी गणना की सटीकता का विश्लेषण है। अपने आप को संभालो...

  1. [R] मूल्यों और क्रैम्प के सन्निकटन के बीच पूर्ण संचयी अंतर :

0.000001200764 - गणना के दौरान, वह लगभग मिलियन की त्रुटि जमा करने में कामयाब रहा !3011

  1. पूर्ण त्रुटि (MAE) , याmean(abs(difference))साथdifference = R - kramp:

0.000000003989249 - वह औसतन एक अपमानजनक एक-अरबवें त्रुटि बनाने में कामयाब रहा !3

उस प्रविष्टि पर जिसमें [R] की तुलना में उसकी गणना सबसे अधिक भिन्न थी, पहला भिन्न दशमलव स्थान मान आठवें स्थान (सौ मिलियन) में था। औसत (औसत) उनकी पहली "गलती" दसवें दशमलव अंक (दसवें अरबवें!) में थी। और, हालांकि वह किसी भी उदाहरण में [R] से पूरी तरह सहमत नहीं थे, तेरह डिजिटल प्रविष्टि तक निकटतम प्रविष्टि का विचलन नहीं होता है।

  1. सापेक्षिक अंतर या mean(abs(R - kramp)) / mean(R)(समान all.equal(R[,2], kramp[,2], tolerance = 0)):

0.00000002380406

  1. रूट माध्य चुकता त्रुटि (RMSE) या विचलन (बड़ी गलतियों को अधिक भार देता है), इस प्रकार गणना की गईsqrt(mean(difference^2)):

0.000000007283493


यदि आपको चिस्टियन क्रैम्प का चित्र या चित्र मिलता है, तो कृपया इस पोस्ट को संपादित करें और इसे यहाँ रखें।


4
इसके दो अलग-अलग संदर्भ हैं, और मुझे लगता है कि अतिरिक्त विवरण (जैसे कि ऊपरी पूंछ के लिए दिए गए स्पष्ट विस्तार लाप्लास) अच्छे हैं।
Glen_b

1
यह लेटेस्ट एडिट के साथ और भी बेहतर है लेकिन मैं दो बार - उत्कृष्ट सामान को बढ़ा नहीं सकता। ध्यान दें कि डेविड का लेख बताता है कि क्रैम्प की तालिका में दिखाए गए सभी अंकों की सटीकता क्यों नहीं थी (पहले चरण में एक बहुत छोटी सी त्रुटि के माध्यम से किया गया था) - लेकिन यह अभी भी अधिकांश सांख्यिकीय अनुप्रयोगों के लिए पर्याप्त से अधिक है
Glen_b

2
@ ओलिवियरग्रेगायर मेरे गलत दशमलव अंक को इंगित करने के लिए धन्यवाद। अब इसे सुधारा गया है। मैं एक ऐसे समय में बड़ा हुआ जब फ्रांसीसी एक जरूरी था, और किसी भी तरह से भाषा के मेरे विचित्र उपयोग के साथ कोई अनादर नहीं था (इसमें कोई संदर्भ नहीं है, लेकिन कभी भी मन नहीं है), जो मैंने उलट दिया है। "सिटॉयन क्रैम्प" के रूप में - कागज में परिचय के ऐतिहासिक रूपों को उजागर करने का प्रयास।
एंटोनी परेलाडा 14

1
अरे, अफ़सोस आपको यह एक कोसने वाला कमेंट लगा। मैं सिर्फ सामान की ओर इशारा कर रहा था, मैं किसी भी तरह से यह नहीं कह रहा था कि आप कुछ भी अपमान कर रहे हैं। आप निश्चित रूप से दंडित या अतिरंजित कर सकते हैं (या एक संदर्भ भी बना सकते हैं)। लेकिन एक फ्रांसीसी-भाषी आदमी के रूप में, मुझे वह नहीं मिला (यही है जिसे मैंने व्यक्त करने की कोशिश की, कम से कम)। "ले सिटॉयन क्रैम्प" का कोई मुद्दा नहीं था: मैंने सिर्फ नकल की और उद्धरण में रखा, क्योंकि यह अंग्रेजी नहीं थी। क्षमा करें यदि आपको लगा कि यह एक कोसने वाली टिप्पणी थी, तो यह नहीं है। अंग्रेजी के मेरे उपयोग में भी कमी है। ^ ^ आपकी तुलना अच्छी तरह से की गई थी!
ओलिवियर ग्रेगोइरे

1
@ P.Windridge क्षमा करें ... मुझे एहसास हुआ कि मेरे पास टूटी हुई हाइपरलिंक का एक गुच्छा है ...
एंटोनी पारेलाडा

32

हा डेविड [1] के अनुसार लाप्लास ने "1783 की शुरुआत में" सामान्य वितरण की तालिकाओं की आवश्यकता को पहचाना और 1799 में क्रैम्प द्वारा पहली सामान्य तालिका का निर्माण किया गया।

लाप्लास ने दो श्रृंखला सन्निकटन का सुझाव दिया, एक को से के इंटीग्रल के लिए (जो कि प्रसरण ) और एक ऊपरी पूंछ के साथ एक सामान्य वितरण के लिए आनुपातिक है ।0xet212

हालांकि, क्रैम्प ने लाप्लास की इन श्रृंखलाओं का उपयोग नहीं किया, क्योंकि अंतराल में एक अंतराल था जिसके लिए उन्हें उपयोगी रूप से लागू किया जा सकता था।

वास्तव में वह पूंछ क्षेत्र के लिए अभिन्न से शुरू होता है 0 से और फिर अंतिम गणना अभिन्न के बारे में एक टेलर विस्तार लागू करता है - अर्थात, जब वह तालिका में नए मूल्यों की गणना करता है तो वह अपने टेलर के विस्तार के को बदलता है (जहां ऊपरी पूंछ क्षेत्र देने का अभिन्न अंग है)।xG(x+h)G

विशिष्ट होने के लिए, प्रासंगिक दोहे उद्धृत करना:

वह बस बारे में टेलर श्रृंखला विस्तार का उपयोग करता है , , में शब्द तक । यह उसे से , के चरण को आगे बढ़ने में सक्षम करता है , जब गुणा करके कोइस प्रकार, यह उत्पाद हो जाता है ताकि । बाईं ओर (4) के अगले शब्द को दिखाया जा सकता है , ताकि इसकी चूक उचित हो।G(x+h)G(x)h=.01h3x=0x=h,2h,3h,...hex2

1hx+13(2x21)h216(2x33x)h3.
x=0
.01(113×.0001)=.00999967,(4)
G(.01)=.88622692.00999967=.87622725109

डेविड इंगित करता है कि तालिकाओं का व्यापक रूप से उपयोग किया गया था।

इसलिए हज़ारों रीमैन की तुलना में यह टेलर के सैकड़ों विस्तार थे।


एक छोटे से नोट पर, एक चुटकी में (सामान्य तालिका से केवल एक कैलकुलेटर और कुछ याद किए गए मानों के साथ चिपका हुआ) मैंने अन्य मूल्यों पर एक अच्छा अनुमान प्राप्त करने के लिए सिम्पसन के नियम (और संख्यात्मक एकीकरण के लिए संबंधित नियम) को काफी सफलतापूर्वक लागू किया है; सटीकता के कुछ आंकड़ों के लिए संक्षिप्त तालिका * बनाने के लिए यह सब थकाऊ नहीं है। [क्रैम्प के पैमाने और सटीकता की तालिकाओं का निर्माण करना एक काफी बड़ा काम होगा, हालांकि, एक चतुर विधि का उपयोग करना, जैसा कि उन्होंने किया था।]

* एक संक्षिप्त तालिका के द्वारा, मेरा मतलब है कि आप मूल रूप से बहुत अधिक सटीकता को खोए बिना सारणीबद्ध मूल्यों के बीच प्रक्षेप से दूर हो सकते हैं। यदि आप केवल 3 आंकड़ा सटीकता के आसपास कहना चाहते हैं, तो आपको वास्तव में उन सभी मूल्यों की गणना करने की आवश्यकता नहीं है । मैंने प्रभावी रूप से बहुपद प्रक्षेप का उपयोग किया है (अधिक सटीक, परिमित अंतर तकनीक), जो रैखिक प्रक्षेप की तुलना में कम मूल्यों के साथ एक तालिका के लिए अनुमति देता है - यदि प्रक्षेप कदम पर कुछ और प्रयास - और एक परिवर्तन के साथ प्रक्षेप भी किया है, जो रैखिक प्रक्षेप को काफी अधिक प्रभावी बनाता है, लेकिन यदि आपके पास एक अच्छा कैलकुलेटर है तो केवल इसका बहुत उपयोग होता है)।

[१] हर्बर्ट ए डेविड (२००५),
"टेबल्स रिलेटेड टू द नॉर्मल डिस्ट्रीब्यूशन: ए शॉर्ट हिस्ट्री"
द अमेरिकन स्टेटिस्टिशियन , वॉल्यूम। 59, नंबर 4 (नोव), पीपी 309-311

[२] क्रैम्प (१) ९९),
रेसेफ्रैक्टिस एस्ट्रोनॉमिक्स एट टेरेस्ट्रेस,
लीपज़िग: श्विकर्कट का विश्लेषण


0

दिलचस्प मुद्दा! मुझे लगता है कि पहला विचार जटिल सूत्र के एकीकरण के माध्यम से नहीं आया था; बल्कि, संयोजन दवाओं में एसिम्पोटिक्स लगाने का परिणाम है। पेन और पेपर विधि में कई सप्ताह लग सकते हैं; अपने पूर्ववर्तियों के लिए पाई की गणना की तुलना में कार्ल गॉस के लिए इतना मुश्किल नहीं है। मुझे लगता है कि गॉस का विचार साहसी था; उसके लिए गणना आसान थी।

स्क्रैच से मानक z तालिका बनाने का उदाहरण-
1. n ( मान n 20 है) संख्याओं की जनसंख्या लीजिए और आकार r के सभी संभावित नमूनों को सूचीबद्ध करें ( मान लीजिए कि r 5 है)।
2. नमूना साधन की गणना। आपको nCr नमूना साधन मिलता है (यहाँ, 20c5 = 15504 साधन)।
3. उनका माध्य जनसंख्या माध्य के समान है। नमूना के stdev का पता लगाएं।
4. नमूने के z स्कोर का मतलब उन पॉप माध्य और नमूना साधनों के stdev का उपयोग करना है।
5. आरोही क्रम में z को क्रमबद्ध करें और अपने nCr z मानों में z की एक सीमा में होने की संभावना खोजें।
6. सामान्य तालिकाओं के साथ मूल्यों की तुलना करें। छोटे n हाथ की गणना के लिए अच्छा है। बड़ा एन सामान्य तालिका मानों के करीब सन्निकट उत्पादन करेगा।

निम्नलिखित कोड r में है:

n <- 20  
r <- 5  

p <- sample(1:40,n)  # Don't be misled!! Here, 'sample' is an r function  
                     used to produce n random numbers between 1 and 40.  
                     You can take any 20 numbers, possibly all different.  

c <- combn(p, r)     # all the nCr samples listed  
cmean <- array(0)  

for(i in 1:choose(n,r)) {  
    cmean[i] <- mean(c[,i])  
                }  

z <- array(0)  
for(i in 1:choose(n,r)) {  
    z[i] <- (cmean[i]-mean(c))/sd(cmean)  
                }  

ascend <- sort(z, decreasing = FALSE)  

0 और सकारात्मक मान q नीचे के बीच z गिरने की संभावना; एक ज्ञात तालिका के साथ तुलना करें। तुलना करने के लिए 0 और 3.5 के बीच नीचे q हेरफेर करें।

q <- 1  
probability <- (length(ascend[ascend<q])-length(ascend[ascend<0]))/choose(n,r)   
probability   # For example, if you use n=30 and r=5, then for q=1, you  
              will get probability is 0.3413; for q=2, prob is 0.4773

3
मैं नहीं देखता कि तालिकाओं को उत्पन्न करने के लिए इस तरह से नमूने का उपयोग कैसे किया जा सकता है। मुझे लगता है कि ओपी सिर्फ यह जानना चाहता था कि पहला व्यक्ति कौन था
माइकल चेरिक

आपकी बहुमूल्य टिप्पणी के लिए धन्यवाद माइकल चेरिक। 1) ओपी लिखता है "कंप्यूटर के साथ आने से पहले उन्होंने यह कैसे किया? मैं किसी व्यक्ति के बारे में सोचने के लिए थरथराता हूं, जो एक हजार रीमैन बल को हाथ से गिनता है।" मैंने उस हिस्से का जवाब देने की कोशिश की। 2) 'नमूना' शब्द प्रति नमूना नहीं है, यह यादृच्छिक संख्याओं की सूची बनाने के लिए एक आर फ़ंक्शन है। हम किसी भी 20 नंबरों को साथ ही ले सकते हैं। यहाँ समर्थन r लिंक देखें stackoverflow.com/questions/17773080/…
Md तौहीदुल इस्लाम
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.