सामान्य शब्द जिनके विशेष सांख्यिकीय अर्थ होते हैं


12

मैं एक सांख्यिकीविद् नहीं हूं, लेकिन मेरे शोध कार्य में आंकड़े शामिल हैं (डेटा का विश्लेषण, साहित्य पढ़ना, आदि)। मुझे फिर से यहां पोस्ट किए गए मेरे एक प्रश्न पर एक टिप्पणी से याद दिलाया गया था कि कुछ सामान्य शब्द हैं जो विशेष रूप से उन लोगों के लिए विशिष्ट अर्थ या अर्थ हैं जो आंकड़ों के क्षेत्र में अच्छी तरह से अभ्यास करते हैं।

ऐसे शब्दों की एक सूची बनाना उपयोगी होगा और कुछ टिप्पणियों के साथ वाक्यांश भी हो सकते हैं।


1
सामुदायिक विकी के लिए एक उम्मीदवार की तरह लगता है ।
Glen_b -Reinstate Monica

@Glen_b यह एक विशेष रूप से बड़े में बदल सकता है, यह देखते हुए कि आंकड़ों या गणित में किसी भी शब्द के बारे में अर्हता प्राप्त होगी। क्या इस प्रश्न के दायरे को सार्थक रूप से सीमित करने का कोई तरीका है?
whuber

3
@ वाउचर हां, यह एक खतरा है जो अत्यधिक व्यापक हो जाता है। क्या ऐसा कुछ होगा जो "आम तौर पर भ्रम पैदा करता है" गुंजाइश को संकीर्ण करने के लिए पर्याप्त है?
Glen_b -Reinstate Monica

मुझे लगता है कि सक्षम सांख्यिकीविदों के पास आम तौर पर अपनी मूल भाषा की एक अच्छी कमान होती है और जब वे शब्दजाल का उपयोग कर रहे होते हैं तो उन्हें अच्छी तरह से पता होता है कि उन्हें सही तरीके से दर्शकों को समझाया जाना चाहिए।
रॉबर्ट जोन्स

@Glen_b मुझे यकीन नहीं है। यह इतना व्यापक है कि मैं मुश्किल से उन शब्दों की सूची शुरू कर सकता हूं जिन्हें कवर किया जाना चाहिए: सटीकता, पूर्वाग्रह, अंशांकन, भेदभाव, निरंतर, वितरण, खतरा, अस्तित्व, तख़्ता, मॉडल, प्रतिक्रिया, बूटस्ट्रैप, समायोजन, क्लस्टर, सशर्त, आत्मविश्वास, घनत्व , अनुमान, चर, विहित, सहसंबंध, भविष्यवाणी, अनुमान, सेंसर, रिस्क, कंसर्डेंस, लॉजिस्टिक, लिमिट, कवरेज, कन्फाउंडिंग, आकस्मिकता, कन्वर्सेशन, पत्राचार, स्वतंत्रता, डिवोर्स, एक्सॉन, रेंज, सामान्य, ड्रॉप-इन, डमी बताया [भिन्नता], कारक, असफलता, भरने में, फिट, फिट, समारोह, ...
whuber

जवाबों:


12

" महत्वपूर्ण " - यहाँ शब्द का सामान्य भाषा उपयोग 'महत्वपूर्ण' या 'अर्थपूर्ण' की तरह है। सांख्यिकीय अर्थ अनौपचारिक रूप से निकट है "शून्य के बारे में यादृच्छिक भिन्नता से विवेचित किया जा सकता है"; यह इंगित नहीं करता है कि अंतर पदार्थ के लिए पर्याप्त बड़ा है।

यहां कुछ उदाहरण दिए गए हैं जहां यह अंतर कुछ भ्रम का कारण हो सकता है: 1 2

" पैरामीटर " - यह अक्सर ऐसा लगता है - विशेष रूप से वैज्ञानिक प्रयोगों में - कि 'पैरामीटर' शब्द का उपयोग उस तरह से किया जाता है जैसे कि एक सांख्यिकीविद् 'चर' शब्द का उपयोग करेगा। विकिपीडिया इसे इस प्रकार रखता है:

एक सांख्यिकीय पैरामीटर एक पैरामीटर है जो संभाव्यता वितरण के एक परिवार को अनुक्रमित करता है। इसे एक आबादी या एक मॉडल की संख्यात्मक विशेषता के रूप में माना जा सकता है

उदाहरण जहां यह एक मुद्दा हो सकता है: 1 - संभवतः वह पद जिसके कारण यह प्रश्न हुआ। (मैंने हाल ही में एक और देखा लेकिन मैं अभी इसका पता नहीं लगा सकता)


11

"त्रुटि" - आंकड़ों में अक्सर इसका मतलब होता है किसी मनाया और अनुमानित मूल्य के बीच कोई विचलन। वास्तविक जीवन में इसका मतलब गलती है।


11

मुझे 2010 से एक रेफरीड पेपर मिला जो इस प्रश्न को देखता है।

एंडरसन-कुक सीएम। हिडन शब्दजाल: आंकड़ों के लिए विशिष्ट अर्थ के साथ हर दिन शब्द। ICOTS8, इंटरनेशनल कॉन्फ्रेंस ऑन टीचिंग स्टेटिस्टिक्स, लजुब्लजाना, स्लोवेनिया, 11-17 जुलाई 2010।

कागज मुफ्त में ऑनलाइन उपलब्ध है , इसलिए मैं केवल उन शर्तों की आंशिक सूची प्रदान कर रहा हूं जो लेखक चर्चा करता है:

 confounding, control, factor, independent, random, uniform

10

मुझे "मिथ्याकरण" का उपयोग करने की समस्या के रूप में "मिथ्या परिकल्पना" में आया है, जबकि अन्य ने सोचा कि मैं "डेटा बनाने" का उल्लेख कर रहा हूं। भ्रम पैदा किए बिना " पक्षपाती " का उल्लेख करना लगभग असंभव है।


6

"सामान्य" - सामान्य भाषण में, सामान्य का मतलब उम्मीद के मुताबिक होता है, सामान्य से बाहर नहीं। आंकड़ों में, यदि एक चर सामान्य रूप से वितरित किया जाता है, तो यह गौसियन वितरण की बात कर रहा है। मुझे विश्वास नहीं है कि यह सामान्य शब्द "कैपिटल" को सामान्य करने के लिए इसे सामान्य भाषण अर्थ से अलग करने के लिए मानक है।

"सामान्यीकरण / स्टैंडरलाइजेशन" - आंकड़ों में, किसी चर को सामान्य करने के लिए औसत विचलन को कम करने और विभाजित करने के लिए।

"मानक विचलन बनाम मानक त्रुटि" - मानक विचलन आमतौर पर पूरी आबादी का उपयोग करके गणना की जाती है जबकि मानक त्रुटि की गणना नमूने का उपयोग करके की जाती है।


1
मुझे वास्तव में संदेह है कि "मानक त्रुटि" एक "सामान्य [पारंपरिक, गैर-सांख्यिकीय] शब्द" है, जिसमें उस शब्द के अन्य उपयोगों से भिन्न एक विशेष सांख्यिकीय अर्थ है (वाक्यांश, वास्तव में)। "सामान्यीकरण" और "मानक विचलन" के लिए डिट्टो।
whuber

शायद "सामान्यीकरण" नहीं, लेकिन "सामान्य" एक अच्छा बिंदु है, और इसलिए "मानकीकरण" होगा, जिसका उपयोग राष्ट्रीय मानकों को स्थापित करने के उद्देश्य से परीक्षणों का वर्णन करने के लिए किया जाता है (जैसे, शिक्षा में, जैसे कि यूएस में नो चाइल्ड लेफ्ट के बाद। पीछे)। मैं मानता हूं कि "मानक विचलन" भ्रम पैदा करने की संभावना नहीं है, हालांकि आम बोलचाल में "विचलन" स्वयं एक नकारात्मक अर्थ (विशेष रूप से "विचलन" के पर्याय के रूप में) ले जाने की अधिक संभावना हो सकती है।
निक स्टॉनर

यहाँ एसडी और SEM.Standard विचलन को अलग करने का एक और तरीका है भिन्नता या बिखराव की मात्रा। एक मानक त्रुटि एक गणना मूल्य की परिशुद्धता की मात्रा निर्धारित करती है।
हार्वे मोटुलस्की

@HarveyMotulsky मुझे लगता है कि सबसे अच्छा तरीका एक क्षुद्रग्रह (अनियमित आकार) के बारे में है। क्षुद्रग्रह के द्रव्यमान का केंद्र क्या है? यह वह बिंदु है जो अन्य सभी बिंदुओं से समान है। यही मतलब है। मानक विचलन क्या है? यह केंद्र से प्रत्येक बिंदु की "औसत" दूरी, आकार का एक माप है। SEM क्या है यह बताता है कि आप क्षुद्रग्रह के केंद्र के स्थान के बारे में कितने सुनिश्चित हैं।
फ्लास्क

मुझे लगता है कि मानक त्रुटि मानक नमूना "नमूना" एक दुर्भाग्यपूर्ण का उपयोग कर गणना की गई है। यह मेरे लिए नमूना विचरण का वर्गमूल होगा, जबकि मानक त्रुटि एक परीक्षण सांख्यिकीय का मानक विचलन है। इसके अलावा, उपरोक्त शर्तों से केवल "सामान्य" वास्तव में सामान्य लगता है। लेकिन मुझे लगता है कि यह सामान्य है ...
मतलब-टू-अर्थ

2

"पैरामीट्रिक" बनाम "गैर-पैरामीट्रिक": परीक्षणों की श्रेणियां जिन्हें या तो "सामान्य" या "सामान्य नहीं" डेटा की आवश्यकता होती है। पैरामीट्रिक परीक्षण गैर पैरामीट्रिक के लिए पसंद किए जाते हैं।

सामान्य परीक्षण: टी-टेस्ट (युग्मित), मान-व्हिटनी यू, एनोवा, एंडरसन-डार्लिंग, आदि।

अन्य शब्दों में "महत्वपूर्ण" शामिल हैं। यह एक उपाय है यदि डेटा आपकी परिकल्पना को वैध होने या न होने का संकेत देता है। जब आप अपनी परिकल्पना की कुछ हद तक संभावना (सामान्य रूप से 95%) का परीक्षण करते हैं, तो 0.05 से कम के "पी-वैल्यू" से संकेत मिलता है कि आप अपनी "शून्य परिकल्पना" को अस्वीकार कर देंगे (यानी डेटा सेट अलग नहीं हैं) और अपना स्वीकार करें " वैकल्पिक परिकल्पना "(यानी डेटा सेट अलग हैं)।


2

आँकड़ों में तिरछा वितरण में असममितता का अर्थ है।

सामान्य भाषा में, और विज्ञान के भीतर भी, तिरछेपन का उपयोग अक्सर किया जाता है (और तेजी से?) इसका मतलब यह है कि सांख्यिकीय लोगों को आमतौर पर पक्षपाती कहा जाता है , जैसा कि "मतलब ऊंचाई के लिए परिणाम इतने सारे बास्केटबॉल खिलाड़ियों को शामिल करके तिरछा किया जाता है"।


2

अनुमान - आंकड़ों में यह एक गणना का परिणाम है। उदाहरण के लिए, नमूना माध्य जनसंख्या माध्य का एक अनुमान है, और एक माध्य का विश्वास अंतराल जनसंख्या माध्य का एक अंतराल अनुमान है। ये दोनों सटीक गणनाओं के परिणाम हैं। "अनुमान" एक नमूने में डेटा से आबादी के बारे में अनुमान लगाने की कोशिश करने का एक सटीक सामान्यीकरण है।

सामान्य उपयोग में, शब्द अनुमान का अर्थ होता है एक सूचित अनुमान या कूबड़, या एक अनुमानित गणना का परिणाम।


2

θएक्सएल(θ|एक्स)=पीआर(एक्स|θ)

प्रतिनिधि - कभी-कभी रोज़ और वैज्ञानिक दोनों दृष्टियों से परस्पर विरोधी अर्थों की संख्या होती है। Kruskal और Mosteller का संदर्भ लें 1979a , 1979b , 1979c और 1980 । अधिकांश सांख्यिकीविदों को पता है कि वे एक नमूना प्रतिनिधि पर विचार करेंगे यदि इसे ज्ञात संभावना के साथ नमूना लिया गया था; अगर मुझे लगता है कि सीमांत वितरण आबादी के समान थे, तो मुझे पता है कि अधिकांश प्रतिनिधि इस पर विचार करेंगे।


2
  • नमूना : जबकि आंकड़ों में यह मामलों के एक सेट को संदर्भित करता है , कई अन्य विषयों में एक नमूना एक भौतिक नमूना है । बेशक, नमूना आकार भी अस्पष्ट है, या तो नमूना के मामलों की संख्या या नमूना के भौतिक आकार (द्रव्यमान, मात्रा, ...) का उल्लेख करता है।

  • संवेदनशीलता : चिकित्सा निदान के लिए रोगग्रस्त मामलों का अंश जिसे परीक्षण द्वारा मान्यता प्राप्त है। विश्लेषणात्मक रसायन विज्ञान में: अंशांकन वक्र की ढलान (नीचे देखें)।

  • विशिष्टता : मेडिकल डायग्नोस्टिक्स में गैर-रोग मामलों के अंश को परीक्षण द्वारा सही ढंग से पहचाना जाता है। विश्लेषणात्मक रसायन विज्ञान में, एक विधि विशिष्ट है यदि कोई क्रॉस-सेंसिटिव नहीं हैं।

  • अंशांकन : वास्तव में, विकी लेख के आंकड़ों के लिए दो अर्थ पहले से ही सूचीबद्ध हैं। रसायन विज्ञान और भौतिकी में, रिवर्स रिग्रेशन अर्थ सामान्य है। हालांकि भ्रम की स्थिति पैदा होती है:

    • मैंसीमैं=(सी)सीसी=-1(मैं)सी=(मैं)
      सीमैं
    • मैंने "कैलिब्रेशन प्लॉट्स" (आँकड़े लोग) नामक सच्ची संभावना पर अनुमानित संभावना वाले प्लॉट देखे हैं। विश्लेषणात्मक रसायन विज्ञान में, इसी अंशांकन साजिश को मापा संकेत (आमतौर पर कुछ अन्य इकाई) पर संभावना का अनुमान लगाया जाएगा। सच्चे आश्रित चर पर भविष्यवाणी की साजिश आमतौर पर वसूली वक्र कहा जाएगा ।
  • सत्यापन सेट : यहां मैं उन शब्दों के संभावित भ्रम के उपयोग पर ध्यान आकर्षित करना चाहूंगा, जो मुझे लगता है कि पहले से ही अलग-अलग सांख्यिकी-संबंधित क्षेत्रों के भीतर उठता है , भले ही मैं फिर से इसके विपरीत हो। नेस्टेड / डबल सत्यापन या अनुकूलन बनाम सत्यापन / परीक्षण के संदर्भ में शब्दावली की एक पंक्ति प्रशिक्षण - सत्यापन - परीक्षण करती है और हाइपरपरमेटर्स के अनुकूलन के लिए "सत्यापन" सेट का उपयोग करती है।
    जैसे सांख्यिकीय लर्निंग के तत्वों में, पी। 2 एड में 222। :

    ... डेटासेट को तीन भागों में विभाजित करें: एक प्रशिक्षण सेट, एक सत्यापन सेट और एक परीक्षण सेट। प्रशिक्षण सेट का उपयोग मॉडलों को फिट करने के लिए किया जाता है; सत्यापन सेट का उपयोग मॉडल चयन के लिए भविष्यवाणी की त्रुटि का अनुमान लगाने के लिए किया जाता है; परीक्षण सेट का उपयोग अंतिम चुने हुए मॉडल के सामान्यीकरण त्रुटि के आकलन के लिए किया जाता है।

    इसके विपरीत, उदाहरण के लिए विश्लेषणात्मक रसायन विज्ञान सत्यापन में वह प्रक्रिया है जो यह प्रदर्शित करती है कि मॉडल (वास्तव में, अंतिम मॉडल का मूल्यांकन केवल एक विश्लेषणात्मक विधि के सत्यापन का हिस्सा है) आवेदन के लिए अच्छा काम करता है, और इसके प्रदर्शन को मापता है, उदाहरण के लिए देखें जॉन के। टेलर: विश्लेषणात्मक तरीकों की मान्यता, विश्लेषणात्मक रसायन विज्ञान 1983 55 (6), 600A-608A या एफडीए जैसी संस्थाओं द्वारा दिशानिर्देश। यह शब्दावली की दूसरी पंक्ति में "परीक्षण" होगा, जहां "सत्यापन" वास्तव में अनुकूलन के लिए उपयोग किया जाता है।
    महत्वपूर्ण अंतर यह है कि, "अनुकूलन-सत्यापन" परिणामों का उपयोग मॉडल को बदलने (चयन) करने के लिए किया जाना है, जबकि एक मान्य विश्लेषणात्मक विधि (डेटा विश्लेषणात्मक मॉडल सहित) में परिवर्तन का मतलब है कि आपको फिर से अमान्य करना होगा (यानी यह साबित करें कि विधि अभी भी उसी तरह काम करती है जैसा कि उसे काम करना है)।


यदि आपको केमिस्टों से बात करनी है, तो विश्लेषणात्मक रसायन विज्ञान शब्दावली का एक अच्छा संदर्भ Danzer है: विश्लेषणात्मक रसायन विज्ञान - सैद्धांतिक और मेट्रोलॉजिकल फंडामेंटल, DOI 10.1007 / b103950

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.