समझ के लिए सबसे कठिन सांख्यिकीय अवधारणा क्या है?


32

यह यहाँ के लिए एक समान प्रश्न है , लेकिन अलग अलग मुझे लगता है कि सार्थक पूछना है।

मैंने सोचा था कि मैं एक स्टार्टर के रूप में काम करूंगा, जो मुझे लगता है कि सबसे मुश्किल में से एक है।

मेरा संभाव्यता और आवृत्ति के बीच का अंतर है । एक "वास्तविकता का ज्ञान" (संभावना) के स्तर पर है, जबकि दूसरा "वास्तविकता स्वयं" (आवृत्ति) के स्तर पर है। यह लगभग हमेशा मुझे भ्रमित करता है अगर मैं इसके बारे में बहुत सोचता हूं।

एडविन जेनेस ने इन चीजों को मिलाने का वर्णन करने के लिए "माइंड प्रोजेक्शन फेयरेसी" नामक एक शब्द गढ़ा।

समझ के लिए किसी भी अन्य कठिन अवधारणाओं पर कोई विचार?


(मुझे यह जवाब देने के लिए पर्याप्त नहीं है, इसलिए एक टिप्पणी जोड़ना।) मैंने हमेशा सोचा कि यह अजीब था कि पीआई फसलों को सांख्यिकीय समीकरणों में तैयार किया गया था। मेरा मतलब है - पीआई को आंकड़ों के साथ क्या करना है? :)
मोनिका को बहाल करना - गुडबाय एसई

2
मैं सहमत हूँ (मेरे आश्चर्य में) - मुझे लगता है कि इसके कई गणितीय विश्लेषण में पॉप अप करते हैं। बस एक नोट आप लिख सकते हैं के रूप में लेटेक्स आदेशों के साथ द्वारा $ संकेत के भीतर संलग्न। मैं वाक्यविन्यास en.wikibooks.org/wiki/LaTeX/Memhematics प्राप्त करने के लिए विकी पृष्ठ का उपयोग करता हूं । एक अन्य चाल इस साइट पर आपके द्वारा देखे गए समीकरण पर "राइट क्लिक" करने के लिए है, और कमांड का उपयोग करने के लिए "शो स्रोत" चुनें। p \ piππ\pi
probabilityislogic

@Wiki आप स्वीकार करते हैं कि अगर अप फसलों जब आप चक्र का एक टुकड़ा की लंबाई करने के लिए लाइन का एक टुकड़ा straigh की लंबाई को मापने से जाओ, मैं नहीं दिख रहा है पतन के लिए एक संभावना को मापने से जा रहा है, जबकि यह क्यों प्रकट नहीं होता एक खंड पर नीचे सर्कल के एक टुकड़े में गिरने की संभावना को मापने के लिए? π
रॉबिन जिरार्ड

@ विकि जब भी आपके पास त्रिकोणमितीय कवक (साइन, कोसाइन, स्पर्शरेखा आदि) होते हैं, तो आप पॉप अप होने का जोखिम उठाते हैं । और याद रखें कि जब भी आप किसी फ़ंक्शन को प्राप्त करते हैं तो आप वास्तव में एक स्पर्शरेखा पाते हैं। क्या आश्चर्य की बात है कि अधिक बार प्रकट नहीं होता है । πππ
कार्लोस एक्सीली

@Carlos मैं के प्रसार पर शक के उपयोग के कारण ज्यादातर है 2 मीट्रिक, एन-क्षेत्रों के लिए अग्रणी। उसी नस में, मुझे उम्मीद है कि यह ई का होगा जिसका प्रचलन विश्लेषण के कारण है। 2π2e
22

जवाबों:


31

किसी कारण से, लोगों को यह समझने में कठिनाई होती है कि वास्तव में पी-वैल्यू क्या है।


3
@ शब्बीचेफ: अधिकांश लोग इसे सबसे खराब तरीके से समझ लेते हैं अर्थात टाइप I त्रुटि करने की संभावना।
सनकूलू

2
मुझे लगता है कि कक्षाओं में पी-वैल्यू को कैसे समझा जाता है, इससे संबंधित है (यानी: बस एक त्वरित परिभाषा देकर और यह निर्दिष्ट किए बिना कि पी-मान क्या नहीं हैं)
nico

मुझे लगता है कि यह मुख्य रूप से किस तरह से पेश किया जाता है। मेरे लिए, यह शास्त्रीय परिकल्पना परीक्षण के लिए एक "ऐड-ऑन" था - इसलिए ऐसा प्रतीत होता है जैसे कि एक परिकल्पना परीक्षण करने का सिर्फ एक और तरीका है। दूसरी समस्या यह है कि यह आमतौर पर केवल एक सामान्य वितरण के संबंध में सिखाया जाता है, जहां सब कुछ "अच्छा काम करता है" (जैसे पी-मान एक सामान्य परीक्षण में साक्ष्य का एक उपाय है)। पी-वैल्यू को सामान्य करना आसान नहीं है क्योंकि सामान्यीकरण को निर्देशित करने के लिए कोई विशिष्ट सिद्धांत नहीं है (उदाहरण के लिए नमूना आकार और कई तुलनाओं के साथ एक पी-मूल्य कैसे भिन्न होना चाहिए, इस पर कोई सामान्य समझौता नहीं है)
प्रायिकिसोलॉजिक

@shabbychef +1 हालांकि छात्र को अक्सर पी-मान के साथ कठिनाइयाँ होती हैं (मोटे तौर पर क्योंकि परीक्षण में अवधारणा एक द्विआधारी निर्णय प्रक्रिया की तुलना में थोड़ी अधिक सूक्ष्म है और इसका कारण है "एक समारोह में प्रवेश करना" aprehend के लिए आसान नहीं है)। जब आप कहते हैं "किसी कारण से" क्या आपका मतलब है कि यह आपके लिए अस्पष्ट है कि लोगों को कठिनाइयाँ क्यों हैं? पुनश्च: यदि मैं कर सकता था, तो मैं इस साइट पर "एक शीर्ष उत्तर होने" और "पी-मूल्य के बारे में बात करना" के बीच संबंध के बारे में आंकड़े बनाने की कोशिश करूंगा :)। मैं खुद से यह भी पूछता हूं कि क्या सबसे कठिन सांख्यिकीय अवधारणा को समझ लेना सबसे अधिक अपवित्र हो सकता है (यदि इसे समझ पाना मुश्किल है ... :))
रॉबिन जिरार्ड

1
@eduardo - हाँ एक छोटा सा पर्याप्त मान शून्य परिकल्पना पर संदेह करने के लिए पर्याप्त है: लेकिन यह एक विकल्प के लिए पूर्ण अलगाव में गणना की जाती है । अकेले पी-वैल्यू का उपयोग करते हुए, आप कभी भी औपचारिक रूप से " " को अस्वीकार नहीं कर सकते , क्योंकि कोई विकल्प निर्दिष्ट नहीं किया गया है । यदि आप औपचारिक रूप से H 0 को अस्वीकार करते हैं , तो आपको उन गणनाओं को भी अस्वीकार कर देना चाहिए जो H 0 के सत्य होने की धारणा पर आधारित थीं , जिसका अर्थ है कि आपको इस मान के तहत प्राप्त पी-मान की गणना को अस्वीकार करना होगा (यह आपके सिर के साथ खिलवाड़ करता है) , लेकिन यह लगातार तर्क करने का एकमात्र तरीका है )। H0H0H0
संभाव्यताविषयक

23

शब्बिचेफ के जवाब के समान, लगातार आंकड़ों में विश्वास अंतराल के अर्थ को समझना मुश्किल है। मुझे लगता है कि सबसे बड़ी बाधा यह है कि एक आत्मविश्वास अंतराल उस सवाल का जवाब नहीं देता है जिसका हम जवाब देना चाहते हैं। हम जानना चाहेंगे, "क्या मौका है कि असली मूल्य इस विशेष अंतराल के अंदर है?" इसके बजाय, हम केवल उत्तर दे सकते हैं, "क्या मौका है कि इस तरह से एक यादृच्छिक रूप से चुना गया अंतराल सही पैरामीटर होता है?" उत्तरार्द्ध स्पष्ट रूप से कम संतोषजनक है।


1
जितना अधिक मैं आत्मविश्वास के अंतराल के बारे में सोचता हूं, मेरे लिए यह सोचना उतना ही कठिन है कि वे किस तरह के प्रश्न का उत्तर वैचारिक स्तर पर दे सकते हैं, जिसका उत्तर यह पूछकर नहीं दिया जा सकता है कि "मौका एक सही मूल्य एक अंतराल के भीतर है, जिसे देखते हुए किसी का राज्य ज्ञान"। अगर मुझसे पूछा गया कि "मेरी जानकारी में मौका (सशर्त) क्या है कि 2010 में औसत आय 10,000 और 50,000 के बीच थी?" मुझे नहीं लगता कि विश्वास अंतराल का सिद्धांत इस प्रश्न का उत्तर दे सकता है।
probabilityislogic


13

सशर्त प्रायिकता संभवतः रोज़मर्रा के अनुभव में अधिकांश गलतियों की ओर ले जाती है । समझ में आने के लिए कई कठिन अवधारणाएं हैं, लेकिन लोगों को आमतौर पर उनके बारे में चिंता करने की ज़रूरत नहीं है - यह एक वे दूर नहीं हो सकते हैं और बड़े पैमाने पर गलत व्यवहार का एक स्रोत है।


+1; क्या आप एक उदाहरण या दो, पसंदीदा या वर्तमान जोड़ सकते हैं?
डेनिस

1
शुरुआत के लिए: पी (आपको बीमारी है। परीक्षण सकारात्मक है)! = पी (परीक्षण सकारात्मक है। आपको बीमारी है)।
xmjx

9

मुझे लगता है कि बहुत कम वैज्ञानिक इस मूल बिंदु को समझते हैं: यह केवल अंकित मूल्य पर सांख्यिकीय विश्लेषण के परिणामों की व्याख्या करने के लिए संभव है, अगर हर कदम पर पहले से योजना बनाई गई थी। विशेष रूप से:

  • नमूना आकार अग्रिम में उठाया जाना है। डेटा का विश्लेषण करते रहना ठीक नहीं है क्योंकि परिणाम अच्छे दिखने पर अधिक विषयों को जोड़ दिया जाता है।
  • डेटा को सामान्य बनाने या आउटलेर्स को बाहर करने के लिए उपयोग किए जाने वाले किसी भी तरीके को पहले से तय किया जाना चाहिए। जब तक आप अपनी पसंद के परिणाम नहीं पा लेते, तब तक डेटा के विभिन्न सबसेट का विश्लेषण करना ठीक नहीं है।
  • और अंत में, निश्चित रूप से, सांख्यिकीय तरीकों को पहले से तय किया जाना चाहिए। क्या डेटा को पैरामीट्रिक और नॉनपैमेट्रिक तरीकों से विश्लेषण करना ठीक नहीं है, और आपको जो परिणाम पसंद हैं उन्हें चुनें।

खोजपूर्ण तरीके उपयोगी हो सकते हैं, अच्छी तरह से, अन्वेषण करें। लेकिन तब आप बारी-बारी से नियमित सांख्यिकीय परीक्षण नहीं कर सकते हैं और सामान्य तरीके से परिणामों की व्याख्या कर सकते हैं।


5
मुझे लगता है कि जॉन Tukey असहमत हो सकता है en.wikipedia.org/wiki/Exploratory_data_analysis ; ओ)
Dikran Marsupial

3
मैं आंशिक रूप से यहाँ असहमत हूँ। मुझे लगता है कि लोगों को यह याद रखना मुश्किल है कि इस तरह के मुद्दों के लिए उपयुक्त कंडीशनिंग ऑपरेशन को अनदेखा करना आसान है । इन कार्यों में से प्रत्येक परिचालन की शर्तों को बदल देता है, और इसलिए, वे इसकी प्रयोज्यता की शर्तों को बदलते हैं (और इसलिए इसकी व्यापकता के लिए)। यह निश्चित रूप से केवल "पुष्टिकरण विश्लेषण" पर लागू होता है, जहां एक अच्छी तरह से परिभाषित मॉडल और प्रश्न का निर्माण किया गया है। खोजपूर्ण चरण में, निश्चित प्रश्नों के उत्तर की तलाश में नहीं - एक मॉडल बनाने के लिए और डेटा के लिए परिकल्पना के साथ आने के लिए।
संभाव्यताविषयक

मैंने डिक्रान और प्रोबेबिलिसलॉगिक की टिप्पणियों को ध्यान में रखने के लिए अपने उत्तर को थोड़ा संपादित किया। धन्यवाद।
हार्वे मोटुलस्की

1
मेरे लिए, "आउटलेयर्स को छोड़कर" उतना स्पष्ट रूप से गलत नहीं है जितना आपके उत्तर का अर्थ है। उदाहरण के लिए, आप केवल प्रतिक्रियाओं की एक निश्चित सीमा पर रिश्तों में दिलचस्पी ले सकते हैं, और बाहरी लोगों को छोड़कर वास्तव में इस तरह के विश्लेषण में मदद करता है। उदाहरण के लिए, यदि आप "मध्यम वर्ग" आय का मॉडल बनाना चाहते हैं, तो सुपर रिच और खराब आउटलेयर को छोड़कर एक अच्छा विचार है। यह केवल आपके निष्कर्ष के फ्रेम के भीतर आउटलेर है (उदाहरण के लिए "अजीब" मध्यम वर्ग के अवलोकन) आपकी टिप्पणी लागू होती है
संभावना 10

2
अंततः प्रारंभिक उत्तर में उठाए गए मुद्दों के साथ वास्तविक समस्या यह है कि वे (कम से कम आंशिक रूप से) पी-मूल्यों को अमान्य करते हैं। यदि आप एक देखे गए प्रभाव की मात्रा निर्धारित करने में रुचि रखते हैं, तो किसी को भी उपरोक्त सभी में से किसी को भी करने में सक्षम होना चाहिए।
रसेलपिएरेस

9

जीभ दृढ़ता से गाल में: आवृत्तियों के लिए, संभावना की बेयसियन अवधारणा; Bayesians के लिए, प्रायिकता की अक्सर अवधारणा। ; ओ)

दोनों में योग्यता है, लेकिन यह समझना बहुत मुश्किल है कि एक ढांचा दिलचस्प / उपयोगी / वैध क्यों होता है, यदि दूसरे की समझ बहुत मजबूत हो। क्रॉस-वेलिडेटेड एक अच्छा उपाय है क्योंकि सवाल पूछना और जवाब सुनना सीखने का एक अच्छा तरीका है।


2
मैं शासन करता हूं कि मैं याद रखने के लिए उपयोग करता हूं: आवृत्तियों का अनुमान लगाने के लिए संभावनाओं का उपयोग करें। एक बार आवृत्तियों के देखे जाने के बाद, उन्हें आपके द्वारा असाइन की गई संभावनाओं का मूल्यांकन करने के लिए उपयोग करें। दुर्भाग्य से भ्रमित करने वाली बात यह है कि, अक्सर आपके द्वारा असाइन की गई संभावना आपके द्वारा देखी गई आवृत्ति के बराबर होती है। एक बात जो मुझे हमेशा अजीब लगती है, वह यह है कि फ्रिक्वेंसी भी प्रायिकता शब्द का उपयोग क्यों करते हैं ? क्या यह समझने में आसान नहीं होगा कि क्या वाक्यांश "किसी घटना की आवृत्ति" का उपयोग "किसी घटना की संभावना" के बजाय किया गया था?
प्रोबेबिलिसलॉजिक

p(x)L(xn,x)dxi=1i=nL(x[ni],xi)xnx[ni]xi

8

मेरे व्यक्तिगत अनुभव से संभावना की अवधारणा भी काफी हलचल पैदा कर सकती है, खासकर गैर-सांख्यिकीविदों के लिए। जैसा कि विकिपीडिया कहता है, यह अक्सर प्रायिकता की अवधारणा के साथ मिलाया जाता है, जो कि बिल्कुल सही नहीं है।



6

अलग-अलग वितरण वास्तव में क्या प्रतिनिधित्व करते हैं, इसके अलावा कि उनका उपयोग कैसे किया जाता है।


3
यह 101 के बाद सबसे अधिक विचलित करने वाला प्रश्न था। मैं "गुणों" से परे उनके लिए कोई प्रेरणा के साथ कई वितरणों का सामना करूंगा जो हाथ में विषयों के लिए प्रासंगिक थे। किसी भी प्रतिनिधित्व का पता लगाने के लिए अस्वीकार्य रूप से लंबा समय लगा।
sesqu

1
अधिकतम एन्ट्रॉपी "सोच" एक विधि है जो यह समझने में मदद करती है कि वितरण क्या है, अर्थात् ज्ञान की स्थिति (या किसी चीज़ से अनिश्चितता का वर्णन)। यह एकमात्र परिभाषा है जिसने मुझे सभी स्थितियों में समझ में आ गया है
संभाव्यता


5

मुझे लगता है कि प्रश्न दो तरह से व्याख्या योग्य है, जो बहुत अलग उत्तर देगा:

1) आंकड़ों का अध्ययन करने वाले लोगों के लिए, विशेष रूप से अपेक्षाकृत उन्नत स्तर पर, समझ की सबसे कठिन अवधारणा क्या है?

2) किस सांख्यिकीय अवधारणा को अधिकांश लोगों ने गलत समझा है?

1) मुझे इसका जवाब बिल्कुल नहीं पता। उपाय सिद्धांत से कुछ, हो सकता है? किसी प्रकार का एकीकरण? मुझे नहीं पता।

2) पी-वैल्यू के लिए, हाथ नीचे।


उपाय सिद्धांत न तो आंकड़ों का क्षेत्र है और न ही कठिन। कुछ प्रकार के एकीकरण कठिन हैं, लेकिन, एक बार फिर, यह आँकड़े नहीं हैं।
पियानों

5

गैर-बायेसियन परंपरा में आत्मविश्वास का अंतराल एक मुश्किल है।


5

मुझे लगता है कि लोगों को पहली बार के आसपास सब कुछ बहुत अधिक नाव याद आती है। मुझे लगता है कि ज्यादातर छात्र जो नहीं समझते हैं वह यह है कि वे आमतौर पर नमूनों के आधार पर मापदंडों का अनुमान लगा रहे हैं। वे एक नमूना सांख्यिकीय और एक जनसंख्या पैरामीटर के बीच अंतर नहीं जानते हैं। यदि आप इन विचारों को उनके सिर में मारते हैं, तो अन्य सामान को थोड़ा आसान पालन करना चाहिए। मुझे यकीन है कि अधिकांश छात्र CLT के क्रूस को नहीं समझते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.