आंकड़ों में फ़ंक्शन का महत्व क्या है ?


19

मेरे कैलकुलस वर्ग में, हमने फ़ंक्शन , या "घंटी वक्र" का सामना किया , और मुझे बताया गया कि इसके आंकड़ों में अक्सर अनुप्रयोग हैं।ex2

जिज्ञासा से बाहर, मैं पूछना चाहता हूं: क्या फ़ंक्शन वास्तव में आंकड़ों में महत्वपूर्ण है? यदि हां, तो यह बारे में क्या है जो इसे उपयोगी बनाता है, और इसके कुछ अनुप्रयोग क्या हैं?- एक्स ex2ex2

मुझे इंटरनेट पर फ़ंक्शन के बारे में अधिक जानकारी नहीं मिली, लेकिन कुछ शोध करने के बाद, मुझे सामान्य रूप से घंटी घटता और सामान्य वितरण नामक कुछ के बीच एक लिंक मिला । एक विकिपीडिया पृष्ठ , सांख्यिकी आवेदन करने के लिए कार्य करता है के इन प्रकार के लिंक, मेरे द्वारा प्रकाश डाला है कि राज्यों के साथ:

"सामान्य वितरण को आँकड़ों में सबसे प्रमुख संभावना वितरण माना जाता है। इसके कई कारण हैं: 1 सबसे पहले, सामान्य वितरण केंद्रीय सीमा प्रमेय से उत्पन्न होता है, जिसमें कहा गया है कि हल्के परिस्थितियों में बड़ी संख्या में यादृच्छिक चर का योग निकाला जाता है। समान वितरण से लगभग समान रूप से वितरित किया जाता है, भले ही मूल वितरण के रूप के बावजूद । "

इसलिए, अगर मैं किसी तरह के सर्वेक्षण या उस तरह के डेटा की एक बड़ी राशि इकट्ठा करता हूं, तो उन्हें जैसे फ़ंक्शन के बीच समान रूप से वितरित किया जा सकता है ? फ़ंक्शन सममित है, इसलिए इसकी समरूपता यानी सामान्य वितरण के लिए इसकी उपयोगिता क्या है, यह आंकड़ों में इतना उपयोगी है? मैं केवल अटकलें लगा रहा हूं।ex2

सामान्य तौर पर, सांख्यिकी में उपयोगी है? यदि सामान्य वितरण एकमात्र क्षेत्र है, तो क्या सामान्य वितरण में अन्य गौसियन प्रकार के कार्यों के बीच अद्वितीय या विशेष रूप से उपयोगी है?- एक्स -एक्स2-एक्स2


अच्छी तरह से शुरू करने के लिए "मतलब" पढ़ना चाहिए "योग" नहीं।
ट्रिस्टन

2
योग भी। सब के बाद, यह सिर्फ नमूनों की संख्या से गुणा मतलब है।
एरिक

1
उद्धरण से पता चलता है कि खोज के लिए मुख्य शब्दों में "सामान्य वितरण" शामिल है। प्रदर्शन यहाँ है कि खोज के लिए इस साइट शुरू कर दिया के बाद से प्रति दिन एक औसत - 600 से अधिक धागे पाता है। इन हिट्स को कम समय देने से किसी को भी आँकड़ों में "घंटी की वक्र" की भूमिका की सराहना करने में मदद मिलेगी।
whuber

4
से शीर्ष मतदान सामान्य वितरण से संबंधित धागा , और गणितज्ञों क्योंकि उनका मानना है कि यह है;, प्रयोगकर्ताओं क्योंकि उन्हें लगता है कि यह गणित ने साबित कर दिया जा सकता है:: "हर कोई त्रुटियों [यानी, सामान्य वितरण] के घातीय कानून में विश्वास रखता है अवलोकन द्वारा स्थापित किया गया है। "
whuber

मेरे सवाल का जवाब देखें " गॉसियन
रॉबिन

जवाबों:


12

यह फ़ंक्शन महत्वपूर्ण होने का कारण वास्तव में सामान्य वितरण और इसके निकटता से जुड़ा हुआ साथी है, केंद्रीय सीमा प्रमेय (हमारे पास यहां अन्य प्रश्नों में CLT के कुछ अच्छे स्पष्टीकरण हैं)।

आँकड़ों में, CLT का उपयोग आम तौर पर प्रायिकताओं की गणना करने के लिए किया जा सकता है, "हम 95% आश्वस्त हैं कि ..." ("95% आत्मविश्वास का अर्थ" अक्सर गलत समझा जाता है), जैसे बयान देते हैं, लेकिन यह एक अलग मामला है)।

फ़ंक्शन सामान्य वितरण का घनत्व कार्य है। यदि एक यादृच्छिक मात्रा को सामान्य वितरण का उपयोग करके मॉडलिंग की जा सकती है, तो यह फ़ंक्शन बताता है कि उक्त मात्रा के विभिन्न संभावित मूल्य कितने संभावित हैं। उच्च घनत्व वाले क्षेत्रों में परिणाम कम घनत्व वाले क्षेत्रों में परिणामों की तुलना में अधिक होते हैं।exp(-(एक्स-μ)22σ2)

σ μ μ σ x = μ x μ σμ और ऐसे पैरामीटर हैं जो घनत्व फ़ंक्शन के स्थान और पैमाने को निर्धारित करते हैं। यह बारे में सममित है , इसलिए बदलने का अर्थ है कि आप फ़ंक्शन को दाईं ओर या बाईं ओर स्थानांतरित करते हैं। अपने अधिकतम ( ) पर घनत्व फ़ंक्शन का मान निर्धारित करता है और से दूर जाने पर कितनी जल्दी 0 हो जाता है । उस अर्थ में, बदलते फ़ंक्शन के पैमाने को बदल देते हैं।σμμσएक्स=μएक्सμσ

विशेष पसंद के लिए और घनत्व है (आनुपातिक) । यह इन मापदंडों का एक विशेष रूप से दिलचस्प विकल्प नहीं है, लेकिन इसमें एक घनत्व समारोह की उपज का लाभ है जो अन्य सभी की तुलना में थोड़ा सरल दिखता है।σ = 1 / μ=0 - एक्स 2σ=1/2-एक्स2

दूसरी ओर, हम परिवर्तनशील-चर द्वारा से किसी अन्य सामान्य घनत्व में जा सकते हैं । कारण यह है कि आपकी पाठ्यपुस्तक कहती है कि , और , बहुत नहीं है महत्वपूर्ण कार्य यह है कि लिखना सरल है। एक्स = यू - μ-एक्स2-एक्स2exp(-(एक्स-μ)2एक्स=यू-μ2σ-एक्स2-एक्स2exp(-(एक्स-μ)22σ2)-एक्स2


1
(+1) अंत से पहले अनुच्छेद के प्रथम वाक्य: मैं कह सकते हैं के लिए आनुपातिक है के स्थान पर है
कार्डिनल

@ कार्डिनल: धन्यवाद, आप काफी सही कह रहे हैं! मैंने उत्तर संपादित किया।
मॉन्सट

1
+1, मुझे वास्तव में यह उत्तर पसंद है। एक बात जो इंगित करने लायक हो सकती है, वह यह है कि सामान्य का पीडीएफ आमतौर पर साथ लिखा जाता है । कारण यह है कि वक्र के नीचे का कुल क्षेत्रफल बराबर है , लेकिन चूंकि पीडीएफ का एक विशिष्ट उपयोग संभाव्यताएं निर्धारित करने के लिए है (जो कि योग 1), यह क्षेत्र के लिए सुविधाजनक है वक्र के बराबर 1 के तहत, और इस प्रकार हम उस परिणाम को प्राप्त करने के लिए कुल से विभाजित करते हैं। मुझे लगता है कि आप सही हैं कि यह सरल दिखने के लिए छोड़ दिया गया है। 12πσ22πσ2
गंग -

3

आप ठीक कह रहे हैं, सामान्य वितरण या गाऊसी एक बढ़ाया और स्थानांतरित कर दिया है इतना के महत्व, तथ्य यह है कि यह अनिवार्य रूप से सामान्य वितरण है से ज्यादातर आता है।exp ( - x 2 )exp(-एक्स2)exp(-एक्स2)

और सामान्य वितरण मुख्य रूप से महत्वपूर्ण है क्योंकि ("हल्के नियमितता की शर्तों के तहत") कई स्वतंत्र और पहचाने जाने वाले यादृच्छिक चर का योग सामान्य तक पहुंचता है, जब "कई" अनंतता तक पहुंचते हैं।

सब कुछ सामान्य रूप से वितरित नहीं किया जाता है। उदाहरण के लिए, आपके सर्वेक्षण के परिणाम कम से कम नहीं हो सकते हैं, यदि प्रतिक्रियाएं निरंतर पैमाने पर भी नहीं हैं, लेकिन पूर्णांक 1-5 जैसी कोई चीज। लेकिन परिणाम का मतलब आम तौर पर दोहराया नमूनाकरण पर वितरित किया जाता है, क्योंकि इसका मतलब सिर्फ एक छोटा (सामान्यीकृत) योग है, और व्यक्तिगत प्रतिक्रियाएं एक दूसरे से स्वतंत्र हैं। नमूना मान लेना काफी बड़ा है, ज़ाहिर है, क्योंकि सख्ती से बोलने पर, सामान्यता केवल तब दिखाई देती है जब नमूना का आकार अनंत हो जाता है।

जैसा कि आप उदाहरण से देखते हैं, सामान्य वितरण अनुमान या मॉडलिंग प्रक्रिया के परिणामस्वरूप प्रकट हो सकता है, तब भी जब डेटा सामान्य रूप से वितरित नहीं किया जाता है। इसलिए सामान्य वितरण आंकड़ों में हर जगह हैं। बायेसियन आंकड़ों में, मापदंडों के कई पीछे के वितरण लगभग सामान्य हैं, या होने का अनुमान लगाया जा सकता है।


-एक्स2

वे पर्यायवाची नहीं हैं, यह इंगित करने के लिए धन्यवाद। (मेरा इरादा एक गैर-सांख्यिकीविद् के लिए सटीक, सिर्फ समझने योग्य नहीं था। पहले से ही एक अच्छा सटीक उत्तर है।)
scellus

-1

n01/nn


इस सवाल पर टिप्पणी के लिए एक चैट रूम बनाया गया है । chatack.stackexchange.com/rooms/3720/… । मैंने सभी (50!) टिप्पणियों को हटा दिया है और टिप्पणी तंत्र के आगे दुरुपयोग को रोकने के लिए इस पोस्ट को बंद कर दिया है।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.