जवाबों:
सामान्यता की धारणा सिर्फ यह है कि ब्याज के अंतर्निहित यादृच्छिक चर को सामान्य रूप से वितरित किया जाता है , या लगभग ऐसा ही है। सहज रूप से, सामान्यता को बड़ी संख्या में स्वतंत्र यादृच्छिक घटनाओं के योग के रूप में समझा जा सकता है।
अधिक विशेष रूप से, सामान्य वितरण निम्नलिखित फ़ंक्शन द्वारा परिभाषित किए गए हैं:
जहां और σ 2 , मतलब और विचरण कर रहे हैं क्रमशः, और जो रूप में प्रकट होता है:
इसे कई तरीकों से जांचा जा सकता है , जो कि कमोबेश अपनी समस्याओं के अनुकूल हो सकता है, जैसे कि n का आकार। असल में, वे सभी सुविधाओं के लिए परीक्षण करते हैं यदि वितरण सामान्य था (उदाहरण के लिए अपेक्षित मात्रात्मक वितरण )।
एक नोट: सामान्यता की धारणा अक्सर आपके चर के बारे में नहीं होती है, लेकिन त्रुटि के बारे में होती है, जो अवशिष्ट द्वारा अनुमानित की जाती है। उदाहरण के लिए, रैखिक प्रतिगमन ; कोई धारणा नहीं है कि वाई सामान्य रूप से वितरित किया जाता है, केवल वह ई है।
एक संबंधित प्रश्न यहां त्रुटि की सामान्य धारणा के बारे में पाया जा सकता है (या आमतौर पर डेटा की अधिक जानकारी अगर हमें डेटा के बारे में पूर्व ज्ञान नहीं है)।
मूल रूप से,
वहाँ से एक महत्वपूर्ण नोट यह है कि, जैसा कि टेरेंस ताओ ने यहां कहा है , "मोटे तौर पर, यह प्रमेय जोर देता है कि यदि कोई एक आँकड़ा लेता है जो कई स्वतंत्र और बेतरतीब उतार-चढ़ाव वाले घटकों का एक संयोजन होता है, जिसमें कोई भी घटक पूरे पर एक निर्णायक प्रभाव नहीं रखता है। , फिर उस आंकड़े को लगभग सामान्य वितरण नामक कानून के अनुसार वितरित किया जाएगा।
इसे स्पष्ट करने के लिए, मुझे एक पायथन कोड स्निपेट लिखना चाहिए
# -*- coding: utf-8 -*-
"""
Illustration of the central limit theorem
@author: İsmail Arı, http://ismailari.com
@date: 31.03.2011
"""
import scipy, scipy.stats
import numpy as np
import pylab
#===============================================================
# Uncomment one of the distributions below and observe the result
#===============================================================
x = scipy.linspace(0,10,11)
#y = scipy.stats.binom.pmf(x,10,0.2) # binom
#y = scipy.stats.expon.pdf(x,scale=4) # exp
#y = scipy.stats.gamma.pdf(x,2) # gamma
#y = np.ones(np.size(x)) # uniform
y = scipy.random.random(np.size(x)) # random
y = y / sum(y);
N = 3
ax = pylab.subplot(N+1,1,1)
pylab.plot(x,y)
# Plotting details
ax.set_xticks([10])
ax.axis([0, 2**N * 10, 0, np.max(y)*1.1])
ax.set_yticks([round(np.max(y),2)])
#===============================================================
# Plots
#===============================================================
for i in np.arange(N)+1:
y = np.convolve(y,y)
y = y / sum(y);
x = np.linspace(2*np.min(x), 2*np.max(x), len(y))
ax = pylab.subplot(N+1,1,i+1)
pylab.plot(x,y)
ax.axis([0, 2**N * 10, 0, np.max(y)*1.1])
ax.set_xticks([2**i * 10])
ax.set_yticks([round(np.max(y),3)])
pylab.show()
जैसा कि आंकड़ों से देखा जा सकता है, परिणामस्वरूप वितरण (योग) व्यक्तिगत वितरण प्रकारों की परवाह किए बिना एक सामान्य वितरण की ओर जाता है। इसलिए, यदि हमारे पास डेटा में अंतर्निहित प्रभावों के बारे में पर्याप्त जानकारी नहीं है, तो सामान्य धारणा उचित है।
आप नहीं जान सकते कि सामान्यता है या नहीं और इसीलिए आपको एक धारणा बनानी होगी। आप केवल सांख्यिकीय परीक्षणों के साथ सामान्यता की अनुपस्थिति को साबित कर सकते हैं।
इससे भी बदतर, जब आप वास्तविक विश्व डेटा के साथ काम करते हैं तो यह लगभग निश्चित है कि आपके डेटा में सही सामान्यता नहीं है।
इसका मतलब है कि आपका सांख्यिकीय परीक्षण हमेशा थोड़ा पक्षपाती होता है। सवाल यह है कि क्या आप इसके साथ पक्षपात कर सकते हैं। ऐसा करने के लिए आपको अपने डेटा और उस तरह की सामान्यता को समझना होगा जो आपका सांख्यिकीय उपकरण मानता है।
यही कारण है कि फ्रीक्वेंटिस्ट टूल बायेसियन टूल के रूप में व्यक्तिपरक हैं। आप उस डेटा के आधार पर निर्धारित नहीं कर सकते हैं जो सामान्य रूप से वितरित किया गया है। आपको सामान्यता माननी होगी।
सामान्यता की धारणा यह मानती है कि आपका डेटा सामान्य रूप से वितरित किया जाता है (घंटी वक्र, या गाऊसी वितरण)। आप डेटा की साजिश रचने या कर्टोसिस के उपायों की जाँच करके (चोटी कितना तेज है) और तिरछापन (?) (यदि आधा से अधिक डेटा शिखर के एक तरफ है) की जाँच कर सकते हैं।
अन्य उत्तरों में शामिल है कि सामान्यता क्या है और सामान्यता परीक्षण विधियों का सुझाव दिया गया है। क्रिश्चियन ने कहा कि व्यवहार में पूर्ण सामान्यता मुश्किल से मौजूद है।
मैं इस बात पर प्रकाश डालता हूं कि सामान्यता से विचलन का मतलब यह नहीं है कि सामान्यता मानने वाले तरीकों का उपयोग नहीं किया जा सकता है, और सामान्यता परीक्षण बहुत उपयोगी नहीं हो सकता है।
इस तीन मान्यताओं में से, 2) और 3) ज्यादातर वासली 1 से अधिक महत्वपूर्ण हैं)! इसलिए आपको उनके साथ खुद को ज्यादा व्यस्त रखना चाहिए। जॉर्ज बॉक्स ने "" "की लाइन में कुछ कहा था" भिन्नताओं पर एक प्रारंभिक परीक्षण करने के बजाय एक समुद्री नाव में समुद्र में डालने की तरह है ताकि यह पता लगाया जा सके कि क्या महासागर लाइनर को बंदरगाह छोड़ने के लिए स्थितियां पर्याप्त रूप से शांत हैं! "- [बॉक्स," गैर -अनुमानों पर परीक्षण और परीक्षण ", 1953, बायोमेट्रिक 40, पीपी। 318-335]"
इसका मतलब यह है कि, असमान परिवर्तन बहुत चिंता का विषय है, लेकिन वास्तव में उनके लिए परीक्षण बहुत कठिन है, क्योंकि परीक्षण गैर-सामान्यता से इतने छोटे रूप से प्रभावित होते हैं कि साधनों के परीक्षण के लिए इसका कोई महत्व नहीं है। आज, असमान भिन्नताओं के लिए गैर-पैरामीट्रिक परीक्षण हैं जिनका उपयोग DEFINITELY किया जाना चाहिए।
संक्षेप में, अपने आप को असमान रूपांतरों के बारे में पहले से बताएं, फिर सामान्यता के बारे में। जब आपने उनके बारे में अपनी राय बना ली है, तो आप सामान्यता के बारे में सोच सकते हैं!
यहाँ अच्छी सलाह के एक बहुत है: http://rfd.uoregon.edu/files/rfd/StatisticalResources/glm10_homog_var.txt