"सामान्यीकरण" का क्या अर्थ है और यह कैसे सत्यापित करें कि नमूना या वितरण सामान्यीकृत है?


19

मेरा एक प्रश्न है जिसमें यह सत्यापित करने के लिए कहा जाता है कि क्या वर्दी वितरण ( सामान्यीकृत है।Uniform(a,b)

  1. एक के लिए, किसी भी वितरण को सामान्य बनाने के लिए इसका क्या मतलब है?
  2. और दो, हम यह सत्यापित करने के बारे में क्या कहते हैं कि वितरण सामान्यीकृत है या नहीं?

मैं गणना करके समझता हूं कि हमें सामान्यीकृत डेटा मिलता है , लेकिन यहां यह सत्यापित करने के लिए कहा जा रहा है कि वितरण सामान्यीकृत है या नहीं।

Xmeansd

3
सामान्यीकृत होने के लिए वितरण के लिए इसका क्या अर्थ है, यह इतना आसान नहीं है (और यह आमतौर पर वितरण को सामान्यीकृत नहीं किया जाता है, लेकिन यादृच्छिक चर)। उदाहरण के लिए, वर्दी के मामले में, कुछ लोगों का मतलब हो सकता है "एक मानक वर्दी प्राप्त करने के लिए रेखीय रूप से बढ़े हुए" (यानी और ) ... जबकि दूसरे व्यक्ति का मतलब हो सकता है "रैखिक रूप से बढ़ाया गया मतलब पाने के लिए 0 और एसडी 1 "। वर्दी के लिए, मैं आम तौर पर पहले मान लेता हूं, लेकिन जैसा कि आप नीचे एक उत्तर से देखते हैं, अन्य लोग इसे कुछ और मतलब निकाल सकते हैं। सबसे अच्छा विकल्प यह है कि शब्द का उपयोग करने वाले व्यक्ति को कम अस्पष्ट कहा जाए। बी = 1a=0b=1
Glen_b -Reinstate मोनिका

1
अधिक पारंपरिक शब्दों को मानकीकृत किया जाता है (शून्य और एसडी के एक माध्य को प्राप्त करने के लिए) और सामान्यीकृत (अंतराल को सीमा तक लाने के लिए या लिए एक वेक्टर मानक को फिर से व्यवस्थित करने के लिए )। इस प्रकार -रे एक मानकीकरण है, जबकि एक घनत्व को एक स्थिर से गुणा करते हुए एक है सामान्य क्योंकि, है के आदर्श । एक्स ( एक्स - माध्य ) / एस डी[0,1]1X(Xmean)/SDसी - सी ( एक्स ) एक्स = 1fCCf(x)dx=1L 1 ff(x)dxL1f
whuber

Math.SE पर भी पूछा।
दिलीप सरवटे

1
कृपया क्रॉस-पोस्ट न करें , @Ada। वह एसई नीति के खिलाफ है। यदि आप 1 साइट पर एक क्यू पोस्ट करते हैं और फिर सोचते हैं कि आपको इसे दूसरे पर पोस्ट करना चाहिए था, तो अपने क्यू को ध्वजांकित करें और मध्यस्थों को आपके लिए इसे स्थानांतरित करने के लिए कहें।
गूँग - मोनिका

जवाबों:


34

दुर्भाग्य से, शब्दों का उपयोग अलग-अलग क्षेत्रों में अलग-अलग लोगों द्वारा, एक ही फ़ील्ड के भीतर, इत्यादि में किया जाता है, इसलिए मुझे यकीन नहीं है कि यहाँ आपके लिए इसका कितना अच्छा उत्तर दिया जा सकता है। आपको यह सुनिश्चित करना चाहिए कि आप परिभाषा को जानते हैं कि आपका प्रशिक्षक / पाठ्यपुस्तक "सामान्यीकृत" के लिए उपयोग कर रहा है। हालांकि, यहां कुछ सामान्य परिभाषाएं दी गई हैं:

केंद्रित: मानकीकृत: सामान्यीकृत: इस अर्थ में सामान्य करना आपके डेटा को यूनिट अंतराल तक बचाता है। मानकीकरण आपके डेटा को -scores में बदल देता है, @Jeff नोट्स के रूप में। और केन्द्रित करना आपके डेटा के साधन को बराबर बनाता है । X - माध्य

Xmean
Xmeansd
Xmin(X)max(X)min(X)
z0

यहां यह पहचानने योग्य है कि ये तीनों रैखिक परिवर्तन हैं ; जैसे, वे आपके वितरण का आकार नहीं बदलते हैं । यही कारण है कि कभी-कभी लोग कहते हैं, है की वजह से -score परिवर्तन "सामान्य" और विश्वास है, सामान्य वितरण के साथ -scores एसोसिएशन, कि यह उनके डेटा बना दिया है सामान्य रूप से वितरित। ऐसा नहीं है (जैसा कि @ जेफ भी नोट करता है, और जैसा कि आप पहले और बाद में अपने डेटा को प्लॉट करके बता सकते हैं)। क्या आपको दिलचस्पी होनी चाहिए, आप उदाहरण के लिए, परिवर्तनों के बॉक्स-कॉक्स परिवार का उपयोग करके अपने डेटा का आकार बदल सकते हैं । zz

आप इन परिवर्तनों को कैसे सत्यापित कर सकते हैं, इस संबंध में , यह इस बात पर निर्भर करता है कि इसका वास्तव में क्या मतलब है। यदि उनका मतलब केवल यह जांचना है कि कोड ठीक से चला है, तो आप साधन, एसडी, न्यूनतम और अधिकतम जांच कर सकते हैं।


1
मैंने मानकीकृत का उपयोग करने के लिए या मानक सामान्य वितरण पर फिट होने के लिए सुझाव देने के लिए सामान्यीकृत उपयोग को देखा है अर्थात , इसलिए सामान्यीकृत तीनों को गलत समझा जाता है। Ada की संभावना एक सामान्य रूप से कार्य करने के लिए स्थिर सामान्यीकरण के अनुप्रयोग की टिप्पणी अभी तक एक और संभावित व्याख्या है। Φ1(F(X))
हेनरी

4

अपने नमूने में आपके द्वारा दिए गए फॉर्मूले का उपयोग करके, आप उन सभी को z- स्कोर में परिवर्तित कर रहे हैं ।

यह सत्यापित करने के लिए कि आपने सभी z- स्कोर की गणना सही ढंग से की है, अपने नमूने का नया मतलब और मानक विचलन खोजें। यदि माध्य और मानक विचलन , तो आपने सब कुछ सही ढंग से किया है।01

ऐसा करने का उद्देश्य आपके नमूने के मानक विचलन के सापेक्ष इकाइयों में सब कुछ डालना है। यह कई उद्देश्यों के लिए उपयोगी हो सकता है, जैसे कि दो अलग-अलग डेटा सेटों की तुलना करना जो विभिन्न इकाइयों (सेंटीमीटर और इंच, शायद) का उपयोग करके बनाए गए थे।

यह महत्वपूर्ण है कि यह पूछना सामान्य न हो कि वितरण सामान्य है या नहीं , क्या यह गौसियन वितरण का अनुमान लगाता है ।


इसलिए यह जाँचने के लिए कि क्या यूनिफ़ॉर्म वितरण को सामान्य किया गया था या नहीं, क्या यह E (X) = 0 और Var (X) = 1 के बराबर होगा जहाँ X ~ यूनिफ़ॉर्म (a, b) होगा?

2
डेटा को एक समान वितरण से होना भी नहीं है, वे किसी भी वितरण से हो सकते हैं। इसके अलावा, यह केवल आपके द्वारा प्रदान किए गए सूत्र का उपयोग करने के लिए सही है; डेटा z- स्कोर का उपयोग करने के अलावा अन्य तरीकों से सामान्य किया जा सकता है। उदाहरण के लिए, IQ स्कोर को 100 के स्कोर और 15. के मानक विचलन के साथ सामान्यीकृत किया जाता है
जेफ

1

प्रादेशिक सेना से परामर्श के बाद, जो सवाल पूछ रहा था कि क्या

f(x)dx=1

जहां इस मामले में वर्दी का घनत्व (ए, बी) है।f(x)


2
यहां उपयोग करने की शब्दावली यह है कि वितरण की संभावना घनत्व फ़ंक्शन सामान्यीकृत है। क्योंकि यह स्वयंसिद्ध तथ्य को दर्शाता है कि कुल संभावना बराबर होनी चाहिए , यह पूछते हुए कि क्या कोई वितरण स्वयं सामान्यीकृत है (इस अर्थ में) हमेशा एक ही तुच्छ उत्तर है: बेशक। 1
whuber

यह वही है जिसे हमें सत्यापित करने के लिए कहा जाता है। f (x) को वास्तव में एक pdf नहीं होना है, और यह कोई भी गैर-नकारात्मक कार्य हो सकता है। किसी भी गैर-नकारात्मक कार्य के लिए, जहाँ ऊपर संतुष्ट नहीं होता है, हम हमेशा एक सामान्य स्थिरांक से गुणा कर सकते हैं
Ada

1
हर बार नहीं। उदाहरण के लिए, , सभी वास्तविक संख्याओं पर परिभाषित एक गैर-नकारात्मक फ़ंक्शन है: कोई सामान्यीकरण स्थिर नहीं है। लेकिन जब आपको बताया जाता है, जैसा कि आपके प्रश्न कथन में है, कि "so-so-PDF इस तरह के और इस तरह के वितरण के लिए PDF है" तो सत्यापित करने के लिए जो कुछ भी नहीं है: परिभाषा के अनुसार यह एकता के लिए एकीकृत है। f(x)=ex
whuber

यह सच है कि कोई भी गैर-नकारात्मक फ़ंक्शन नहीं है जहां हम इसे उपरोक्त स्थिति को संतुष्ट कर सकते हैं भले ही हम एक सामान्य स्थिरांक से गुणा करें।
एडीए
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.