सांख्यिकी और बिग डेटा

2

एक संभावना को सुधारने के लिए सुझाव और आंकड़े शीट को धोखा देते हैं

प्रसंग: केंद्र के टुकड़ों की संरचना करने के प्रयास में जो मैं संभाव्यता सिद्धांत और सांख्यिकी में आया हूं, मैंने गणितीय संदर्भों ( यहां उपलब्ध ) पर ध्यान केंद्रित करते हुए एक संदर्भ दस्तावेज बनाया । इस दस्तावेज़ को साझा करके, मैं इन विषयों के बारे में स्नातक पाठ्यक्रमों में …

22 teaching

2

दो पॉसों यादृच्छिक चर के अनुपात का वितरण क्या है?

मैं एक सवाल यादृच्छिक चर से संबंधित है। आइए मान लें कि हमारे पास दो यादृच्छिक चर और Y हैं । मान लें कि एक्स पोइसन को पैरामीटर λ 1 के साथ वितरित किया गया है , और वाई पोइसन को पैरामीटर λ 2 के साथ वितरित किया गया है …

22 random-variable poisson-distribution

1

आर 'फ़ंक्शंस' और 'प्रैम्पक' अलग-अलग ईजेंवल क्यों देते हैं?

इसे पुन: उत्पन्न करने के लिए आप डिकैथलॉन डेटासेट {FactoMineR} का उपयोग कर सकते हैं। सवाल यह है कि गणना किए गए आइजेनवेल्स कोवरियन मैट्रिक्स से भिन्न क्यों हैं। यहाँ का उपयोग कर eigenvalues हैं princomp: > library(FactoMineR);data(decathlon) > pr <- princomp(decathlon[1:10], cor=F) > pr$sd^2 Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 …

22 r pca

4

रैंक क्रम को सक्षम करने के लिए कई चर से गुणवत्ता का एक सूचकांक बनाना

मेरे पास चार संख्यात्मक चर हैं। ये सभी मिट्टी की गुणवत्ता के उपाय हैं। उच्चतर चर, उच्च गुणवत्ता। उन सभी के लिए सीमा अलग है: वर 1 से 10 तक वार 2 1000 से 2000 तक Var3 150 से 300 तक Var4 0 से 5 तक मुझे चार चर एकल …

22 ranking valuation

6

ग्राफ सिद्धांत - विश्लेषण और दृश्य

मुझे यकीन नहीं है कि विषय क्रॉसविलेक्टेड ब्याज में प्रवेश करता है। आप मुझे बताइएगा। मुझे एक ग्राफ ( ग्राफ सिद्धांत से ) का अध्ययन करना होगा । मेरे पास एक निश्चित संख्या में डॉट्स हैं जो जुड़े हुए हैं। मेरे पास सभी डॉट्स के साथ एक टेबल है और …

22 r data-visualization graph-theory

2

पीढ़ी बनाम भेदभावपूर्ण मॉडल (बायेसियन संदर्भ में)

जेनेरिक और भेदभावपूर्ण (भेदभावपूर्ण) मॉडल (बायेसियन सीखने और अनुमान के संदर्भ में) के बीच अंतर क्या हैं? और यह भविष्यवाणी, निर्णय सिद्धांत या अनुपयोगी शिक्षा से क्या संबंधित है?

22 bayesian predictive-models unsupervised-learning

1

बेंजामिन-होचबर्ग, पी-वैल्यू या क्यू-वैल्यू के साथ कई परिकल्पना परीक्षण सुधार?

स्वतंत्र परीक्षणों से उत्पन्न पी-मूल्यों की एक सूची को देखते हुए, आरोही क्रम में क्रमबद्ध, एक कई परीक्षण सुधार के लिए बेंजामिनी-होचबर्ग प्रक्रिया का उपयोग कर सकता है । प्रत्येक पी-मूल्य के लिए, बेंजामिनी-होचबर्ग प्रक्रिया आपको प्रत्येक पी-मान के लिए झूठी डिस्कवरी दर (एफडीआर) की गणना करने की अनुमति देती …

22 hypothesis-testing

2

केवल पिछली स्थिति के आधार पर मार्कोव प्रक्रिया

मैं चाहूंगा कि कोई मेरी समझ की पुष्टि करे या अगर मुझे कुछ याद आ रहा है। एक मार्कोव प्रक्रिया की परिभाषा कहती है कि अगला चरण केवल वर्तमान स्थिति पर निर्भर करता है और कोई पिछले राज्य नहीं। तो, मान लें कि हमारे पास a, b, c, d का …

22 markov-process

5

मैं एक गैर-सामान्य रूप से वितरित DV के लिए एनोवा परिणामों पर भरोसा कर सकता हूं?

मैंने एक दोहराया उपायों एनोवा के साथ एक प्रयोग का विश्लेषण किया है। ANOVA एक 3x2x2x2x3 है, जिसमें 2 विषय-संबंधी कारक हैं और 3 भीतर (N = 189) है। त्रुटि दर निर्भर चर है। त्रुटि दर के वितरण में ३.६४ का तिरछा और १५. has५ का कर्षण होता है। तिरछा …

22 anova normality-assumption

3

बहुसंकेतन डेटा के लिए सहसंयोजक मैट्रिक्स का निष्पक्ष अनुमान

पर्यावरण के नमूनों का रासायनिक विश्लेषण अक्सर रिपोर्टिंग सीमाओं या विभिन्न पहचान / मात्रात्मक सीमाओं पर नीचे सेंसर किया जाता है। उत्तरार्द्ध अलग-अलग हो सकता है, आमतौर पर अन्य चर के मूल्यों के अनुपात में। उदाहरण के लिए, एक यौगिक की उच्च सांद्रता वाले एक नमूने को विश्लेषण के लिए …

22 correlation estimation censoring covariance-matrix unbiased-estimator

6

एक पाँच बिंदु पर आइटम अंतर समूह

इस प्रश्न से निम्नलिखित : कल्पना कीजिए कि आप 5-बिंदु लिकर आइटम पर दो समूहों (जैसे, पुरुषों और महिलाओं) के बीच केंद्रीय प्रवृत्ति में अंतर के लिए परीक्षण करना चाहते हैं (उदाहरण के लिए, जीवन से संतुष्टि: संतुष्ट करने के लिए असंतुष्ट)। मुझे लगता है कि अधिकांश प्रयोजनों के लिए …

22 t-test ordinal-data likert scales

9

मैं यह कैसे पता लगाऊं कि पिंग प्रतिक्रिया समय पर इस तरह का वितरण किस तरह का प्रतिनिधित्व करता है?

मैंने एक वास्तविक विश्व प्रक्रिया, नेटवर्क पिंग समय का नमूना लिया है। "गोल-यात्रा-समय" को मिलीसेकंड में मापा जाता है। परिणाम हिस्टोग्राम में प्लॉट किए जाते हैं: पिंग समय का न्यूनतम मूल्य है, लेकिन एक लंबी ऊपरी पूंछ है। मैं जानना चाहता हूं कि यह सांख्यिकीय वितरण क्या है, और इसके …

22 distributions sample-size sample normality-assumption distribution-identification

1

रैखिक मॉडल के रूप में सामान्य सांख्यिकीय परीक्षण

(अद्यतन: मैंने इसमें गहराई से डुबकी लगाई और परिणामों को यहां पोस्ट किया ) नामित सांख्यिकीय परीक्षणों की सूची बहुत बड़ी है। आम परीक्षणों में से कई सरल रैखिक मॉडल से अनुमान पर भरोसा करते हैं, उदाहरण के लिए एक-नमूना टी-परीक्षण सिर्फ y = ε + against है जिसे null …

22 regression correlation anova t-test linear-model

4

क्या 50% 100% 25% से अधिक है या यह 25% 25% से अधिक है?

यदि मेरे पास दो मान A और B हैं जो दोनों C के प्रतिशत के रूप में व्यक्त किए गए हैं, और मैं A और B के बीच के अंतर को प्रतिशत D के रूप में व्यक्त करना चाहता हूं, तो क्या D को C के प्रतिशत के रूप में …

22 terminology percentage

2

एक अनुमानक की ओरेकल संपत्ति क्या है?

एक अनुमानक की ओरेकल संपत्ति क्या है ? मॉडलिंग लक्ष्य क्या है (भविष्यवाणी, व्याख्यात्मक, ...) के लिए प्रासंगिक ओरेकल संपत्ति है ? दोनों सैद्धांतिक रूप से कठोर और (विशेष रूप से) सहज स्पष्टीकरण का स्वागत है।

22 feature-selection model-selection estimators oracle