सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
एक संभावना को सुधारने के लिए सुझाव और आंकड़े शीट को धोखा देते हैं
प्रसंग: केंद्र के टुकड़ों की संरचना करने के प्रयास में जो मैं संभाव्यता सिद्धांत और सांख्यिकी में आया हूं, मैंने गणितीय संदर्भों ( यहां उपलब्ध ) पर ध्यान केंद्रित करते हुए एक संदर्भ दस्तावेज बनाया । इस दस्तावेज़ को साझा करके, मैं इन विषयों के बारे में स्नातक पाठ्यक्रमों में …
22 teaching 

2
दो पॉसों यादृच्छिक चर के अनुपात का वितरण क्या है?
मैं एक सवाल यादृच्छिक चर से संबंधित है। आइए मान लें कि हमारे पास दो यादृच्छिक चर और Y हैं । मान लें कि एक्स पोइसन को पैरामीटर λ 1 के साथ वितरित किया गया है , और वाई पोइसन को पैरामीटर λ 2 के साथ वितरित किया गया है …

1
आर 'फ़ंक्शंस' और 'प्रैम्पक' अलग-अलग ईजेंवल क्यों देते हैं?
इसे पुन: उत्पन्न करने के लिए आप डिकैथलॉन डेटासेट {FactoMineR} का उपयोग कर सकते हैं। सवाल यह है कि गणना किए गए आइजेनवेल्स कोवरियन मैट्रिक्स से भिन्न क्यों हैं। यहाँ का उपयोग कर eigenvalues ​​हैं princomp: > library(FactoMineR);data(decathlon) > pr <- princomp(decathlon[1:10], cor=F) > pr$sd^2 Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 …
22 r  pca 

4
रैंक क्रम को सक्षम करने के लिए कई चर से गुणवत्ता का एक सूचकांक बनाना
मेरे पास चार संख्यात्मक चर हैं। ये सभी मिट्टी की गुणवत्ता के उपाय हैं। उच्चतर चर, उच्च गुणवत्ता। उन सभी के लिए सीमा अलग है: वर 1 से 10 तक वार 2 1000 से 2000 तक Var3 150 से 300 तक Var4 0 से 5 तक मुझे चार चर एकल …

6
ग्राफ सिद्धांत - विश्लेषण और दृश्य
मुझे यकीन नहीं है कि विषय क्रॉसविलेक्टेड ब्याज में प्रवेश करता है। आप मुझे बताइएगा। मुझे एक ग्राफ ( ग्राफ सिद्धांत से ) का अध्ययन करना होगा । मेरे पास एक निश्चित संख्या में डॉट्स हैं जो जुड़े हुए हैं। मेरे पास सभी डॉट्स के साथ एक टेबल है और …

2
पीढ़ी बनाम भेदभावपूर्ण मॉडल (बायेसियन संदर्भ में)
जेनेरिक और भेदभावपूर्ण (भेदभावपूर्ण) मॉडल (बायेसियन सीखने और अनुमान के संदर्भ में) के बीच अंतर क्या हैं? और यह भविष्यवाणी, निर्णय सिद्धांत या अनुपयोगी शिक्षा से क्या संबंधित है?

1
बेंजामिन-होचबर्ग, पी-वैल्यू या क्यू-वैल्यू के साथ कई परिकल्पना परीक्षण सुधार?
स्वतंत्र परीक्षणों से उत्पन्न पी-मूल्यों की एक सूची को देखते हुए, आरोही क्रम में क्रमबद्ध, एक कई परीक्षण सुधार के लिए बेंजामिनी-होचबर्ग प्रक्रिया का उपयोग कर सकता है । प्रत्येक पी-मूल्य के लिए, बेंजामिनी-होचबर्ग प्रक्रिया आपको प्रत्येक पी-मान के लिए झूठी डिस्कवरी दर (एफडीआर) की गणना करने की अनुमति देती …

2
केवल पिछली स्थिति के आधार पर मार्कोव प्रक्रिया
मैं चाहूंगा कि कोई मेरी समझ की पुष्टि करे या अगर मुझे कुछ याद आ रहा है। एक मार्कोव प्रक्रिया की परिभाषा कहती है कि अगला चरण केवल वर्तमान स्थिति पर निर्भर करता है और कोई पिछले राज्य नहीं। तो, मान लें कि हमारे पास a, b, c, d का …

5
मैं एक गैर-सामान्य रूप से वितरित DV के लिए एनोवा परिणामों पर भरोसा कर सकता हूं?
मैंने एक दोहराया उपायों एनोवा के साथ एक प्रयोग का विश्लेषण किया है। ANOVA एक 3x2x2x2x3 है, जिसमें 2 विषय-संबंधी कारक हैं और 3 भीतर (N = 189) है। त्रुटि दर निर्भर चर है। त्रुटि दर के वितरण में ३.६४ का तिरछा और १५. has५ का कर्षण होता है। तिरछा …

3
बहुसंकेतन डेटा के लिए सहसंयोजक मैट्रिक्स का निष्पक्ष अनुमान
पर्यावरण के नमूनों का रासायनिक विश्लेषण अक्सर रिपोर्टिंग सीमाओं या विभिन्न पहचान / मात्रात्मक सीमाओं पर नीचे सेंसर किया जाता है। उत्तरार्द्ध अलग-अलग हो सकता है, आमतौर पर अन्य चर के मूल्यों के अनुपात में। उदाहरण के लिए, एक यौगिक की उच्च सांद्रता वाले एक नमूने को विश्लेषण के लिए …

6
एक पाँच बिंदु पर आइटम अंतर समूह
इस प्रश्न से निम्नलिखित : कल्पना कीजिए कि आप 5-बिंदु लिकर आइटम पर दो समूहों (जैसे, पुरुषों और महिलाओं) के बीच केंद्रीय प्रवृत्ति में अंतर के लिए परीक्षण करना चाहते हैं (उदाहरण के लिए, जीवन से संतुष्टि: संतुष्ट करने के लिए असंतुष्ट)। मुझे लगता है कि अधिकांश प्रयोजनों के लिए …

9
मैं यह कैसे पता लगाऊं कि पिंग प्रतिक्रिया समय पर इस तरह का वितरण किस तरह का प्रतिनिधित्व करता है?
मैंने एक वास्तविक विश्व प्रक्रिया, नेटवर्क पिंग समय का नमूना लिया है। "गोल-यात्रा-समय" को मिलीसेकंड में मापा जाता है। परिणाम हिस्टोग्राम में प्लॉट किए जाते हैं: पिंग समय का न्यूनतम मूल्य है, लेकिन एक लंबी ऊपरी पूंछ है। मैं जानना चाहता हूं कि यह सांख्यिकीय वितरण क्या है, और इसके …

1
रैखिक मॉडल के रूप में सामान्य सांख्यिकीय परीक्षण
(अद्यतन: मैंने इसमें गहराई से डुबकी लगाई और परिणामों को यहां पोस्ट किया ) नामित सांख्यिकीय परीक्षणों की सूची बहुत बड़ी है। आम परीक्षणों में से कई सरल रैखिक मॉडल से अनुमान पर भरोसा करते हैं, उदाहरण के लिए एक-नमूना टी-परीक्षण सिर्फ y = ε + against है जिसे null …

4
क्या 50% 100% 25% से अधिक है या यह 25% 25% से अधिक है?
यदि मेरे पास दो मान A और B हैं जो दोनों C के प्रतिशत के रूप में व्यक्त किए गए हैं, और मैं A और B के बीच के अंतर को प्रतिशत D के रूप में व्यक्त करना चाहता हूं, तो क्या D को C के प्रतिशत के रूप में …

2
एक अनुमानक की ओरेकल संपत्ति क्या है?
एक अनुमानक की ओरेकल संपत्ति क्या है ? मॉडलिंग लक्ष्य क्या है (भविष्यवाणी, व्याख्यात्मक, ...) के लिए प्रासंगिक ओरेकल संपत्ति है ? दोनों सैद्धांतिक रूप से कठोर और (विशेष रूप से) सहज स्पष्टीकरण का स्वागत है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.