सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

16
क्या सामान्यता परीक्षण 'अनिवार्य रूप से बेकार' है?
एक पूर्व सहयोगी ने एक बार मुझसे निम्न प्रकार से तर्क दिया: हम आमतौर पर प्रक्रियाओं के परिणामों के लिए सामान्यता परीक्षण लागू करते हैं, जो अशक्त के तहत, यादृच्छिक चर उत्पन्न करते हैं जो केवल asymptotically या लगभग सामान्य होते हैं (कुछ मात्रा पर निर्भर 'asymptotically' भाग के साथ …

7
कई प्रतिगमन का संचालन करते समय, आपको अपने भविष्यवक्ता चर को कब केंद्रित करना चाहिए और कब उन्हें मानकीकृत करना चाहिए?
कुछ साहित्य में, मैंने पढ़ा है कि कई व्याख्यात्मक चर के साथ एक प्रतिगमन, यदि विभिन्न इकाइयों में, मानकीकृत होने की आवश्यकता है। (मानकीकरण में माध्य को घटाना और मानक विचलन द्वारा विभाजित करना शामिल है।) अन्य मामलों में मुझे अपने डेटा को मानकीकृत करने की आवश्यकता है? क्या ऐसे …

9
निश्चित प्रभाव, यादृच्छिक प्रभाव और मिश्रित प्रभाव मॉडल के बीच अंतर क्या है?
सरल शब्दों में, आप कैसे बताएंगे (शायद सरल उदाहरणों के साथ) निश्चित प्रभाव, यादृच्छिक प्रभाव और मिश्रित प्रभाव मॉडल के बीच का अंतर?

6
0-1 रेंज में डेटा को सामान्य कैसे करें?
मैं सामान्य करने में खो गया हूं, क्या कोई मुझे मार्गदर्शन दे सकता है। -23.89 और 7.54990767 क्रमशः मेरा न्यूनतम और अधिकतम मान है। अगर मुझे 5.6878 का मान मिलता है तो मैं इस मान को 0 से 1 के पैमाने पर कैसे माप सकता हूं।

11
स्वतंत्रता की डिग्री कैसे समझें?
से विकिपीडिया , वहाँ एक आंकड़े के स्वतंत्रता की डिग्री की तीन व्याख्याओं हैं: आंकड़ों में, स्वतंत्रता की डिग्री की संख्या एक आंकड़े की अंतिम गणना में मूल्यों की संख्या है जो अलग-अलग होने के लिए स्वतंत्र हैं । सांख्यिकीय मापदंडों का अनुमान विभिन्न मात्रा में जानकारी या डेटा पर …


16
सांख्यिकीय परीक्षणों में p मान और t मान का क्या अर्थ है?
एक सांख्यिकी पाठ्यक्रम लेने और फिर साथी छात्रों की मदद करने की कोशिश करने के बाद, मैंने एक विषय पर ध्यान दिया, जो बहुत हेड-डेस्क बैंगिंग को प्रेरित करता है, सांख्यिकीय परिकल्पना परीक्षणों के परिणामों की व्याख्या कर रहा है। ऐसा लगता है कि छात्र आसानी से किसी दिए गए …

7
मशीन लर्निंग में बैगिंग, बूस्टिंग और स्टैकिंग
इन 3 तरीकों में क्या समानताएं और अंतर हैं: जीतना, बढ़ाने, स्टैकिंग? सबसे अच्छा कौन सा है? और क्यों? क्या आप मुझे प्रत्येक के लिए एक उदाहरण दे सकते हैं?


8
यूक्लिडियन दूरी उच्च आयामों में एक अच्छी मीट्रिक क्यों नहीं है?
मैंने पढ़ा कि 'यूक्लिडियन दूरी उच्च आयामों में एक अच्छी दूरी नहीं है'। मुझे लगता है कि इस कथन का आयामीता के अभिशाप से कुछ लेना देना है, लेकिन वास्तव में क्या? इसके अलावा, 'उच्च आयाम' क्या है? मैं 100 विशेषताओं के साथ यूक्लिडियन दूरी का उपयोग करते हुए पदानुक्रमिक …

2
आर के एलएम () आउटपुट की व्याख्या
R में मदद पृष्ठ मान लेते हैं कि मुझे पता है कि उन संख्याओं का क्या मतलब है, लेकिन मैं नहीं। मैं यहाँ हर नंबर को वास्तव में सहजता से समझने की कोशिश कर रहा हूँ। मैं सिर्फ आउटपुट पोस्ट करूंगा और जो मुझे पता चला है उस पर टिप्पणी …

6
क्या
मैं कॉस्मा शालिज़ी (विशेष रूप से, दूसरे व्याख्यान के खंड 2.1.1 ) द्वारा कुछ व्याख्यान नोट्स के माध्यम से स्किमिंग कर रहा था , और याद दिलाया गया था कि आप बहुत कम आर 2 प्राप्त कर सकते हैंR2R2R^2 आपके पास पूरी तरह से रैखिक मॉडल होने पर भी आपको …

9
एक विश्वास अंतराल और एक विश्वसनीय अंतराल के बीच अंतर क्या है?
जोरिस और श्रीकांत की विनिमय यहाँ (फिर) सोच विश्वास के अंतराल और विश्वसनीय अंतराल के बीच अंतर के लिए अपने आंतरिक स्पष्टीकरण सही लोगों थे मुझे मिल गया। आप अंतर कैसे समझाएंगे?


12
95% कॉन्फिडेंस इंटरवल (CI) का अर्थ होने के 95% संभावना क्यों नहीं है?
ऐसा लगता है कि विभिन्न संबंधित प्रश्नों के माध्यम से, यहाँ आम सहमति है कि "95%" जिस हिस्से को हम "95% विश्वास अंतराल" कहते हैं, वह इस तथ्य को संदर्भित करता है कि यदि हम कई बार अपनी नमूनाकरण और सीआई-संगणना प्रक्रियाओं को दोहराते थे। , इस तरह से गणना …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.