सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
कितनी अच्छी तरह से कई प्रतिगमन "के लिए नियंत्रण" covariates कर सकते हैं?
हम सभी अवलोकन संबंधी अध्ययनों से परिचित हैं जो एक गैर-आयामी भविष्यवक्ता एक्स के बीच एक कारण लिंक स्थापित करने का प्रयास करते हैं और एक परिणाम के रूप में हर कल्पनाशील संभावित कन्फ़्यूडर को कई प्रतिगमन मॉडल में शामिल करते हैं। इस प्रकार सभी कन्फ्यूजर्स के लिए "कंट्रोलिंग" के …

1
टाइप I, टाइप II और टाइप III एनोवा और मैनोवा की व्याख्या कैसे करें?
मेरा प्राथमिक प्रश्न है कि टाइप I (अनुक्रमिक) एनोवा का संचालन करते समय आउटपुट (गुणांक, एफ, पी) की व्याख्या कैसे की जाए? मेरी विशिष्ट शोध समस्या थोड़ी अधिक जटिल है, इसलिए मैं अपने उदाहरण को भागों में तोड़ूंगा। सबसे पहले, अगर मुझे प्लांट ग्रोथ (Y1) पर स्पाइडर घनत्व (X1) के …

6
वितरण के बीच कोलमोगोरोव के लिए प्रेरणा
यह मापने के कई तरीके हैं कि समान संभावना वाले दो वितरण कैसे हैं। उन विधियों में से जो लोकप्रिय हैं (अलग-अलग मंडलियों में): कोलमोगोरोव दूरी: वितरण कार्यों के बीच की दूरी; कांटोरोविच-रूबिनस्टीन दूरी: उम्मीदों के बीच का अधिकतम अंतर लिप्सकैट स्थिरांक साथ कार्यों के दो वितरणों को प्रभावित करता …

8
क्या सभी मॉडल बेकार हैं? क्या कोई सटीक मॉडल संभव है - या उपयोगी?
यह सवाल मेरे दिमाग में एक महीने से ज्यादा से ज्यादा घूम रहा है। अम्स्टैट न्यूज़ के फरवरी 2015 के अंक में बर्कले के प्रोफेसर मार्क वैन डेर लान का एक लेख शामिल है जो लोगों को अक्षम मॉडल का उपयोग करने के लिए डांटता है। वह कहते हैं कि …

10
वास्तव में बिग डेटा क्या है?
मुझे कई अवसरों पर सवाल पूछा गया है: बिग-डेटा क्या है? छात्रों और मेरे रिश्तेदारों द्वारा जो आंकड़े और एमएल के आसपास चर्चा उठा रहे हैं। मुझे यह सीवी-पोस्ट मिला । और मुझे लगता है कि मैं वहां एकमात्र जवाब से सहमत हूं। विकिपीडिया पृष्ठ भी इस पर कुछ टिप्पणी …
44 large-data 


4
अन्य फीचर मैप बनाने के लिए फीचर मैप्स पर गुठली कैसे लगाई जाती है?
मैं कंफर्टेबल न्यूरल नेटवर्क के कन्वेंशन पार्ट को समझने की कोशिश कर रहा हूं। निम्नलिखित आकृति को देखते हुए: मुझे पहली कनवल्शन लेयर को समझने में कोई समस्या नहीं है जहाँ हमारे पास 4 अलग-अलग कर्नेल हैं (आकार ), जो हम 4 इमेज मैप प्राप्त करने के लिए इनपुट इमेज …

4
सांख्यिकीविदों का कहना है कि गैर-महत्वपूर्ण परिणाम का अर्थ है "आप अशक्त को अस्वीकार नहीं कर सकते" के रूप में शून्य परिकल्पना को स्वीकार करने का विरोध किया?
पारंपरिक सांख्यिकीय परीक्षण, दो नमूना टी-टेस्ट की तरह, इस परिकल्पना को खत्म करने की कोशिश पर ध्यान केंद्रित करते हैं कि दो स्वतंत्र नमूनों के कार्य में कोई अंतर नहीं है। फिर, हम एक आत्मविश्वास स्तर चुनते हैं और कहते हैं कि यदि साधनों का अंतर 95% के स्तर से …

6
आपका पसंदीदा सांख्यिकीय ग्राफ क्या है?
यह मेरा पसंदीदा है यह उदाहरण एक हास्य नस में है (क्रेडिट मेरे एक पूर्व प्रोफेसर, स्टीवन गॉर्टमेकर के पास जाता है), लेकिन मुझे ग्राफ़ में भी दिलचस्पी है कि आप खूबसूरती से कब्जा कर लें और एक सांख्यिकीय अंतर्दृष्टि या विधि का संचार करें, साथ ही साथ आपके विचारों …

5
शैक्षणिक पत्रों में प्रकाशित आंकड़े
मैंने कई विकासवादी / पारिस्थितिक अकादमिक पत्रों को पढ़ा, कभी-कभी यह देखने के विशिष्ट उद्देश्य के साथ कि पाठ्यपुस्तक के बाहर 'वास्तविक दुनिया में' आँकड़ों का उपयोग कैसे किया जा रहा है। मैं आम तौर पर कागजात में आँकड़ों को सुसमाचार के रूप में लेता हूँ और अपने सांख्यिकीय सीखने …

1
कई यादृच्छिक चर के उत्पाद की भिन्नता
हम दो स्वतंत्र चर का उत्तर जानते हैं: V a r (X)Y) = ई( एक्स)2Y2) - ( ई( एक्स)Y) )2= वी एक आर ( एक्स) वी एक आर ( Y) + वी एक आर ( एक्स) ( ई( य) )2+ V a r ( Y) ( ई( एक्स)) )2Var(XY)=E(X2Y2)−(E(XY))2=Var(X)Var(Y)+Var(X)(E(Y))2+Var(Y)(E(X))2 {\rm …

3
पी-वैल्यू को मिलाते समय, औसत ही क्यों?
मैंने हाल ही में फिशर की विधि के बारे में सीखा है जो पी-वैल्यू को जोड़ती है। यह तथ्य यह है कि अशक्त के तहत पी-मूल्य और एक समान वितरण इस प्रकार है, कि पर आधारित है जो मुझे लगता है प्रतिभाशाली है। लेकिन मेरा सवाल यह है कि इस …

1
कंप्यूटिंग कोहेन का कप्पा विचरण (और मानक त्रुटियां)
दो रैपरों के बीच समझौते को मापने के लिए कोप्पा [1] द्वारा 1960 में कप्पा ( ) को पेश किया गया था। हालाँकि, इसका विचरण काफी समय से विरोधाभासों का स्रोत रहा था।κκ\kappa मेरा सवाल यह है कि बड़े नमूनों के साथ उपयोग किए जाने वाला सबसे अच्छा विचरण गणना …

7
कोई शास्त्रीय दृष्टिकोण के बजाय 'नॉनफॉर्मफॉर्मेटिव' अनुचित के साथ बायेसियन दृष्टिकोण का उपयोग क्यों करेगा?
यदि रुचि केवल एक मॉडल के मापदंडों (बिंदुवार और / या अंतराल अनुमान) का अनुमान लगा रही है और पूर्व जानकारी विश्वसनीय, कमजोर नहीं है, (मुझे पता है कि यह थोड़ा अस्पष्ट है, लेकिन मैं एक परिदृश्य स्थापित करने की कोशिश कर रहा हूं जहां एक की पसंद है पहले …

5
रैंडम फ़ॉरेस्ट एल्गोरिथ्म का अनुकूलित कार्यान्वयन
मैंने देखा है कि ALGLIB, Waffles और कुछ R संकुल जैसे यादृच्छिक वन के कुछ कार्यान्वयन हैं randomForest। क्या कोई मुझे बता सकता है कि क्या ये पुस्तकालय अत्यधिक अनुकूलित हैं? क्या वे मूल रूप से सांख्यिकीय सीखने के तत्वों में विस्तृत यादृच्छिक जंगलों के बराबर हैं या बहुत सारे …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.