सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

7
छोटे नमूनों में टी-टेस्ट या गैर-पैरामीट्रिक परीक्षण जैसे विलकॉक्सन के बीच चयन कैसे करें
कुछ परिकल्पनाओं का परीक्षण स्टूडेंट के टी - टेस्ट (दो-नमूने के मामले में असमान रूपांतरों के लिए वेल्च के सुधार का उपयोग करके), या विल्कोक्सॉन की तरह गैर-पैरामीट्रिक परीक्षण द्वारा हस्ताक्षरित रैंक टेस्ट, विलकॉक्सन-मैन-व्हिटनी यू टेस्ट, का उपयोग करके किया जा सकता है। या युग्मित हस्ताक्षर परीक्षण। हम एक कैसे …

4
कैसे स्पष्ट रूप से समझाने के लिए कि एक गिरी क्या है?
कई मशीन लर्निंग क्लासीफायर (जैसे वेक्टर मशीनों का समर्थन) एक कर्नेल को निर्दिष्ट करने की अनुमति देते हैं। यह समझाने का एक सहज तरीका क्या होगा कि एक कर्नेल क्या है? एक पहलू जिसके बारे में मैं सोच रहा हूं वह है रैखिक और गैर-रेखीय गुठली के बीच का अंतर। …


6
क्या बैकप्रॉपैगैशन के बिना तंत्रिका नेटवर्क को प्रशिक्षित करना संभव है?
कई तंत्रिका नेटवर्क किताबें और ट्यूटोरियल बैकप्रॉपैगैशन एल्गोरिथ्म पर बहुत समय बिताते हैं, जो अनिवार्य रूप से ढाल की गणना करने के लिए एक उपकरण है। मान लें कि हम ~ 10K पैरामीटर / वेट के साथ एक मॉडल बना रहे हैं। क्या कुछ ढाल मुक्त अनुकूलन एल्गोरिदम का उपयोग …


2
हम "जंगली में" पी-हैकिंग के बारे में कितना जानते हैं?
वाक्यांश p -hacking (यह भी: "डेटा ड्रेजिंग" , "स्नूपिंग" या "फिशिंग") विभिन्न प्रकार के सांख्यिकीय कदाचार को संदर्भित करता है जिसमें परिणाम कृत्रिम रूप से सांख्यिकीय रूप से महत्वपूर्ण हो जाते हैं। "अधिक महत्वपूर्ण" परिणाम प्राप्त करने के कई तरीके हैं, जिनमें शामिल हैं, लेकिन किसी भी तरह सीमित नहीं …

30
गैर-सांख्यिकीय वैज्ञानिकों के लिए आप किस पुस्तक की सिफारिश करेंगे?
आप उन वैज्ञानिकों के लिए कौन सी पुस्तक सुझाएंगे जो सांख्यिकीविद नहीं हैं? स्पष्ट डिलीवरी की सबसे अधिक सराहना की जाती है। साथ ही विशिष्ट कार्यों के लिए उपयुक्त तकनीकों और तरीकों की व्याख्या: समय श्रृंखला विश्लेषण, प्रस्तुति और बड़े डेटा सेट का एकत्रीकरण।
94 references 

13
बहुभिन्नरूपी डेटा में आउटलेयर की पहचान करने का सबसे अच्छा तरीका क्या है?
मान लें कि मेरे पास कम से कम तीन चर के साथ बहुभिन्नरूपी डेटा का एक बड़ा सेट है। मैं आउटलेयर को कैसे खोज सकता हूं? पेयरवाइज स्कैप्लेट्स काम नहीं करेंगे क्योंकि 3 आयामों में अस्तित्व के लिए यह संभव है कि 2 आयामी उप-स्थानों में से किसी में भी …

5
पेशेवरों / विपक्षों के साथ तंत्रिका नेटवर्क में सक्रियण कार्यों की व्यापक सूची
क्या कोई संदर्भ दस्तावेज हैं जो तंत्रिका नेटवर्क में सक्रियण कार्यों की एक व्यापक सूची उनके पेशेवरों / विपक्षों के साथ देते हैं (और आदर्श रूप से प्रकाशनों के कुछ संकेत जहां वे सफल थे या इतने सफल नहीं थे)?

6
आवश्यक डेटा जाँच परीक्षण
अपनी नौकरी की भूमिका में, मैं अक्सर अन्य लोगों के डेटासेट के साथ काम करता हूं, गैर-विशेषज्ञ मुझे नैदानिक ​​डेटा लाते हैं और मैं उन्हें इसे सारांशित करने और सांख्यिकीय परीक्षण करने में मदद करता हूं। मेरे पास जो समस्या है वह यह है कि जो डेटासेट मैं लाया जाता …

3
आप उलझन की गणना कैसे करते हैं और भ्रम मैट्रिक्स का उपयोग करके मल्टीस्कल्स वर्गीकरण के लिए याद करते हैं?
मुझे आश्चर्य है कि एक बहु-श्रेणी वर्गीकरण समस्या के लिए उलझन मैट्रिक्स का उपयोग करके परिशुद्धता की गणना कैसे करें और याद करें। विशेष रूप से, एक अवलोकन केवल अपने सबसे संभावित वर्ग / लेबल को सौंपा जा सकता है। मैं गणना करना चाहूंगा: परिशुद्धता = टीपी / (टीपी + …

10
एक समय श्रृंखला को स्थिर क्यों होना पड़ता है?
मैं समझता हूं कि एक स्थिर समय श्रृंखला वह है जिसका माध्य और विचरण समय के साथ निरंतर होता है। क्या कोई यह बता सकता है कि इससे पहले कि हम अलग-अलग ARIMA या ARM मॉडल चला सकें, हमें यह सुनिश्चित करना होगा कि हमारा डेटा सेट स्थिर क्यों है? …

12
Bayesians कौन हैं?
जैसा कि एक आँकड़े में रुचि हो जाती है, डाइकोटॉमी "फ़्रीक्वेंटिस्ट" बनाम "बायेसियन" जल्द ही आम हो जाता है (और जिसने नैट सिल्वर के सिग्नल और शोर , वैसे भी नहीं पढ़ा है?)। वार्ता और परिचयात्मक पाठ्यक्रमों में, देखने का बिंदु बहुत अक्सर होता है ( MLE , मान), लेकिन …

2
सादे भाषा में कोवरियन क्या है?
सादे भाषा में सहसंयोजक क्या है और यह बार-बार डिजाइनों के संबंध में शर्तों पर निर्भरता , सहसंबंध और भिन्नता-सहसंयोजक संरचना से कैसे जुड़ा हुआ है ?

3
मॉडल चयन के लिए नेस्टेड क्रॉस सत्यापन
मॉडल चयन के लिए नेस्टेड क्रॉस सत्यापन का उपयोग कैसे किया जा सकता है ? मैंने जो ऑनलाइन पढ़ा, उसमें से नेस्टेड सीवी निम्नानुसार काम करता है: आंतरिक सीवी लूप है, जहां हम एक ग्रिड खोज का संचालन कर सकते हैं (जैसे हर उपलब्ध मॉडल के लिए के-गुना चल रहा …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.