सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
घोंसले के शिकार के साथ मिश्रित प्रभाव मॉडल
मेरे पास एक प्रयोग से प्राप्त आंकड़े इस प्रकार हैं: दो साइट, प्रत्येक 30 पेड़ों के साथ। 15 का उपचार किया जाता है, प्रत्येक साइट पर 15 का नियंत्रण किया जाता है। प्रत्येक पेड़ से, हम स्टेम के तीन टुकड़े, और जड़ों के तीन टुकड़े का नमूना लेते हैं, इसलिए …

3
मॉडल की Akaike Information Criterion (AIC) स्कोर का क्या अर्थ है?
मैंने यहां कुछ प्रश्न देखे हैं कि आम आदमी के संदर्भ में इसका क्या अर्थ है, लेकिन ये मेरे उद्देश्य के लिए बहुत आम हैं। मैं गणितीय रूप से समझने की कोशिश कर रहा हूं कि एआईसी स्कोर का क्या मतलब है। लेकिन एक ही समय में, मैं एक कठोर …

2
एक रेखीय मॉडल की मान्यताओं को सत्यापित करने के लिए अवशिष्ट बनाम सज्जित मूल्यों की व्याख्या करना
आर (2005, पी। 59) के साथ फ़रावे के रैखिक मॉडल के निम्नलिखित आंकड़े पर विचार करें। पहला कथानक इंगित करता है कि अवशिष्ट और सज्जित मूल्य असंबंधित हैं, क्योंकि उन्हें एक होमोसिस्टेस्टिक लीनियर मॉडल में होना चाहिए जो सामान्य रूप से वितरित त्रुटियों के साथ हो। इसलिए, दूसरे और तीसरे …


2
Benjamini & Hochberg (1995) और Benjamini & Yekutieli (2001) झूठी खोज दर प्रक्रियाओं के बीच व्यावहारिक अंतर क्या हैं?
मेरे आंकड़े कार्यक्रम बेनजामिनी और होचबर्ग (1995) और बेंजामिनी और येकुतेली (2001) झूठी खोज दर (FDR) दोनों प्रक्रियाओं को लागू करते हैं। मैंने बाद के पेपर के माध्यम से पढ़ने की पूरी कोशिश की है, लेकिन यह काफी गणितीय रूप से सघन है और मैं निश्चित रूप से निश्चित नहीं …

2
मॉडल चयन और क्रॉस-सत्यापन: सही तरीका
मॉडल चयन और क्रॉस सत्यापन के विषय पर CrossValidated कई धागे हैं। यहाँ कुछ है: आंतरिक बनाम बाहरी क्रॉस-मान्यता और मॉडल चयन @ DikranMarsupial की सुविधा चयन और क्रॉस-मान्यता के लिए शीर्ष उत्तर हालांकि, उन थ्रेड्स के उत्तर काफी सामान्य हैं और ज्यादातर मुद्दों को हाइलीकरण और मॉडल चयन को …

3
सहसंबंध मैट्रिक्स को सकारात्मक अर्ध-निश्चित होने की आवश्यकता क्यों है और सकारात्मक अर्ध-निश्चित होने का क्या मतलब है या नहीं है?
मैं सहसंबंध या सहसंयोजक मैट्रिक्स के सकारात्मक अर्ध-निश्चित संपत्ति के अर्थ पर शोध कर रहा हूं। मैं किसी भी जानकारी के लिए देख रहा हूँ सकारात्मक अर्ध-परिभाषा की परिभाषा; इसके महत्वपूर्ण गुण, व्यावहारिक निहितार्थ; नकारात्मक निर्धारक होने का परिणाम, बहुभिन्नरूपी विश्लेषण या सिमुलेशन परिणाम आदि पर प्रभाव।

3
आश्रित चर की सामान्यता = अवशिष्टों की सामान्यता?
यह मुद्दा हर समय अपने बदसूरत सिर को पीछे करने के लिए लगता है, और मैं इसे आंकड़ों और विवेक की अपनी समझ के लिए इसे खत्म करने की कोशिश कर रहा हूं!)। सामान्य रैखिक मॉडल (टी-टेस्ट, एनोवा, प्रतिगमन आदि) की धारणाओं में "सामान्यता की धारणा" शामिल है, लेकिन मैंने …

5
तंत्रिका नेटवर्क प्रशिक्षण के लिए आनुवंशिक एल्गोरिथ्म बनाम बैकप्रॉपैगैनेशन
मैंने प्रत्येक विधि के पेशेवरों और विपक्षों पर चर्चा करते हुए कुछ पेपर पढ़े हैं, कुछ ने तर्क दिया कि GA इष्टतम समाधान खोजने में कोई सुधार नहीं देता है जबकि अन्य बताते हैं कि यह अधिक प्रभावी है। ऐसा लगता है कि जीए को आम तौर पर साहित्य में …

3
कई इंप्यूटेशन के बाद प्रॉपर्टीज स्कोर का मिलान
मैं इस पत्र का उल्लेख करता हूं : हेस जेआर, ग्रोनर जेआई। "ट्रॉमा रजिस्ट्री डेटा से चोट की गंभीरता पर कार की सीटों और सीट बेल्ट के उपयोग के प्रभाव का परीक्षण करने के लिए कई अभेद्यता और प्रवृत्ति स्कोर का उपयोग करना।" जे पीडियाट्रर सर्जन। 2008 मई; 43 (5): …

3
मैं कैसे परीक्षण कर सकता हूं कि क्या कोई यादृच्छिक प्रभाव महत्वपूर्ण है?
मैं समझने की कोशिश कर रहा हूं कि कब एक यादृच्छिक प्रभाव का उपयोग करना है और कब यह अनावश्यक है। Ive को अंगूठे का एक नियम बताया गया है यदि आपके पास 4 या अधिक समूह / व्यक्ति हैं जो मैं करता हूं (15 व्यक्तिगत स्वर)। उनमें से कुछ …

5
क्या आप CV / बूटस्ट्रैप का उपयोग करके मशीन लर्निंग एल्गोरिदम द्वारा ओवरफिट कर सकते हैं?
यह सवाल एक निश्चित जवाब पाने के लिए अच्छी तरह से खुला हो सकता है, लेकिन उम्मीद नहीं है। मशीन लर्निंग एल्गोरिदम, जैसे एसवीएम, जीबीएम, रैंडम फॉरेस्ट आदि, आम तौर पर कुछ मुफ्त पैरामीटर होते हैं, जो अंगूठे के मार्गदर्शन के कुछ नियम से परे, प्रत्येक डेटा सेट पर ट्यून …

7
छात्रों को यह सिखाना बुरा क्यों है कि पी-वैल्यू संभावना है कि निष्कर्ष मौका के कारण हैं?
क्या कोई कृपया एक अच्छी रसीला व्याख्या प्रस्तुत कर सकता है कि छात्रों को पढ़ाने के लिए यह एक अच्छा विचार क्यों नहीं है कि एक पी-मूल्य प्रोब है (उनके निष्कर्ष [यादृच्छिक] मौका के कारण हैं)। मेरी समझ यह है कि एक पी-वैल्यू प्रोब है (अधिक चरम डेटा प्राप्त करना। …

3
सामान्यीकृत रैखिक मॉडल और सामान्यीकृत रैखिक मिश्रित मॉडल के बीच अंतर
मैं सोच रहा हूं कि मिश्रित और अनलिमिटेड जीएलएम में क्या अंतर हैं। उदाहरण के लिए, SPSS में ड्रॉप डाउन मेनू उपयोगकर्ताओं को या तो फिट करने की अनुमति देता है: analyze-> generalized linear models-> generalized linear models और analyze-> mixed models-> generalized linear क्या वे लापता मूल्यों से अलग …

2
मिश्रित प्रकार के डेटा के साथ पदानुक्रमिक क्लस्टरिंग - किस दूरी / समानता का उपयोग करना है?
मेरे डेटासेट में हमारे पास निरंतर और स्वाभाविक रूप से दोनों प्रकार के असतत चर हैं। मैं जानना चाहता हूं कि क्या हम दोनों प्रकार के चर का उपयोग करके पदानुक्रमिक क्लस्टरिंग कर सकते हैं। और यदि हाँ, तो क्या दूरी नापना उचित है?

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.