सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

4
बायेसियन सांख्यिकी में शक्ति विश्लेषण आवश्यक है?
मैं हाल ही में शास्त्रीय आँकड़ों पर बायेसियन लेने पर शोध कर रहा हूँ। बेयस फैक्टर के बारे में पढ़ने के बाद मुझे आश्चर्य हुआ कि यदि आंकड़ों के इस दृष्टिकोण में बिजली विश्लेषण एक आवश्यकता है। यह सोचने का मेरा मुख्य कारण यह है कि बेयस कारक वास्तव में …

1
आर (एननेट पैकेज) में "मल्टीइनम" के लिए पी-वैल्यू प्राप्त करना
पैकेज के multinomफ़ंक्शन का उपयोग करके मुझे पी-मान कैसे मिलता nnetहै R? मेरे पास एक डेटासेट है जिसमें परिणाम पैराग्राफ के रूप में "पैथोलॉजी स्कोर" (अनुपस्थित, हल्का, गंभीर) शामिल हैं, और दो मुख्य प्रभाव: आयु (दो कारक: बीस / तीस दिन) और उपचार समूह (चार कारक: एटीबी के बिना संक्रमित; …

5
असतत और निरंतर चर के बीच संबंध की कल्पना करने का सबसे अच्छा तरीका क्या है?
सबसे अच्छा तरीका क्या है: सतत और असतत चर, दो असतत चर? अब तक मैंने निरंतर चरों के बीच संबंधों को देखने के लिए तितर बितर भूखंडों का उपयोग किया है। हालांकि असतत चर डेटा बिंदुओं के मामले में कुछ निश्चित अंतराल पर संचयी होते हैं। इस प्रकार सबसे अच्छा …

2
लॉजिस्टिक रिग्रेशन में श्रेणीबद्ध भविष्यवक्ता का महत्व
मुझे लॉजिस्टिक रिग्रेशन में श्रेणीबद्ध चर के लिए z मानों की व्याख्या करने में परेशानी हो रही है। नीचे दिए गए उदाहरण में मेरे पास 3 वर्गों के साथ एक श्रेणीगत चर है और जेड मान के अनुसार, CLASS2 प्रासंगिक हो सकता है जबकि अन्य नहीं हैं। लेकिन अब इसका …

1
मैं सांख्यिकीय तालिका में (अंतर प्रक्षेपित) नहीं दिए गए मानों को कैसे ढूँढूँ?
अक्सर लोग पी-मान प्राप्त करने के लिए कार्यक्रमों का उपयोग करते हैं, लेकिन कभी-कभी - जो भी कारण से - तालिकाओं के एक सेट से महत्वपूर्ण मूल्य प्राप्त करने के लिए आवश्यक हो सकता है। कई महत्वपूर्ण स्तरों के साथ एक सांख्यिकीय तालिका, और स्वतंत्रता की डिग्री की एक सीमित …

4
सर्वश्रेष्ठ भविष्यवक्ता के रूप में सशर्त अपेक्षा के प्रमाण के साथ समस्या
के प्रमाण के साथ मेरे पास एक मुद्दा है E(Y|X)∈argming(X)E[(Y−g(X))2]E(Y|X)∈arg⁡ming(X)E[(Y−g(X))2]E(Y|X) \in \arg \min_{g(X)} E\Big[\big(Y - g(X)\big)^2\Big] जो बहुत संभावना और सशर्त अपेक्षाओं की गहरी गलतफहमी को प्रकट करता है। जो प्रमाण मुझे पता है वह इस प्रकार है (इस प्रमाण का दूसरा संस्करण यहां पाया जा सकता है ) ===argming(X)E[(Y−g(x))2]argming(X)E[(Y−E(Y|X)+E(Y|X)−g(X))2]argming(x)E[(Y−E(Y|X))2+2(Y−E(Y|X))(E(Y|X)−g(X))+(E(Y|X)−g(X))2]argming(x)E[2(Y−E(Y|X))(E(Y|X)−g(X))+(E(Y|X)−g(X))2]arg⁡ming(X)E[(Y−g(x))2]=arg⁡ming(X)E[(Y−E(Y|X)+E(Y|X)−g(X))2]=arg⁡ming(x)E[(Y−E(Y|X))2+2(Y−E(Y|X))(E(Y|X)−g(X))+(E(Y|X)−g(X))2]=arg⁡ming(x)E[2(Y−E(Y|X))(E(Y|X)−g(X))+(E(Y|X)−g(X))2]\begin{align*} …

3
वितरण का उदाहरण जहां केंद्रीय सीमा प्रमेय के लिए बड़े नमूने का आकार आवश्यक है
कुछ पुस्तकें केंद्रीय सीमा प्रमेय के लिए 30 या अधिक आकार का एक नमूना आकार बताती हैं, जो कि लिए एक अच्छा सन्निकटन । X¯X¯\bar{X} मुझे पता है कि यह सभी वितरणों के लिए पर्याप्त नहीं है। मैं वितरण के कुछ उदाहरणों को देखना चाहता हूं, जहां एक बड़े नमूना …

1
R में gl में 'NA' मानों का व्यवहार कैसे किया जाता है
मेरे पास एक डेटा तालिका T1 है, जिसमें लगभग एक हजार चर (V1) और लगभग 200 मिलियन डेटा बिंदु हैं। डेटा विरल है और अधिकांश प्रविष्टियां NA हैं। प्रत्येक डेटा पॉइंट्स में दूसरे से अलग होने के लिए एक अद्वितीय आईडी और डेट जोड़ी होती है। मेरे पास एक और …

2
जीएलएम के एक विशेष परिवार के उपयोग को कौन से निदान मान्य कर सकते हैं?
यह बहुत प्राथमिक लगता है, लेकिन मैं हमेशा इस बिंदु पर अटक जाता हूं ... मेरे द्वारा व्यवहार किए जाने वाले अधिकांश डेटा गैर-सामान्य हैं, और अधिकांश विश्लेषण GLM संरचना पर आधारित हैं। मेरे वर्तमान विश्लेषण के लिए, मेरे पास एक प्रतिक्रिया चर है जो "चलने की गति" (मीटर / …

5
क्रॉस-ओवर (युग्मित) प्रयोगों के लिए त्रुटि सलाखों को कैसे प्रदर्शित किया जाए
निम्नलिखित परिदृश्य अन्वेषक (I), समीक्षक / संपादक (R, CRAN से संबंधित नहीं) और मुझे (M) के कथानक निर्माता के रूप में सबसे अधिक बार पूछे जाने वाले प्रश्न बन गए हैं। हम यह मान सकते हैं कि (आर) विशिष्ट मेडिकल बिग बॉस समीक्षक है, जो केवल यह जानता है कि …

3
डेटा खनन में एसोसिएशन के नियमों और निर्णय पेड़ों के बीच व्यावहारिक अंतर क्या है?
क्या इन दोनों तकनीकों के बीच व्यावहारिक अंतर का वास्तव में सरल वर्णन है? दोनों का उपयोग पर्यवेक्षित अधिगम के लिए किया जाता है (हालाँकि संघ के नियम भी अप्राप्त को संभाल सकते हैं)। दोनों का उपयोग भविष्यवाणी के लिए किया जा सकता है मैंने 'अच्छा' वर्णन के सबसे करीब …

2
गर्मी / समोच्च नक्शे में रंग का सबसे प्रभावी उपयोग
समय-आवृत्ति ईईजी निष्कर्षों को प्रस्तुत करते समय गर्मी / समोच्च मानचित्रों का उपयोग करना काफी सामान्य है। रंग योजना को अक्सर चुना जाता है (और एक जिसे मैं पसंद करता हूं और उपयोग करता हूं) "जेट" रंग योजना है (उदाहरण के लिए, Google छवि खोज समय-आवृत्ति ईईजी )। मुझे आश्चर्य …

1
क्या लैमर () यादृच्छिक प्रभावों के रूप में स्पाइन का उपयोग कर सकता है?
मान लें कि हम समय के साथ कुछ गणना डेटा के यादृच्छिक प्रभाव मॉडल पर काम कर रहे हैं, और हम कुछ रुझानों को नियंत्रित करना चाहते हैं। आम तौर पर, आप कुछ ऐसा करेंगे: lmer(counts ~ dependent_variable + (1+t+I(t^2)|ID), family="poisson") के लिए एक द्विघात आकार शामिल करना t। क्या …

1
क्या आकार 1 और 3 के दो नमूनों की तुलना करने के लिए एक सांख्यिकीय परीक्षण है?
एक इकोलॉजी प्रोजेक्ट के लिए, मेरे लैब समूह ने 4 टैंकों में सिरका मिलाया, जिसमें तालाब के पानी के बराबर मात्रा में, 1 नियंत्रण जिसमें कोई एलोडिया (एक जलीय पौधा) नहीं है और प्रत्येक में एक ही राशि के 3 उपचार हैं। सिरका जोड़ने का उद्देश्य पीएच को कम करना …


हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.