सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

1
पुरानी किताबों में सांख्यिकीय टेबल उद्देश्यपूर्ण रूप से गलत हैं?
मुझे कुछ समय पहले याद आया कि पुरानी (पूर्व-कंप्यूटर दिनों) किताबों में, परिशिष्टों में दिखाए गए सैद्धांतिक मात्राओं के अंतिम अंक साहित्यिक चोरी को हतोत्साहित करने के लिए गलत थे (विचार यह होगा कि एक अन्य पुस्तक में एक तालिका है। परिशिष्ट जहां अंतिम अंक आपके में पाए जाने वाले …

3
क्या "बाधा मॉडल" वास्तव में एक मॉडल है? या सिर्फ दो अलग, अनुक्रमिक मॉडल?
yएक सामान्य भविष्यवक्ता से डेटा की भविष्यवाणी करने वाले बाधा मॉडल पर विचार करें x: set.seed(1839) # simulate poisson with many zeros x <- rnorm(100) e <- rnorm(100) y <- rpois(100, exp(-1.5 + x + e)) # how many zeroes? table(y == 0) FALSE TRUE 31 69 इस मामले में, …

8
क्या संभावनाओं पर त्रुटि सलाखों का कोई अर्थ है?
लोग अक्सर कहते हैं कि किसी घटना के 50-60% होने की संभावना है। कभी-कभी मैं यहां तक ​​कि लोगों को प्रायिकता असाइनमेंट पर स्पष्ट त्रुटि बार देता देखूंगा। क्या इन कथनों का कोई अर्थ है या क्या वे किसी समस्या के लिए विशिष्ट संख्या का चयन करने में असहजता का …

1
जब शून्य-सहसंबंध मिश्रित मॉडल सैद्धांतिक रूप से ध्वनि होते हैं?
मिश्रित प्रभाव मॉडलिंग के क्षेत्र में नेताओं से नीचे ब्लॉक उद्धरण, का दावा है कि यादृच्छिक प्रभावों ('ZCP' मॉडल) के बीच शून्य सहसंबंध के साथ मॉडल में बदलाव का समन्वय मॉडल भविष्यवाणियों को बदलता है। लेकिन, क्या कोई उनके दावों को सही या विस्तृत कर सकता है? विचाराधीन बयान बेट्स …

2
Lognormal वितरण के पल अनुमानक के पूर्वाग्रह
मैं कुछ संख्यात्मक प्रयोग कर रहा हूं, जिसमें एक लॉगनॉर्मल डिस्ट्रिब्यूशन नमूना लिया गया है , और दो तरीकों से क्षणों का अनुमान लगाने की कोशिश की जा रही हैX∼LN(μ,σ)X∼LN(μ,σ)X\sim\mathcal{LN}(\mu, \sigma)E[Xn]E[Xn]\mathbb{E}[X^n] के नमूना माध्य को देखते हुएXnXnX^n नमूने का उपयोग करके और अनुमान लगाना (X), \ log ^ 2 (X) …

0
Jaynes का वितरण
जेन्स की पुस्तक "प्रोबेबिलिटी थ्योरी: द लॉजिक ऑफ साइंस" में , जेन्स के पास एक अध्याय (Ch 18) है, जिसका शीर्षक है " वितरण और उत्तराधिकार का नियम" जिसमें वह वितरण के विचार का परिचय देता है , जिसे यह मार्ग बताता है:एपीएपीA_pएपीएपीA_p [...] इसे देखने के लिए, नई जानकारी …

4
परिवर्तनीय महत्व की रैंकिंग किसके लिए उपयोगी है?
जब यह चर महत्व की रैंकिंग (सभी प्रकार के बहुभिन्नरूपी मॉडल के संदर्भ में) की बात करता है, तो मैं कुछ शून्यवादी बन गया हूं । अक्सर मेरे काम के दौरान, मुझे या तो किसी अन्य टीम को एक चर महत्व की रैंकिंग बनाने में मदद करने के लिए कहा …

2
सामान्यीकृत रैखिक (मिश्रित) मॉडल (विशेष रूप से अवशिष्ट) के लिए निदान
मैं वर्तमान में मुश्किल गणना डेटा (आश्रित चर) के लिए सही मॉडल खोजने के साथ संघर्ष कर रहा हूं। मैंने विभिन्न विभिन्न मॉडलों की कोशिश की है (मिश्रित प्रभाव मॉडल मेरे प्रकार के डेटा के लिए आवश्यक हैं) जैसे कि lmerऔर lme4(एक लॉग ट्रांसफ़ॉर्म के साथ) सामान्यीकृत रैखिक मिश्रित प्रभाव …

1
कला स्ट्रीमिंग सीखने की अवस्था
मैं हाल ही में बड़े डेटा सेट के साथ काम कर रहा हूं और स्ट्रीमिंग विधियों के बहुत सारे पेपर पाए गए हैं। कुछ नाम है: अनुवर्ती नियमित नेता और मिरर डीसेंट: समतुल्यता सिद्धांत और L1 नियमितीकरण ( http://jmlr.org/proceedings/papers/v15/mcmahan11b/mcmahan11b.pdf ) स्ट्रीमिंग लर्निंग: एक-पास एसवीएम ( http://www.umiacs.umd.edu/~hal/docs/daume09onepass.pdf ) पेगासोस: एसवीएम के …

1
क्या टी-टेस्ट की मृत्यु की रिपोर्ट बहुत अतिरंजित है?
सीवी ऑल-टाइम क्लासिक्स के माध्यम से पढ़ना मुझे एक बयान में आया था जिसे मैं स्पष्ट करना चाहूंगा। यह पोस्ट है और मेरा प्रश्न समापन टिप्पणियों को संदर्भित करता है: "मुझे यह ध्यान रखना होगा कि मैं जो भी ज्ञान देता हूं, वह कुछ हद तक अप्रचलित है; अब जब …

5
अधिकतम संभावना अनुमान - क्यों कई मामलों में पक्षपाती होने के बावजूद इसका उपयोग किया जाता है
अधिकतम संभावना अनुमान अक्सर पक्षपाती अनुमानकों के रूप में होता है (उदाहरण के लिए, नमूना प्रसरण के लिए इसका अनुमान गाऊसी वितरण के लिए पक्षपाती है)। फिर क्या यह इतना लोकप्रिय बनाता है? वास्तव में इसका इतना उपयोग क्यों किया जाता है? इसके अलावा, विशेष रूप से वैकल्पिक दृष्टिकोण से …

4
एक भूखंड में कई चर कल्पना
मैं यह बताना चाहता हूं कि कुछ चर (~ 15) के मूल्य समय के साथ कैसे बदलते हैं, लेकिन मैं यह भी बताना चाहता हूं कि प्रत्येक वर्ष में चर एक दूसरे से कैसे भिन्न होते हैं। इसलिए मैंने यह साजिश रची: लेकिन रंग योजना बदलते समय या अलग लाइन …

4
क्या ArXiv सांख्यिकी समुदाय में लोकप्रिय है?
मुझे पता है कि भौतिकी और गणित समुदाय अरएक्सिव में बहुत हैं, लेकिन सांख्यिकी समुदाय के बारे में क्या? क्या जमा करने से पहले वहां पोस्ट करने की प्रथा है?

3
ऑर्थोगोनल, सहसंबंध और स्वतंत्रता के बीच क्या संबंध है?
मैंने एक लेख पढ़ा है जिसमें कहा गया है कि जब एनओआईएए में अलग-अलग तरीकों का उपयोग करने के लिए नियोजित विरोधाभासों का उपयोग किया जाता है, तो बाधाएं ऑर्थोगोनल होनी चाहिए ताकि वे असंबंधित हों और टाइप I त्रुटि को फुलाए जाने से रोकें। मुझे समझ नहीं आता कि …

5
शीर्ष प्रमुख घटक एक आश्रित चर पर भविष्य कहनेवाला शक्ति को कैसे बनाए रख सकते हैं (या बेहतर पूर्वानुमान की ओर भी ले जा सकते हैं)?
मान लीजिए कि मैं एक प्रतिगमन चला रहा हूं । शीर्ष सिद्धांत घटकों का चयन करके , क्या मॉडल पर अपनी भविष्य कहनेवाला शक्ति बरकरार रखता है ?कश्मीर एक्स वाईY∼ एक्सY∼XY \sim Xकश्मीरkkएक्सXXYYY मैं समझता हूं कि यदि शीर्ष eigenvalues ​​के साथ के सहसंयोजक मैट्रिक्स के eigenvectors हैं, तो शीर्ष …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.