सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

5
और सहसंबंध गुणांक के बीच संबंध
मान लीजिए कि मेरे पास दो 1-आयामी सरणियाँ, और । प्रत्येक में 100 डेटा पॉइंट होते हैं। वास्तविक डेटा है, और मॉडल भविष्यवाणी है। इस स्थिति में, मान होगा: इस बीच, यह सहसंबंध गुणांक के वर्ग मान के बराबर होगा, अब अगर मैं दो स्वैप करता हूं: a_2 वास्तविक डेटा …

4
क्या मॉडल बनाते समय कोविरेट्स को सांख्यिकीय रूप से महत्वपूर्ण नहीं रखा जाना चाहिए?
मेरे पास एक मॉडल के लिए मेरी गणना में कई covariates हैं, और उनमें से सभी सांख्यिकीय रूप से महत्वपूर्ण नहीं हैं। क्या मुझे वो हटा देना चाहिए जो नहीं हैं? यह प्रश्न घटना पर चर्चा करता है, लेकिन मेरे प्रश्न का उत्तर नहीं देता है: ANCOVA में एक कोवरिएट …

5
चर चयन के लिए R में लार्स (या ग्लमैनेट) पैकेज से LASSO का उपयोग करना
क्षमा करें यदि यह प्रश्न थोड़ा बुनियादी आता है। मैं आर में कई रैखिक प्रतिगमन मॉडल के लिए LASSO चर चयन का उपयोग करना चाह रहा हूं। मेरे पास 15 भविष्यवक्ता हैं, जिनमें से एक श्रेणीबद्ध है (क्या इससे कोई समस्या हो सकती है?)। अपना और सेट करने के बाद …

3
Apple शेयर की कीमत के मामले में बड़ी संख्या का कानून लागू क्यों नहीं होता?
यहाँ NY समय में लेख है जिसे "Apple बड़ी संख्या के कानून का सामना करता है" कहा जाता है । यह बड़ी संख्या के कानून का उपयोग करके Apple शेयर की कीमत में वृद्धि की व्याख्या करने की कोशिश करता है। इस लेख में क्या सांख्यिकीय (या गणितीय) त्रुटियाँ हैं?

2
लॉजिस्टिक रिग्रेशन पॉवर विश्लेषण का अनुकरण - डिज़ाइन किए गए प्रयोग
यह सवाल लॉजिस्टिक रिग्रेशन और एसएएस के साथ शक्ति विश्लेषण के संबंध में पूछे गए एक प्रश्न के संबंध में @ ग्रेग स्नो द्वारा दिए गए उत्तर के जवाब में है Proc GLMPOWER। यदि मैं एक प्रयोग डिजाइन कर रहा हूं और एक तथ्यात्मक लॉजिस्टिक रिग्रेशन में परिणामों का विश्लेषण …

1
कैसे व्याख्या और रिपोर्ट करने के लिए सांख्यिकीय रूप से महत्वपूर्ण और गैर-महत्वपूर्ण विश्लेषण में चुकता / आंशिक एटा वर्ग की रिपोर्ट करें?
मेरे पास डेटा है जिसमें एटा स्क्वेर्ड वैल्यू और आंशिक एटा स्क्वेर्ड वैल्यू की गणना होती है, जो समूह औसत अंतर के लिए प्रभाव के आकार के माप के रूप में गणना की जाती है। एटा वर्ग और आंशिक एटा वर्ग के बीच अंतर क्या है? क्या दोनों को एक …

4
R में "।" (डॉट) का क्या अर्थ है?
मैं सिर्फ "आर इन ए नटशेल" पुस्तक पढ़ रहा हूं। और ऐसा लगता है जैसे मैंने उस हिस्से को छोड़ दिया जहां "।" जैसा कि "sample.formula" में समझाया गया था। > sample.formula <- as.formula(y~x1+x2) क्या अन्य भाषाओं के समान फ़ील्ड फॉर्मूला के साथ एक वस्तु का नमूना है? और यदि …
39 r 

2
लॉजिस्टिक रिग्रेशन मॉडल अभिसरण नहीं करता है
मुझे एयरलाइन उड़ानों के बारे में कुछ डेटा मिला है (नामक एक डेटा फ्रेम में flights) और मैं यह देखना चाहूंगा कि क्या फ्लाइट के समय में काफी देरी से आने की संभावना पर कोई प्रभाव पड़ता है (मतलब 10 या अधिक मिनट)। मुझे लगा कि मैं भविष्यवाचक के रूप …
39 r  logistic  separation 

6
खमीर-कोण प्रतिगमन बनाम लैस्सो
कम-से-कम रेगुलराइजेशन पाथ (जब एक कोरिसेन्ट क्रॉस जीरो को छोड़कर) समान हो, तो लिस्ट-एंगल रिग्रेशन और लैस्सो बहुत समान रेग्युलराइजेशन पाथ उत्पन्न करते हैं। वे दोनों लगभग समान एल्गोरिदम द्वारा कुशलतापूर्वक फिट हो सकते हैं। क्या कभी कोई व्यावहारिक कारण है कि एक विधि को दूसरे पर पसंद किया जाए?
39 regression  lasso 

3
मोड, कक्षा और आर वस्तुओं का प्रकार
मैं सोच रहा था कि मोड, क्लास और टाइप ऑफ़ R ऑब्जेक्ट्स में क्या अंतर हैं? आर ऑब्जेक्ट का प्रकार टाइपोफ () फ़ंक्शन, मोड बाय मोड (), और क्लास बाय क्लास () द्वारा प्राप्त किया जा सकता है। इसके अलावा किसी भी अन्य इसी तरह के कार्यों और अवधारणाओं कि …
39 r 

8
बिना समूह अंतर के परिकल्पना का परीक्षण कैसे करें?
कल्पना कीजिए कि आपके पास एक संख्यात्मक आश्रित चर (जैसे, बुद्धि परीक्षण स्कोर) को देखते हुए दो समूहों (जैसे, पुरुषों और महिलाओं) के साथ एक अध्ययन है और आपके पास यह परिकल्पना है कि कोई समूह अंतर नहीं हैं। सवाल: यह जांचने का एक अच्छा तरीका है कि क्या कोई …

3
क्लोजर बनाम आर: डेटा विश्लेषण के लिए फायदे और नुकसान
निकट भविष्य में आर सीखने की मेरी योजना थी। एक और सवाल पढ़ते हुए मुझे क्लूजुर के बारे में पता चला। अब मुझे नहीं पता कि क्या करना है। मुझे लगता है कि मेरे लिए R का एक बड़ा फायदा यह है कि इकोनॉमिक्स में कुछ लोग इसका उपयोग करते …
39 r 

8
आर में ग्राफिकल डेटा ओवरव्यू (सारांश) फ़ंक्शन
मुझे यकीन है कि मैं एक आर पैकेज में इस तरह के एक समारोह से पहले आया हूं, लेकिन व्यापक Googling के बाद मैं इसे कहीं भी नहीं ढूंढ सकता हूं। जिस फ़ंक्शन के बारे में मैं सोच रहा हूँ, उसे दिए गए एक चर के लिए एक चित्रमय सारांश, …

1
हम टी-एसएनई उद्देश्य समारोह में क्रॉस एन्ट्रॉपी के बजाय कुल्बैक-लिबलर विचलन का उपयोग क्यों करते हैं?
मेरे दिमाग में, नमूना वितरण से सच्चे वितरण तक केएल विचलन बस क्रॉस एन्ट्रॉपी और एन्ट्रॉपी के बीच का अंतर है। हम कई मशीन लर्निंग मॉडल में लागत फ़ंक्शन होने के लिए क्रॉस एन्ट्रॉपी का उपयोग क्यों करते हैं, लेकिन टी-स्ने में कुल्बैक-लीब्लर विचलन का उपयोग करते हैं? क्या सीखने …

5
LDA vs word2vec
मैं यह समझने की कोशिश कर रहा हूं कि शब्द समानता की गणना के लिए लेटेंट डिरिक्लेट आवंटन और शब्द 2vec में क्या समानता है। जैसा कि मैं समझता हूं, LDA अव्यक्त विषयों की संभावनाओं की एक सदिश के लिए शब्दों को मैप करता है , जबकि word2vec उन्हें वास्तविक …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.