सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

6
उसी समय आर का उपयोग करके आंकड़े सीखना शुरू करने के लिए कौन सी पुस्तक अनुशंसित है?
आर का उपयोग करके सांख्यिकी जानने के लिए किताबें वास्तव में वह पुस्तक है जिसकी मुझे तलाश है। मैं जिस चीज की तलाश कर रहा हूं, वह एक ऐसी पुस्तक है जो आपको हाथ से अनुभव देने के लिए आर का उपयोग करते हुए आपको आंकड़े सिखाती है और इस …
50 r  references 

8
विफलता नहीं होने की संभावना को कैसे बताएं?
मैं सोच रहा था कि क्या 1 वर्ष के लिए क्षेत्र में 100,000 उत्पाद हैं और असफलताओं के साथ कुछ विफलता (किसी उत्पाद) की संभावना बताने का कोई तरीका है? बिकने वाले अगले 10,000 उत्पादों में से एक की संभावना क्या है?

5
जनसंख्या विचरण की गणना में N और N-1 में क्या अंतर है?
मुझे वहाँ क्यों नहीं मिला Nऔर N-1जनसंख्या विचरण की गणना करते समय। हम कब इस्तेमाल करते हैं Nऔर कब इस्तेमाल करते हैं N-1? एक बड़े संस्करण के लिए यहां क्लिक करें यह कहता है कि जब जनसंख्या बहुत बड़ी है तो N और N-1 के बीच कोई अंतर नहीं है …

6
उच्च आयाम ( ) में रिज रिग्रेशन बेकार है ? ओएलएस ओवरफिट करने में कैसे विफल हो सकता है?
भविष्यवक्ताओं और नमूना आकार साथ एक अच्छी पुरानी प्रतिगमन समस्या पर विचार करें । सामान्य ज्ञान यह है कि ओएलएस आकलनकर्ता ओवरफिट करेगा और आम तौर पर रिज रिग्रेशन अनुमानक द्वारा बेहतर प्रदर्शन करेगा:यह एक इष्टतम नियमितीकरण पैरामीटर खोजने के लिए क्रॉस-मान्यता का उपयोग करने के लिए मानक है । …

3
हम 'प्रजनन योग्य अनुसंधान' को कैसे परिभाषित कर रहे हैं?
यह अब कुछ सवालों में आया है, और मैं कुछ के बारे में सोच रहा हूँ। क्या पूरे डेटा को मूल डेटा की उपलब्धता और प्रश्न में कोड पर ध्यान केंद्रित करते हुए "पुनरावृत्ति" की ओर ले जाया गया है? मुझे हमेशा सिखाया गया था कि प्रतिलिपि प्रस्तुत करने योग्यता …

13
Bayesian नेटवर्क ड्राइंग के लिए सॉफ्टवेयर (चित्रमय मॉडल)
मैं [मुफ्त] सॉफ़्टवेयर की खोज कर रहा हूं जो अच्छे दिखने वाले चित्रमय मॉडल का उत्पादन कर सकता है, जैसे किसी भी सुझाव की सराहना की जाएगी।

5
"पी-वैल्यू" की सही वर्तनी (कैपिटलाइज़ेशन, इटैलिकाइज़ेशन, हाइफ़नेशन)?
मुझे लगता है कि यह पांडित्यपूर्ण और दुखद है, लेकिन आंकड़ों के बाहर एक क्षेत्र में शोधकर्ता के रूप में, आंकड़ों में सीमित औपचारिक शिक्षा के साथ, मुझे हमेशा आश्चर्य होता है कि क्या मैं "पी-वैल्यू" सही ढंग से लिख रहा हूं। विशेष रूप से: क्या "पी" को पूंजीकृत माना …

1
स्किकिट-सीख में एक-बनाम बनाम डमी एन्कोडिंग
श्रेणीबद्ध चर को एन्कोडिंग करने के दो अलग-अलग तरीके हैं। कहें, एक श्रेणीगत चर में n मान हैं। एक-हॉट एन्कोडिंग इसे n चरों में परिवर्तित करता है , जबकि डमी एन्कोडिंग इसे n-1 चरों में परिवर्तित करता है । यदि हमारे पास श्रेणीगत चर हैं, जिनमें से प्रत्येक में एन …

2
क्या एकाधिक प्रतिगमन में 'चर' के लिए नियंत्रण और अन्य चर को अनदेखा करने के बीच कोई अंतर है?
एक बहु प्रतिगमन में एक व्याख्यात्मक चर का गुणांक हमें निर्भर चर के साथ उस व्याख्यात्मक चर का संबंध बताता है। यह सब, जबकि अन्य व्याख्यात्मक चर के लिए 'नियंत्रण'। मैंने इसे अब तक कैसे देखा है: जबकि प्रत्येक गुणांक की गणना की जा रही है, अन्य चर को ध्यान …

3
एसवीडी के पीछे अंतर्ज्ञान क्या है?
मैंने विलक्षण मूल्य अपघटन (SVD) के बारे में पढ़ा है। लगभग सभी पाठ्यपुस्तकों में यह उल्लेख किया गया है कि यह मैट्रिक्स को दिए गए विनिर्देशन के साथ तीन मैट्रीक में बदल देता है। लेकिन ऐसे रूप में मैट्रिक्स को विभाजित करने के पीछे अंतर्ज्ञान क्या है? पीसीए और अन्य …

3
के-मीन्स और ईएम के साथ क्लस्टरिंग: वे कैसे संबंधित हैं?
मैंने क्लस्टरिंग डेटा (अप्राप्त शिक्षण) के लिए एल्गोरिदम का अध्ययन किया है: ईएम, और के-साधन। मैं निम्नलिखित पढ़ता हूं: k- साधन EM का एक प्रकार है, इस धारणा के साथ कि क्लस्टर गोलाकार हैं। क्या कोई उपरोक्त वाक्य की व्याख्या कर सकता है? मुझे समझ में नहीं आता है कि …

1
एक लॉजिस्टिक प्रतिगमन मॉडल फिट से अनुमानित मूल्यों (Y = 1 या 0) को प्राप्त करना
मान लीजिए कि मेरे पास कक्षा का एक ऑब्जेक्ट है glm(लॉजिस्टिक रिग्रेशन मॉडल के अनुरूप) और मैं बाइनरी प्रतिक्रियाओं में predict.glmतर्क का उपयोग करके दी गई अनुमानित संभावनाओं को चालू करना चाहता हूं type="response", अर्थात या । आर में ऐसा करने का सबसे तेज और सबसे विहित तरीका क्या है?Y= …

4
एसवीएम फिटिंग करते समय दोहरी समस्या से परेशान क्यों?
डेटा बिंदुओं को देखते हुए और लेबल , कठोर SVM प्राणिक समस्या हैy 1 , ... , y n ∈ { - 1 , 1 }x1,…,xn∈Rdx1,…,xn∈Rdx_1, \ldots, x_n \in \mathbb{R}^dy1,…,yn∈{−1,1}y1,…,yn∈{−1,1}y_1, \ldots, y_n \in \left \{-1, 1 \right\} s.t.minimizew,w012wTwminimizew,w012wTw \text{minimize}_{w, w_0} \quad \frac{1}{2} w^T w s.t.∀i:yi(wTxi+w0)≥1s.t.∀i:yi(wTxi+w0)≥1 \text{s.t.} \quad \forall i: y_i …
50 svm 

16
प्रयोग डिजाइन पर अनुशंसित पुस्तकें?
प्रयोगों के डिजाइन पर पुस्तकों के लिए पैनल की सिफारिशें क्या हैं? आदर्श रूप से, किताबें अभी भी प्रिंट में या इलेक्ट्रॉनिक रूप से उपलब्ध होनी चाहिए, हालांकि यह हमेशा संभव नहीं है। यदि आप महसूस करते हैं कि पुस्तक के बारे में कुछ अच्छा कहना है तो यह बहुत …

4
ANOVA रैखिक प्रतिगमन के बराबर क्यों है?
मैंने पढ़ा कि एनोवा और रैखिक प्रतिगमन एक ही बात है। यह कैसे हो सकता है, यह देखते हुए कि एनोवा का उत्पादन कुछ मूल्य है और कुछ पी- आधारित है जिसके आधार पर आप यह निष्कर्ष निकालते हैं कि नमूना का मतलब अलग-अलग नमूनों में समान या अलग है।FFFppp …
50 regression  anova 

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.