सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

1
जब धारणाएं पूरी नहीं होतीं तो रिग्रेशन मॉडल कितना गलत है?
प्रतिगमन मॉडल को फिट करते समय, आउटपुट की धारणाएं पूरी नहीं होने पर क्या होता है, विशेष रूप से: यदि अवशेष होमोसिडेस्टिक नहीं हैं तो क्या होगा? यदि अवशिष्ट रेजिड्यूल्स बनाम फिट प्लाट में बढ़ते या घटते पैटर्न को दिखाते हैं। यदि अवशेष सामान्य रूप से वितरित नहीं होते हैं, …

2
"RNN का अर्थ और प्रमाण) किसी भी एल्गोरिथ्म का अनुमान लगा सकता है"
हाल ही में मैंने पढ़ा कि एक आवर्तक तंत्रिका नेटवर्क किसी भी एल्गोरिथ्म का अनुमान लगा सकता है। तो मेरा सवाल यह है: इसका सही मतलब क्या है और क्या आप मुझे एक संदर्भ दे सकते हैं जहां यह साबित हो?
28 references  rnn 

3
क्यों दो सामान्य रूप से वितरित चर का मिश्रण केवल बिमोडल होता है यदि उनके साधन सामान्य मानक विचलन से कम से कम दो गुना भिन्न होते हैं?
दो सामान्य वितरणों के मिश्रण के तहत: https://en.wikipedia.org/wiki/Multimodal_distribution#Mixture_of_two_normal_distributions "दो सामान्य वितरणों के मिश्रण में अनुमान लगाने के लिए पांच पैरामीटर होते हैं: दो साधनों, दो भिन्नताओं और मिश्रण पैरामीटर। समान मानक विचलन वाले दो सामान्य वितरणों का मिश्रण केवल द्विगुणित होता है यदि उनके साधन सामान्य मानक विचलन से कम …
28 bimodal 

2
सांख्यिकी में सफेद शोर
मैं अक्सर विभिन्न सांख्यिकीय मॉडल के बारे में पढ़ते हुए शब्द सफेद शोर दिखाई देता हूं। लेकिन मुझे यह स्वीकार करना चाहिए कि मैं पूरी तरह से आश्वस्त नहीं हूं कि इसका क्या मतलब है। इसे आमतौर पर रूप में संक्षिप्त किया जाता है । इसका मतलब यह है कि …

4
क्या कई पी-वैल्यू का एक समान वितरण सांख्यिकीय प्रमाण देता है कि H0 सच है?
एक एकल सांख्यिकीय परीक्षण इस बात का प्रमाण दे सकता है कि अशक्त परिकल्पना (H0) झूठी है और इसलिए वैकल्पिक परिकल्पना (H1) सत्य है। लेकिन यह दिखाने के लिए इस्तेमाल नहीं किया जा सकता है कि H0 सच है क्योंकि H0 को अस्वीकार करने का मतलब यह नहीं है कि …

1
R में सेकंड / मिनट के अंतराल डेटा के लिए "फ़्रिक्वेंसी" मान
मैं पूर्वानुमान के लिए R (3.1.1), और ARIMA मॉडल का उपयोग कर रहा हूं। मैं जानना चाहता हूं कि "आवृत्ति" पैरामीटर क्या होना चाहिए, जो ts()फ़ंक्शन में असाइन किया गया है , अगर समय श्रृंखला डेटा का उपयोग करके im है: मिनटों से अलग हो गया है और 180 दिनों …

3
ब्रेन-टीज़र: एक समान अनुक्रम [0,1] वितरण से खींचे जाने पर एक iid अनुक्रम की अपेक्षित लंबाई क्या होती है, जो एकतरफा रूप से बढ़ती है?
यह एक मात्रात्मक विश्लेषक की स्थिति के लिए एक साक्षात्कार प्रश्न है, यहां रिपोर्ट किया गया है । मान लीजिए कि हम एक समान [0,1][0,1][0,1] वितरण से आकर्षित कर रहे हैं और ड्रॉ iid हैं, एक नीरस रूप से बढ़ते वितरण की अपेक्षित लंबाई क्या है? यानी, यदि वर्तमान ड्रॉ …

2
एक चरणबद्ध चयन करने के बाद पी-वैल्यू भ्रामक क्यों हैं?
आइए उदाहरण के लिए एक रेखीय प्रतिगमन मॉडल पर विचार करें। मैंने सुना है कि, डेटा माइनिंग में, AIC मानदंड के आधार पर एक स्टेपवाइज़ सिलेक्शन करने के बाद, n की परिकल्पना का परीक्षण करने के लिए पी-वैल्यूज़ को देखना भ्रामक है कि प्रत्येक सच्चा प्रतिगमन गुणांक शून्य है। मैंने …


5
बायेसियन नेटवर्क और मार्कोव प्रक्रिया के बीच अंतर?
बायेसियन नेटवर्क और मार्कोव प्रक्रिया में क्या अंतर है? मुझे विश्वास था कि मैं दोनों के सिद्धांतों को समझता हूं, लेकिन अब जब मुझे उन दोनों की तुलना करने की आवश्यकता है जो मुझे खोए हुए लगते हैं। वे मेरे लिए लगभग समान हैं। निश्चित रूप से वे नहीं हैं। …

2
"आइरिस" डेटा सेट के कौन से पहलू इसे उदाहरण / शिक्षण / परीक्षण डेटा सेट के रूप में सफल बनाते हैं
"आइरिस" डाटासेट शायद यहां ज्यादातर लोगों के लिए परिचित है - यह विहित परीक्षण डेटा सेट में से एक और डेटा दृश्य से मशीन सीखने के लिए सब कुछ के लिए एक उदाहरण के जाने के लिए डाटासेट है। उदाहरण के लिए, इस प्रश्न में सभी ने उपचार द्वारा अलग …
28 dataset 

1
एक बंद फॉर्म लैस्सो समाधान की मेरी व्युत्पत्ति गलत क्यों है?
लैस्सो समस्या _ पास बंद फ़ॉर्म समाधान है: \ Beta_j ^ {\ text {lasso}} = = mathrm {sgn} (\ beta ^ {\ text {LS}} _ j) (! \ beta_j ^ \ पाठ {LS | }} | - \ अल्फा) ^ + यदि X के पास असामान्य कॉलम हैं। यह इस …

3
मिश्रित मॉडल (lme4) में एक श्रेणीगत कारक के लिए "समग्र" पी-मूल्य और प्रभाव आकार कैसे प्राप्त करें?
मैं एक स्वतंत्र श्रेणीगत चर का एक पी-मान और एक प्रभाव आकार प्राप्त करना चाहता हूं (कई स्तरों के साथ) - जो कि "समग्र" है और प्रत्येक स्तर के लिए अलग-अलग नहीं है, जैसा कि lme4आर में सामान्य उत्पादन से होता है। यह वैसा ही है ANOVA चलाते समय लोग …

1
विभिन्न दूरी और विधियों द्वारा प्राप्त पदानुक्रमित क्लस्टरिंग डेंड्रोग्राम की तुलना करना
[प्रारंभिक शीर्षक "पदानुक्रमित पेड़ों के लिए समानता का मापन" बाद में इस विषय को बेहतर ढंग से प्रतिबिंबित करने के लिए @ttnphns द्वारा बदल दिया गया था] मैं रोगी रिकॉर्ड्स (जैसे http://www.biomedcentral.com/1471-2105/5/126/figure/F1?highres=y ) के डेटाफ़्रेम पर कई श्रेणीबद्ध क्लस्टर विश्लेषण कर रहा हूं । मैं पेड़ के अंतिम समूहों / …

2
Glmnet रिज रिग्रेशन मुझे मैन्युअल गणना की तुलना में एक अलग उत्तर क्यों दे रहा है?
मैं रिज रिग्रेशन अनुमानों की गणना करने के लिए glmnet का उपयोग कर रहा हूं। मुझे कुछ परिणाम मिले, जिससे मुझे उस ग्लमैनेट में संदेह हुआ, जो मैं सोचता हूं कि वह वास्तव में कर रहा है। यह जाँचने के लिए मैंने एक साधारण R स्क्रिप्ट लिखी है जहाँ मैं …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.