सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

7
सत्यापन सटीकता में उतार-चढ़ाव क्यों है?
एमआरआई डेटा का उपयोग करके कैंसर की प्रतिक्रिया की भविष्यवाणी करने के लिए मेरे पास एक चार परत सीएनएन है। मैं nonLearities शुरू करने के लिए ReLU सक्रियण का उपयोग करता हूं। ट्रेन की सटीकता और हानि क्रमशः नीरस रूप से बढ़ती और घटती है। लेकिन, मेरी परीक्षा की सटीकता …

4
क्या यह सच है कि पर्सेंटाइल बूटस्ट्रैप का इस्तेमाल कभी नहीं किया जाना चाहिए?
एमआईटी ओपनकोर्सवेयर में 18.05 के लिए संभाव्यता और सांख्यिकी का परिचय, स्प्रिंग 2014 (वर्तमान में यहां उपलब्ध है ), यह बताता है: बूटस्ट्रैप प्रतिशताइल विधि इसकी सादगी के कारण आकर्षक है। हालांकि इसके बारे में बूटस्ट्रैप वितरण पर निर्भर करता है एक के आधार पर विशेष नमूना का सही वितरण …

6
यदि एक विश्वसनीय अंतराल में एक फ्लैट पूर्व है, तो 95% विश्वास अंतराल एक 95% विश्वसनीय अंतराल के बराबर है?
मैं बायेसियन आंकड़ों के लिए बहुत नया हूं, और यह एक मूर्खतापूर्ण सवाल हो सकता है। फिर भी: एक समान वितरण के साथ एक विशिष्ट अंतराल के साथ एक विश्वसनीय अंतराल पर विचार करें। उदाहरण के लिए, 0 से 1 तक, जहां 0 से 1 एक प्रभाव के संभावित मूल्यों …

2
क्या हमें एक रेखीय प्रतिगमन मॉडल के गुणांक को खोजने के लिए ढाल वंश की आवश्यकता है?
मैं कौरसेरा सामग्री का उपयोग करके मशीन सीखने की कोशिश कर रहा था । इस व्याख्यान में, एंड्रयू एनजी रेखीय प्रतिगमन मॉडल के गुणांक को खोजने के लिए ढाल वंश एल्गोरिथ्म का उपयोग करता है जो त्रुटि फ़ंक्शन (लागत फ़ंक्शन) को कम करेगा। रैखिक प्रतिगमन के लिए, क्या हमें ढाल …

3
Naive Bayes एक रैखिक क्लासिफायरियर कैसे है?
मैंने दूसरे सूत्र को यहाँ देखा है, लेकिन मुझे नहीं लगता कि उत्तर वास्तविक प्रश्न को संतुष्ट करता है। मैंने जो लगातार पढ़ा है वह यह है कि Naive Bayes एक लीनियर क्लासिफायरिफायर (उदा: यहाँ ) है (जैसे कि यह लीनियर डिसीजन बाउंड्री ड्रॉ करता है) लॉग ऑड्स प्रदर्शन का …

4
लॉजिस्टिक रिग्रेशन - एरर टर्म और उसका डिस्ट्रीब्यूशन
लॉजिस्टिक रिग्रेशन (और इसके ग्रहण किए गए वितरण) में कोई त्रुटि शब्द मौजूद है या नहीं, इस पर मैंने विभिन्न स्थानों पर पढ़ा है: कोई त्रुटि शब्द मौजूद नहीं है त्रुटि शब्द का एक द्विपद वितरण है (प्रतिक्रिया चर के वितरण के अनुसार) त्रुटि शब्द का लॉजिस्टिक वितरण है कृपया …

2
आर में एक यादृच्छिक जंगलों के वर्गीकरण में भविष्यवक्ताओं के एक सेट का सापेक्ष महत्व
मैं randomForestआर में एक वर्गीकरण मॉडल की ओर चर के सेटों के सापेक्ष महत्व को निर्धारित करना चाहता हूं । importanceफ़ंक्शन MeanDecreaseGiniप्रत्येक व्यक्तिगत भविष्यवक्ता के लिए मीट्रिक प्रदान करता है - क्या यह एक सेट में प्रत्येक भविष्यवक्ता के समान है? उदाहरण के लिए: # Assumes df has variables a1, …

3
मतलब चुकता त्रुटि और वर्गों के अवशिष्ट योग
विकिपीडिया की परिभाषाओं को देखते हुए: मीन चुकता त्रुटि (MSE) वर्गों का अवशिष्ट योग (आरएसएस) यह मुझे लगता है कि MSE=1NRSS=1N∑(fi−yi)2MSE=1NRSS=1N∑(fi−yi)2\text{MSE} = \frac{1}{N} \text{RSS} = \frac{1}{N} \sum (f_i -y_i)^2 जहां नमूनों की वह संख्या है और के बारे में हमारी अनुमान है ।NNNfifif_iyiyiy_i हालाँकि, विकिपीडिया के किसी भी लेख में …
31 residuals  mse 

4
पूर्वाग्रह का बूटस्ट्रैप अनुमान कब मान्य है?
अक्सर यह दावा किया जाता है कि बूटस्ट्रैपिंग एक अनुमानक में पूर्वाग्रह का अनुमान प्रदान कर सकता है। यदि कुछ स्टेटिस्टिक के लिए अनुमान है, और बूटस्ट्रैप प्रतिकृतियां हैं ( ), तो पूर्वाग्रह का बूटस्ट्रैप अनुमान जो कि बहुत ही सरल और शक्तिशाली लगता है, अस्थिर होने के बिंदु तक।t^t^\hat …
31 bootstrap  bias 

2
libsvm डेटा प्रारूप [बंद]
मैं सदिश वर्गीकरण के लिए libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) टूल का उपयोग कर रहा हूं । हालाँकि, मैं इनपुट डेटा के प्रारूप के बारे में उलझन में हूँ। README से: डेटा फ़ाइल के प्रशिक्षण और परीक्षण का प्रारूप है: <label> <index1>:<value1> <index2>:<value2> ... . . . प्रत्येक पंक्ति में एक …

3
क्या लासो रिग्रेशन मॉडल के लिए एआईसी और बीआईसी की गणना करना संभव है?
क्या लासो रिग्रेशन मॉडल और अन्य नियमित मॉडल के लिए एआईसी या बीआईसी मूल्यों की गणना करना संभव है जहां पैरामीटर केवल समीकरण में आंशिक रूप से प्रवेश कर रहे हैं। स्वतंत्रता की डिग्री कैसे निर्धारित करता है? मैं पैकेज glmnet()से फ़ंक्शन के साथ lasso प्रतिगमन मॉडल फिट करने के …
31 r  model-selection  lasso  aic  bic 

2
कच्चे अवशिष्ट बनाम मानकीकृत अवशिष्ट बनाम छात्र अवशिष्ट - क्या उपयोग करने के लिए कब?
यह एक समान प्रश्न लगता है और कई प्रतिक्रियाएं नहीं मिली हैं। कुक के डी जैसे परीक्षाओं को स्वीकार करना, और एक समूह के रूप में केवल अवशिष्टों को देखना, मैं इस बात में दिलचस्पी रखता हूं कि अन्य लोग किस तरह से अवशिष्ट का उपयोग करते हैं, जो अच्छाई …

3
मेरा डेटा किस वितरण का अनुसरण करता है?
हम कहते हैं कि मेरे पास 1000 घटक हैं और मैं इस बात पर डेटा एकत्र कर रहा हूं कि ये कितनी बार असफलता का कारण बनते हैं और हर बार असफलता को स्वीकार करने के बाद, मैं इस बात पर भी नजर रख रहा हूं कि समस्या को ठीक …

1
हानि फ़ंक्शन और त्रुटि फ़ंक्शन के बीच अंतर क्या है?
"हानि" शब्द "त्रुटि" का पर्याय है? क्या परिभाषा में अंतर है? इसके अलावा, "हानि" शब्द का मूल क्या है? एनबी: यहां उल्लिखित त्रुटि फ़ंक्शन सामान्य त्रुटि के साथ भ्रमित नहीं होना है।

4
लॉजिस्टिक रिग्रेशन के लिए कौन सा नुकसान कार्य सही है?
मैंने लॉजिस्टिक रिग्रेशन के लिए लॉस फ़ंक्शन के दो संस्करणों के बारे में पढ़ा, उनमें से कौन सही है और क्यों? से मशीन लर्निंग , झोउ ZH (चीनी में), के साथ :β=(w,b) and βTx=wTx+bβ=(w,b) and βTx=wTx+b\beta = (w, b)\text{ and }\beta^Tx=w^Tx +b l(β)=∑i=1m(−yiβTxi+ln(1+eβTxi))(1)(1)l(β)=∑i=1m(−yiβTxi+ln⁡(1+eβTxi))l(\beta) = \sum\limits_{i=1}^{m}\Big(-y_i\beta^Tx_i+\ln(1+e^{\beta^Tx_i})\Big) \tag 1 मेरे कॉलेज के …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.