सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

6
मैं कैसे परीक्षण करूं कि दो निरंतर चर स्वतंत्र हैं?
मान लीजिए कि मेरे पास और के संयुक्त वितरण से एक नमूना है । मैं परिकल्पना है कि किस प्रकार जाँच कर और हैं स्वतंत्र ?एक्स वाई एक्स वाई वाई( एक्स)n, वाईn) , एन = 1 .. एन(Xn,Yn),n=1..N(X_n,Y_n), n=1..Nएक्सXXYYYएक्सXXYYY और के संयुक्त या सीमांत वितरण कानूनों पर कोई धारणा नहीं …

4
टी-टेस्ट में टी-मान से मैन्युअल रूप से पी वैल्यू की गणना
मेरे पास 31 मूल्यों के साथ एक नमूना डेटासेट है। मैं दो-पूंछ वाले टी-टेस्ट को आर का उपयोग करके परीक्षण करने के लिए दौड़ाता हूं अगर सही मतलब 10 के बराबर है: t.test(x=data, mu=10, conf.level=0.95) आउटपुट: t = 11.244, df = 30, p-value = 2.786e-12 alternative hypothesis: true mean is …

7
क्या ची-स्क्वेयर हमेशा एकतरफा टेस्ट होता है?
एक प्रकाशित लेख ( पीडीएफ ) में ये 2 वाक्य हैं: इसके अलावा, गलत तरीके से गलत नियमों के लागू होने या सांख्यिकीय परीक्षण के ज्ञान की कमी के कारण हो सकता है। उदाहरण के लिए, एक एनोवा में कुल डीएफ को परीक्षण की रिपोर्टिंग में त्रुटि डीएफ के लिए …

4
बिमोडल वितरण की पहचान कैसे करें?
मैं समझता हूं कि एक बार जब हम एक चार्ट के रूप में मूल्यों की साजिश करते हैं, तो हम जुड़वां चोटियों का अवलोकन करके एक द्विस्तरीय वितरण की पहचान कर सकते हैं, लेकिन कोई इसे प्रोग्रामेटिक रूप से कैसे पाता है? (मैं एक एल्गोरिथ्म की तलाश में हूं।)

5
NaN और NA में क्या अंतर है?
मैं जानना चाहूंगा कि कुछ भाषाओं जैसे R में NA और NaN दोनों क्यों हैं। क्या अंतर हैं या क्या वे समान रूप से समान हैं? क्या वास्तव में NA होना आवश्यक है?
48 r 

17
आपका पसंदीदा डेटा विज़ुअलाइज़ेशन ब्लॉग क्या है?
डेटा विज़ुअलाइज़ेशन पर सबसे अच्छा ब्लॉग क्या है? मैं इस प्रश्न को एक सामुदायिक विकि बना रहा हूँ क्योंकि यह अत्यधिक व्यक्तिपरक है। कृपया प्रत्येक उत्तर को एक लिंक पर सीमित करें। कृपया प्रस्तावित उत्तरों के लिए निम्नलिखित मानदंड पर ध्यान दें: [ए] इस तरह के सवालों के लिए स्वीकार्य …

7
सरल रेखीय प्रतिगमन में स्विचिंग प्रतिक्रिया और व्याख्यात्मक चर का प्रभाव
मान लीजिए कि बीच कुछ "सही" संबंध मौजूद है चलो yyy और xxx ऐसी है कि y=ax+b+ϵy=ax+b+ϵy = ax + b + \epsilon , जहां aaa और bbb स्थिरांक हैं और ϵϵ\epsilon आईआईडी सामान्य शोर है। जब मैं बेतरतीब ढंग से उस आर कोड से डेटा उत्पन्न करता हूं: x …
48 regression 

4
गति आधारित ढाल वंश और नेस्टरोव के त्वरित ढाल वंश के बीच क्या अंतर है?
तो गति आधारित ढाल वंश निम्नानुसार काम करता है: v=self.momentum∗m−lr∗gv=self.momentum∗m−lr∗gv=self.momentum*m-lr*g जहां पिछले वजन अद्यतन है, और जी मापदंडों पी के संबंध में वर्तमान ढाल है , एल आर सीखने की दर है, और एस ई एल एफ है । m o m e n t u m एक स्थिर है।mmmgggppplrlrlrself.momentumself.momentumself.momentum …

2
स्नातक बूस्टिंग पेड़ (GBM) और Adaboost के बीच अंतर की सहज व्याख्या
मैं GBM और Adaboost के बीच के अंतरों को समझने की कोशिश कर रहा हूँ। ये वही हैं जिन्हें मैंने अब तक समझा है: दोनों बूस्टिंग एल्गोरिदम हैं, जो पिछले मॉडल की त्रुटियों से सीखते हैं और अंत में मॉडल का भारित योग बनाते हैं। GBM और Adaboost अपने नुकसान …
48 boosting  gbm  adaboost 

2
क्या प्रत्येक सहसंयोजक मैट्रिक्स सकारात्मक निश्चित है?
मुझे लगता है कि उत्तर हां होना चाहिए, लेकिन मुझे अभी भी लगता है कि कुछ सही नहीं है। साहित्य में कुछ सामान्य परिणाम होने चाहिए, क्या कोई मेरी मदद कर सकता है?

5
कुल्बैक-लीब्लर (केएल) डाइवर्जेंस पर अंतर्ज्ञान
मैंने KL Divergence के पीछे अंतर्ज्ञान के बारे में सीखा है कि डेटा के सैद्धांतिक / सच्चे वितरण से एक मॉडल वितरण फ़ंक्शन कितना भिन्न होता है। मैं जिस स्रोत को पढ़ रहा हूं, वह कहता है कि इन दो वितरणों के बीच 'दूरी' की सहज समझ सहायक है, लेकिन …

1
यदि प्रशिक्षण लक्ष्य है तो मानकीकरण / प्रशिक्षण और सामान्यीकरण कैसे लागू करें?
क्या मैं एक ही समय में अपने सभी डेटा या सिलवटों को बदल देता हूं (यदि CV लागू है)? जैसे (allData - mean(allData)) / sd(allData) क्या मैं ट्रेनसेट और टेस्टसेट को अलग-अलग करूंगा? जैसे (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) या क्या मैं ट्रेनसेट को बदल …

7
जहां एक अनुभवी डेवलपर के लिए आंकड़ों के साथ शुरू करना है
2015 की पहली छमाही के दौरान मैंने मशीन लर्निंग (एंड्रयू एनजी, ग्रेट कोर्स द्वारा) का कोर्स किया। और मशीन लर्निंग (लीनियर रिग्रेशन, लॉजिस्टिक रिग्रेशन, एसवीएम, न्यूरोनल नेटवर्क्स ...) की मूल बातें सीखीं। इसके अलावा, मैं 10 वर्षों के लिए डेवलपर रहा हूं, इसलिए नई प्रोग्रामिंग भाषा सीखना कोई समस्या नहीं …

11
क्या प्लॉट और रैखिक बीजगणित का उपयोग किए बिना सरल रैखिक प्रतिगमन किया जा सकता है?
मैं पूरी तरह से अंधा हूं और एक प्रोग्रामिंग पृष्ठभूमि से आता हूं। जो मैं करने की कोशिश कर रहा हूं वह मशीन सीखना सीखना है, और ऐसा करने के लिए, मुझे पहले रैखिक प्रतिगमन के बारे में जानने की आवश्यकता है। इंटरनेट पर सभी स्पष्टीकरण मैं इस विषय के …

4
सुपरवाइज्ड मशीन लर्निंग में क्लास असंतुलन
यह सामान्य रूप से एक प्रश्न है, किसी विधि या डेटा सेट के लिए विशिष्ट नहीं है। हम सुपरवाइज्ड मशीन लर्निंग में एक वर्ग असंतुलन की समस्या से कैसे निपटते हैं, जहां 0 की संख्या 90% के आसपास है और 1 की संख्या आपके डेटासेट में लगभग 10% है। क्या …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.