सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

1
मार्कोव निर्णय प्रक्रियाओं के वास्तविक जीवन के उदाहरण
मैं बहुत सारे ट्यूटोरियल वीडियो देख रहा हूं और वे समान दिख रहे हैं। उदाहरण के लिए यह एक: https://www.youtube.com/watch?v=ip4iSMRW5X4 वे राज्यों, कार्यों और संभावनाओं की व्याख्या करते हैं जो ठीक हैं। वह व्यक्ति इसे ठीक बताता है, लेकिन मैं वास्तविक जीवन में इसका उपयोग करने के लिए इसकी पकड़ …

5
क्या हमें अभी भी रेग्युलराइजेशन एल्गोरिदम का उपयोग करते हुए फीचर चयन करने की आवश्यकता है?
मेरे पास सांख्यिकीय सीखने के एल्गोरिथ्म को चलाने से पहले सुविधा चयन विधियों (रैंडम फ़ॉरेस्ट्स फ़ीचर महत्व मान या Univariate सुविधा चयन विधियों आदि) का उपयोग करने की आवश्यकता के संबंध में एक प्रश्न है। हम जानते हैं कि ओवरफिटिंग से बचने के लिए हम वेट वैक्टर पर रेगुलराइजेशन पेनल्टी …

4
हाइपरपरमेटर ट्यूनिंग क्रॉस-वेलिडेशन के बाहर कितना बुरा है?
मुझे पता है कि क्रॉस-वैलिडेशन के बाहर हाइपरपैरेट ट्यूनिंग करने से बाहरी वैधता का पक्षपाती-उच्च अनुमान हो सकता है, क्योंकि प्रदर्शन को मापने के लिए आप जो डेटासेट का उपयोग करते हैं, वही आप सुविधाओं को ट्यून करने के लिए उपयोग करते हैं। मैं सोच रहा हूँ कि यह एक …

1
भावना विश्लेषण के लिए पैराग्राफ वैक्टर का उपयोग करने के लिए अत्याधुनिक प्रदर्शन की सूचना दी गई है?
मैं Le और मिकोलोव द्वारा ICML 2014 के पेपर " डिस्ट्रक्टेड रिप्रेजेंटेशन ऑफ सेंटेंस एंड डॉक्यूमेंट्स " में परिणामों से प्रभावित हुआ था । जिस तकनीक का वे वर्णन करते हैं, उसे "पैराग्राफ वैक्टर" कहा जाता है, शब्द 2vec मॉडल के विस्तार के आधार पर, मनमाने ढंग से लंबे पैराग्राफ …

2
कैसे इन acf और pacf भूखंडों की व्याख्या करने के लिए
निम्नलिखित मासिक डेटा श्रृंखला के एसीएफ और पीएसीएफ प्लॉट हैं। दूसरा प्लॉट ci.type = 'ma' के साथ acf है: Acf प्लॉट में उच्च मूल्यों की दृढ़ता शायद एक दीर्घकालिक सकारात्मक प्रवृत्ति का प्रतिनिधित्व करती है। सवाल यह है कि क्या यह मौसमी बदलाव का प्रतिनिधित्व करता है? मैंने इस विषय …

1
एक सर्वश्रेष्ठ रैखिक निष्पक्ष प्रिडिक्टर (BLUP) से अनुमानित मूल्य एक सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक (BLUE) से भिन्न क्यों हैं?
मैं समझता हूं कि उनके बीच का अंतर इस बात से संबंधित है कि क्या मॉडल में समूहीकरण चर एक निश्चित या यादृच्छिक प्रभाव के रूप में अनुमानित है, लेकिन यह मेरे लिए स्पष्ट नहीं है कि वे समान क्यों नहीं हैं (यदि वे समान नहीं हैं)। मुझे विशेष रूप …

2
पीसीए पर एसवीडी का कोई फायदा है?
मुझे पता है कि गणितीय रूप से पीसीए और एसवीडी की गणना कैसे की जाती है, और मुझे पता है कि दोनों को रैखिक लीवर स्क्वेयर प्रतिगमन पर लागू किया जा सकता है। एसवीडी का गणितीय रूप से मुख्य लाभ यह प्रतीत होता है कि इसे गैर-वर्ग मैट्रिस पर लागू …
20 pca  least-squares  svd 

1
सीमांत प्रभावों की मानक त्रुटियों के लिए डेल्टा विधि का उपयोग कैसे करें?
मैं एक प्रतिगमन मॉडल के औसत सीमांत प्रभावों की मानक त्रुटियों को समझने के लिए डेल्टा विधि को बेहतर ढंग से समझने में दिलचस्पी रखता हूं जिसमें एक बातचीत शब्द शामिल है। मैंने डेल्टा-विधि के अंतर्गत संबंधित प्रश्नों को देखा है, लेकिन किसी ने भी मुझे जो खोजा है वह …

6
क्या माध्य "माध्य" के कुछ सामान्यीकरण के लिए माध्य का एक प्रकार है?
"माध्य" की अवधारणा पारंपरिक अंकगणित माध्य की तुलना में दूर तक घूमती है; क्या यह इतनी दूर है कि मंझला शामिल है? समानता से, कच्चे डेटा ⟶आईडीकच्चे डेटा ⟶मतलबकच्चा मतलब ⟶आईडी- 1अंकगणित औसतकच्चे डेटा ⟶RECIPपारस्परिक ⟶मतलबmean reciprocal⟶recip−1harmonic meanraw data⟶loglogs⟶meanmean log⟶log−1geometric meanraw data⟶squaresquares⟶meanmean square⟶square−1root mean squareraw data⟶rankranks⟶meanmean rank⟶rank−1medianraw data⟶idraw data⟶meanraw mean⟶id−1arithmetic …
20 mean  average  median 

2
रैखिक परिवर्तन के बाद एक यादृच्छिक वेक्टर का सहसंयोजक
यदि यादृच्छिक वेक्टर है और एक निश्चित मैट्रिक्स है, तो क्या कोई यह समझा सकता है कि क्योंजेडजेड\mathbf {Z}एएAc o v [A Z ]=A c o v [ Z ] A⊤।सीओv[एजेड]=एसीओv[जेड]ए⊤।\mathrm{cov}[A \mathbf {Z}]= A \mathrm{cov}[\mathbf {Z}]A^\top.
20 covariance 

3
कुछ मूल्य के खिलाफ टेस्ट मॉडल गुणांक (प्रतिगमन ढलान)
आर में, जब मैं एक (सामान्यीकृत) रेखीय मॉडल है ( lm, glm, gls, glmm, ...), मैं कैसे गुणांक (प्रतिगमन ढलान) 0 के अलावा कोई अन्य मूल्य के खिलाफ परीक्षण कर सकते हैं? मॉडल के सारांश में, गुणांक के टी-परीक्षण के परिणाम स्वचालित रूप से रिपोर्ट किए जाते हैं, लेकिन केवल …
20 r  regression  t-test 

1
R में रैखिक प्रतिगमन में माध्य चुकता त्रुटि का मान कैसे प्राप्त करें
R फ़ंक्शन lm द्वारा प्राप्त एक रेखीय प्रतिगमन मॉडल को यह जानना चाहेंगे कि क्या मीन स्क्वेर्ड एरर कमांड द्वारा इसे प्राप्त करना संभव है। मेरे पास एक उदाहरण का FOLLOWING आउटपुट था > lm <- lm(MuscleMAss~Age,data) > sm<-summary(lm) > sm Call: lm(formula = MuscleMAss ~ Age, data = data) …
20 r  regression  error 

2
कारक स्कोर की गणना करने के तरीके, और पीसीए या कारक विश्लेषण में "स्कोर गुणांक" मैट्रिक्स क्या है?
मेरी समझ के अनुसार, सहसंबंधों के आधार पर पीसीए में हमें कारक (इस उदाहरण में प्रमुख घटक) लोडिंग मिलते हैं जो चर और कारकों के बीच संबंध के अलावा और कुछ नहीं हैं। अब जब मुझे एसपीएसएस में कारक स्कोर उत्पन्न करने की आवश्यकता होती है , तो मैं सीधे …

2
गिब्स का नमूना बनाम एमएच-एमसीएमसी
मैं अभी गिब्स नमूना और मेट्रोपोलिस हेस्टिंग्स एल्गोरिथ्म पर कुछ पढ़ रहा हूं और कुछ सवालों का जवाब दिया है। जैसा कि मैं इसे समझता हूं, गिब्स नमूनाकरण के मामले में, यदि हमारे पास एक बड़ी बहुभिन्नरूपी समस्या है, तो हम सशर्त वितरण से नमूना लेते हैं अर्थात नमूना एक …

4
क्या कोई निर्णय-वृक्ष की तरह एल्गोरिथ्म अप्रमाणित क्लस्टरिंग के लिए है?
मेरे पास एक डेटासेट है जिसमें 5 विशेषताएं हैं: ए, बी, सी, डी, ई। वे सभी संख्यात्मक मूल्य हैं। घनत्व-आधारित क्लस्टरिंग करने के बजाय, मैं जो करना चाहता हूं वह डेटा को निर्णय-ट्री-जैसे तरीके से क्लस्टर करना है। मेरा मतलब है कि दृष्टिकोण कुछ इस तरह है: एल्गोरिथ्म डेटा को …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.