सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
फॉर्म मॉडल के लिए प्रतिगमन ?
मेरे पास एक डेटासेट है जो एक वेब चर्चा मंच से आंकड़े हैं। मैं उन उत्तरों की संख्या के वितरण को देख रहा हूं जिनके विषय की अपेक्षा की जाती है। विशेष रूप से, मैंने एक डेटासेट बनाया है जिसमें विषय उत्तर की सूची गिना जाता है, और फिर उन …

1
क्या मल्टीकोलिनरिटी के विशिष्ट माप को प्राथमिकता देने का एक कारण है?
जब कई इनपुट चर के साथ काम कर, हम अक्सर के बारे में चिंतित हैं multicollinearity । मल्टीकोलिनरिटी के कई उपाय हैं जो मल्टीकोलिनरिटी का पता लगाने, सोचने और / या संवाद करने के लिए उपयोग किए जाते हैं। कुछ सामान्य सिफारिशें हैं: एक विशेष चर के लिए कई R2jRj2R^2_j …

2
प्रतिबंधित बोल्ट्जमैन मशीनों बनाम बहुपरत तंत्रिका नेटवर्क
मैं एक वर्गीकरण समस्या के लिए एक तंत्रिका नेटवर्क के साथ प्रयोग करना चाहता हूं जिसे मैं सामना कर रहा हूं। मैं RBM की बात करने वाले पत्रों में भाग गया। लेकिन मैं जो समझ सकता हूं, वे बहुपरत तंत्रिका नेटवर्क से अलग नहीं हैं। यह सटीक है? इसके अलावा …

2
भारित विचरण में पूर्वाग्रह सुधार
अनवीटेड विचरण में बायस मौजूद है, जब उसी डेटा से माध्य का अनुमान लगाया गया था: वार(एक्स):=1वार ( एक्स)) : = 1nΣमैं( x)मैं- μ )2वार(एक्स): =1nΣमैं(एक्समैं-μ)2\text{Var}(X):=\frac{1}{n}\sum_i(x_i - \mu)^2वार ( एक्स)) : = 1एन - 1Σमैं( x)मैं−E[X])2Var(X):=1n−1∑i(xi−E[X])2\text{Var}(X):=\frac{1}{n-1}\sum_i(x_i - E[X])^2 मैं भारित माध्य और विचरण में देख रहा हूं, और सोच रहा …

5
R का यादृच्छिकफॉरस्ट 32 से अधिक स्तरों को नहीं संभाल सकता है। वर्कअराउंड क्या है?
आर के यादृच्छिकफॉरस्ट पैकेज 32 से अधिक स्तरों के साथ कारक को संभाल नहीं सकता है। जब इसे 32 से अधिक स्तरों पर दिया जाता है, तो यह एक त्रुटि संदेश देता है: 32 से अधिक श्रेणियों के साथ श्रेणीबद्ध भविष्यवाणियों को संभाल नहीं सकते। लेकिन डेटा मेरे पास कई …

5
ओएलएस की तुलना में क्वांटाइल रिग्रेशन कब बदतर है?
कुछ अनोखी परिस्थितियों के अलावा जहाँ हमें सशर्त मतलबी संबंधों को समझना चाहिए, वे कौन से परिस्थितियाँ हैं जहाँ एक शोधकर्ता को क्वांटम रिग्रेशन पर ओएलएस चुनना चाहिए? मैं नहीं चाहता कि उत्तर "यदि पूंछ संबंधों को समझने में कोई फायदा नहीं है", जैसा कि हम ओएलएस विकल्प के रूप …

3
असमान विचरण के साथ प्रतिगमन मॉडलिंग
मैं एक लीनियर मॉडल (lm) फिट करना चाहूंगा जहां अवशिष्ट विचरण स्पष्ट रूप से व्याख्यात्मक चर पर निर्भर करता है। जिस तरह से मैं ऐसा करना जानता हूं वह गामा परिवार के साथ चमक का उपयोग करके विचरण करने के लिए है, और फिर एलएम फ़ंक्शन में इसके व्युत्क्रम को …

3
पर्यवेक्षित क्लस्टरिंग या वर्गीकरण?
दूसरा सवाल यह है कि मुझे वेब पर एक चर्चा में "पर्यवेक्षण क्लस्टरिंग" के बारे में बात करते हुए पाया गया, जहां तक ​​मुझे पता है, क्लस्टरिंग अनसुनी है, तो "पर्यवेक्षित क्लस्टरिंग" के पीछे वास्तव में क्या अर्थ है? "वर्गीकरण" के संबंध में क्या अंतर है? इसके बारे में बात …

4
एक प्राकृतिक लघुगणक का अपेक्षित मूल्य
मुझे पता है कि साथ , इसलिए , इसे हल करना आसान है। मुझे यह भी पता है कि आप इसे लागू नहीं कर सकते हैं, जब इसका एक nonlinear फ़ंक्शन, जैसे इस मामले में , और इसे हल करने के लिए, मुझे एक सन्निकटन करना है टेलर के साथ। …

3
ए / बी परीक्षण के लिए नमूना आकार का सुरक्षित रूप से निर्धारण
मैं एक सॉफ्टवेयर इंजीनियर हूं, जो ए / बी टेस्टिंग टूल बनाना चाहता हूं । मेरे पास एक ठोस आँकड़े पृष्ठभूमि नहीं है, लेकिन पिछले कुछ दिनों में पढ़ने में काफी कमी आई है। मैं यहाँ वर्णित कार्यप्रणाली का अनुसरण कर रहा हूं और नीचे दिए गए प्रासंगिक बिंदुओं को …

1
क्या असंगत अनुमानक कभी बेहतर होते हैं?
संगति स्पष्ट रूप से एक प्राकृतिक और महत्वपूर्ण संपत्ति अनुमानक है, लेकिन क्या ऐसी परिस्थितियां हैं जहां एक सुसंगत अनुमानक का उपयोग सुसंगत एक के बजाय बेहतर हो सकता है? अधिक विशेष रूप से, एक असंगत अनुमानक के उदाहरण हैं जो सभी परिमित लिए एक उचित सुसंगत अनुमानक हैं (कुछ …


1
आर में, एक हेसियन मैट्रिक्स के साथ आशा से आउटपुट दिया गया, हेसियन मैट्रिक्स का उपयोग करके पैरामीटर विश्वास अंतराल की गणना कैसे करें?
एक हेसियन मैट्रिक्स के साथ आशा से उत्पादन को देखते हुए, हेसियन मैट्रिक्स का उपयोग करके पैरामीटर विश्वास अंतराल की गणना कैसे करें? fit<-optim(..., hessian=T) hessian<-fit$hessian मैं अधिक से अधिक संभावना विश्लेषण के संदर्भ में दिलचस्पी रखता हूं, लेकिन यह जानने के लिए उत्सुक हूं कि क्या विधि का विस्तार …

4
आर में 100 चर के साथ एक रेखीय मॉडल सूत्र कैसे लिखें
ताला लगा हुआ । यह सवाल और इसके जवाब बंद हैं क्योंकि यह सवाल ऑफ-टॉपिक है लेकिन इसका ऐतिहासिक महत्व है। यह वर्तमान में नए उत्तर या इंटरैक्शन स्वीकार नहीं कर रहा है। क्या R के 100 मापदंडों वाले मॉडल पर रैखिक प्रतिगमन बनाने के लिए R में एक आसान …
22 r 

4
एक ग्राहक को क्या कहना है जो सोचता है कि आत्मविश्वास अंतराल उपयोगी होने के लिए बहुत व्यापक हैं?
मान लीजिए मैं एक सलाहकार हूं और मैं अपने ग्राहक को विश्वास अंतराल की उपयोगिता समझाना चाहता हूं। क्लाइंट मुझसे कहता है कि मेरे अंतराल उपयोगी होने के लिए बहुत चौड़े हैं और वह आधे लोगों को व्यापक रूप से उपयोग करना पसंद करेगा। मुझे कैसे जवाब देना चाहिए?

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.