सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

3
रैखिक प्रतिगमन में गुणांक के विचरण-कोविरियन मैट्रिक्स कैसे प्राप्त करें
मैं रेखीय प्रतिगमन पर एक किताब पढ़ रहा हूं और के विचरण-सहसंयोजक मैट्रिक्स को समझने में कुछ परेशानी हो रही है :bb\mathbf{b} विकर्ण आइटम काफी आसान होते हैं, लेकिन ऑफ-विकर्ण कुछ अधिक कठिन होते हैं, जो पहेलियाँ मेरे लिए है वह σ(b0,b1)=E(b0b1)−E(b0)E(b1)=E(b0b1)−β0β1σ(b0,b1)=E(b0b1)−E(b0)E(b1)=E(b0b1)−β0β1 \sigma(b_0, b_1) = E(b_0 b_1) - E(b_0)E(b_1) = …
36 regression 

4
आर में गैर-नकारात्मक चर के घनत्व भूखंडों के लिए अच्छे तरीके?
plot(density(rexp(100)) जाहिर है शून्य के बाईं ओर सभी घनत्व पूर्वाग्रह का प्रतिनिधित्व करते हैं। मैं गैर-सांख्यिकीविदों के लिए कुछ डेटा को संक्षेप में प्रस्तुत करना चाह रहा हूं, और मैं इस सवाल से बचना चाहता हूं कि गैर-नकारात्मक डेटा में शून्य के बाईं ओर घनत्व क्यों है। भूखंड यादृच्छिकता जाँच …

2
मल्टीमोनियल लॉजिस्टिक रिग्रेशन बनाम एक-बनाम-बाकी बाइनरी लॉजिस्टिक रिग्रेशन
हम कहते हैं कि हमारे पास कुछ श्रेणियों और स्वतंत्र चर के सेट के साथ एक आश्रित चर । YYY बाइनरी लॉजिस्टिक रिग्रेशन (यानी एक-बनाम-बाकी योजना ) के सेट पर बहुराष्ट्रीय लॉजिस्टिक रिग्रेशन के क्या फायदे हैं ? बाइनरी लॉजिस्टिक रिग्रेशन के सेट से मेरा मतलब है कि प्रत्येक श्रेणी …

3
परिकल्पना परीक्षण में पी-मूल्य की व्याख्या
मैं हाल ही में "द इनसिग्निफिकेंस ऑफ नाल हाइपोथीसिस सिग्नेचर टेस्टिंग", जेफ गिल (1999) के पेपर पर आया था । लेखक ने परिकल्पना परीक्षण और पी-मूल्यों के बारे में कुछ सामान्य गलतफहमियाँ उठाईं, जिनके बारे में मेरे दो विशिष्ट प्रश्न हैं: पी-मूल्य तकनीकी रूप से है है, जो, कागज द्वारा …

6
"समझ से दूर" करना सहज ज्ञान क्यों है?
मैंने हाल ही में संभाव्य तर्क के एक सिद्धांत के बारे में सीखा है जिसे " दूर समझा जाना" कहा जाता है , और मैं इसके लिए एक अंतर्ज्ञान को समझने की कोशिश कर रहा हूं। मुझे एक परिदृश्य सेट करने दें। चलो घटना है कि एक भूकंप उत्पन्न हो …

3
कैसे> 50K चर के साथ लासो या रिज प्रतिगमन में संकोचन पैरामीटर का अनुमान लगाने के लिए?
मैं 50,000 से अधिक वैरिएबल वाले मॉडल के लिए लासो या रिज रिग्रेशन का उपयोग करना चाहता हूं। मैं आर में सॉफ्टवेयर पैकेज का उपयोग करना चाहता हूं। मैं सिकुड़न पैरामीटर ( ) का अनुमान कैसे लगा सकता हूं ?λλ\lambda संपादन: यहाँ बिंदु है जो मुझे मिला है: set.seed (123) …

3
आंकड़ों में स्नातकोत्तर कार्यक्रमों के बारे में विचार करने के लिए चीजें
यह स्नातक स्कूलों के लिए प्रवेश का मौसम है। मैं और मेरे जैसे कई छात्र) अब यह तय करने की कोशिश कर रहे हैं कि कौन से आंकड़े लेने हैं। आप के साथ काम करने वाले कुछ लोग क्या सुझाव देते हैं कि हम आंकड़ों में मास्टर्स कार्यक्रमों के बारे …

4
केंद्रीय सीमा प्रमेय (CLT) में कहां से आता है?
रूप में केंद्रीय सीमित प्रमेय का एक बहुत ही सरल संस्करण जो लिंडबर्ग-लेवी CLT है। मुझे समझ में नहीं आ रहा है कि बाईं ओर एक क्यों है। और लायपुनोव CLT कहते हैं कि लेकिन क्यों नहीं ? क्या कोई मुझे बताएगा कि ये कारक क्या हैं, ऐसे और ? …

2
गैर iid गाऊसी चर के योग का वितरण क्या है?
यदि को वितरित किया जाता है , तो को और को वितरित किया जाता है , मुझे पता है कि को वितरित किया गया है) यदि X और Y स्वतंत्र हैं।XXXN(μX,σ2X)N(μX,σX2)N(\mu_X, \sigma^2_X)YYYN(μY,σ2Y)N(μY,σY2)N(\mu_Y, \sigma^2_Y)Z=X+YZ=X+YZ = X + YZZZN(μX+μY,σ2X+σ2Y)N(μX+μY,σX2+σY2)N(\mu_X + \mu_Y, \sigma^2_X + \sigma^2_Y) लेकिन क्या होगा यदि X और Y स्वतंत्र …

4
मशीन सीखने के लिए क्लाउड कंप्यूटिंग प्लेटफॉर्म [बंद]
मुझे उन कंपनियों की एक छोटी सूची मिली है जो अमेज़ॅन EC2 के शीर्ष पर निर्मित क्लस्टर पर आर, अजगर, या ऑक्टेव स्क्रिप्ट चलाने के लिए एक मंच प्रदान करती हैं। क्या अन्य नाम हैं जिन्हें मुझे जोड़ना चाहिए? Cloudnumbers Opani crdata

4
मैं आर में एक विवश प्रतिगमन को कैसे फिट करूं ताकि गुणांक कुल = 1 हो?
मुझे यहाँ एक समान विवशता दिखाई देती है: एक निर्दिष्ट बिंदु के माध्यम से रेखीय प्रतिगमन को विवश किया लेकिन मेरी आवश्यकता थोड़ी अलग है। मुझे 1 में जोड़ने के लिए गुणांक की आवश्यकता है। विशेष रूप से मैं 3 अन्य विदेशी मुद्रा श्रृंखलाओं के खिलाफ 1 विदेशी मुद्रा श्रृंखला …
36 r  regression 

5
डेटा खनन में लिफ्ट उपाय
मैंने यह जानने के लिए कई वेबसाइटों को खोजा कि वास्तव में लिफ्ट क्या करेगी? मुझे जो परिणाम मिले, वे सभी अनुप्रयोगों में इसका उपयोग करने के बारे में थे, स्वयं नहीं। मुझे समर्थन और विश्वास समारोह के बारे में पता है। विकिपीडिया से, डाटा माइनिंग में, लिफ्ट एक मॉडल …

3
यादृच्छिक जंगलों में वोटों से एक "निश्चित स्कोर" बनाना?
मैं एक वर्गीकारक कि भेद जाएगा प्रशिक्षित करने के लिए देख रहा हूँ Type Aऔर Type Bलगभग 10,000 वस्तुओं की एक यथोचित बड़े प्रशिक्षण सेट के साथ वस्तुओं, के बारे में आधा हिस्सा हैं Type Aऔर आधा हिस्सा हैं Type B। डेटासेट में कोशिकाओं के भौतिक गुणों (आकार, माध्य त्रिज्या, …

5
R में कार्य करना [बंद]
मैं उस समय को मापना चाहूंगा जो किसी फ़ंक्शन को चलाने में दोहराता है। के replicate()लिए उपयोग कर रहे हैं और छोरों बराबर? उदाहरण के लिए: system.time(replicate(1000, f())); system.time(for(i in 1:1000){f()}); जो पसंदीदा तरीका है। के आउटपुट में system.time(), sys+userप्रोग्राम को चलाने के लिए वास्तविक CPU समय है? है elapsedकार्यक्रम …
36 r 

8
किन परिस्थितियों में बहुस्तरीय / पदानुक्रमित विश्लेषण का उपयोग करना चाहिए?
किन परिस्थितियों में किसी को बहुस्तरीय / पदानुक्रमित विश्लेषण का उपयोग करने पर विचार करना चाहिए क्योंकि अधिक बुनियादी / पारंपरिक विश्लेषण (जैसे, एनोवा, ओएलएस प्रतिगमन, आदि) के विपरीत? क्या ऐसी कोई परिस्थितियां हैं जिनमें इसे अनिवार्य माना जा सकता है? क्या ऐसी परिस्थितियाँ हैं जिनमें बहुस्तरीय / श्रेणीबद्ध विश्लेषण …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.