सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
सबसेटिंग R समय श्रृंखला वैक्टर
मेरे पास एक समय श्रृंखला है और मैं इसे एक समय श्रृंखला के रूप में रखते हुए, प्रारंभ, अंत और आवृत्ति को संरक्षित करते हुए इसे कम करना चाहता हूं। उदाहरण के लिए, मान लें कि मेरे पास एक समय श्रृंखला है: > qs <- ts(101:110, start=c(2009, 2), frequency=4) > …
25 r  time-series 

1
परिमित सुधार कारक का स्पष्टीकरण
मैं समझता हूं कि जब एक परिमित जनसंख्या और हमारे नमूने का आकार ५% से अधिक होता है, तो हमें इस सूत्र का उपयोग करके नमूना के माध्य और मानक त्रुटि पर सुधार करने की आवश्यकता होती है: एफपीसी= एन- एनएन- 1----√FPC=N−nN−1\hspace{10mm} FPC=\sqrt{\frac{N-n}{N-1}} जहां जनसंख्या का आकार है और नमूना …

4
क्या होगा अगर बातचीत प्रतिगमन में मेरे प्रत्यक्ष प्रभावों को मिटा देती है?
एक प्रतिगमन में, बातचीत शब्द दोनों संबंधित प्रत्यक्ष प्रभावों को मिटा देता है। क्या मैं बातचीत को छोड़ देता हूं या परिणाम की रिपोर्ट करता हूं? बातचीत मूल परिकल्पना का हिस्सा नहीं थी।

6
शीर्ष आवृत्तियों के सेट से जिप्फ़ के नियम गुणांक की गणना कैसे करें?
मेरे पास कई क्वेरी आवृत्तियां हैं, और मुझे जिपफ के कानून के गुणांक का अनुमान लगाने की आवश्यकता है। ये शीर्ष आवृत्तियाँ हैं: 26486 12053 5052 3033 2536 2391 1444 1220 1152 1039

3
कुलबबैक-लीब्लर डाइवर्जेंस की तुलना में वासेरस्टीन मीट्रिक के क्या फायदे हैं?
Wasserstein metric और Kullback-Leibler divergence के बीच व्यावहारिक अंतर क्या है ? वासेरस्टीन मैट्रिक को पृथ्वी के मूवर की दूरी के रूप में भी जाना जाता है । विकिपीडिया से: वासेरस्टीन (या वासेरस्टीन) मीट्रिक एक दूरी फ़ंक्शन है जो किसी दिए गए मीट्रिक स्पेस एम पर संभाव्यता वितरण के बीच …

2
मात्रात्मक प्रतिगमन "काम" कैसे करता है?
मैं मात्रात्मक प्रतिगमन की एक सहज, सुलभ व्याख्या प्राप्त करने की उम्मीद कर रहा हूं। मान लें कि मेरे पास , और भविष्यवाणियों के परिणाम का एक सरल डेटासेट है ।YYYएक्स1, एक्स2एक्स1,एक्स2X_1, X_2 यदि, उदाहरण के लिए, मैं .25, .5, .75 पर एक मात्रात्मक प्रतिगमन चलाता हूं, और वापस ।β0 …

3
दैनिक समय श्रृंखला विश्लेषण
मैं समय श्रृंखला विश्लेषण करने की कोशिश कर रहा हूं और इस क्षेत्र में नया हूं। मेरे पास 2006-2009 की एक घटना की दैनिक गिनती है और मैं इसके लिए एक समय श्रृंखला मॉडल फिट करना चाहता हूं। यहां मैंने जो प्रगति की है वह है: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) …

1
लमे [बंद] में कई (अलग) यादृच्छिक प्रभाव निर्दिष्ट करना
बन्द है। यह सवाल ऑफ टॉपिक है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस सवाल में सुधार करना चाहते हैं? प्रश्न को अपडेट करें ताकि यह क्रॉस मान्य के लिए विषय पर हो । 6 महीने पहले बंद हुआ । मैं आर संकुल nlme और lme4 …

3
श्रेणीगत चर के साथ लॉजिट रिग्रेशन में इंटरेक्टिंग टर्म की व्याख्या करना
मेरे पास एक सर्वेक्षण प्रयोग का डेटा है जिसमें उत्तरदाताओं को चार समूहों में से एक को यादृच्छिक रूप से सौंपा गया था: > summary(df$Group) Control Treatment1 Treatment2 Treatment3 59 63 62 66 जबकि तीन उपचार समूह लागू किए गए उत्तेजना में थोड़ा भिन्न होते हैं, मुख्य भेद जो मुझे …

5
कारण विश्लेषण का परिचय
क्या अच्छी किताबें हैं जो कारण विश्लेषण का परिचय देती हैं? मैं एक ऐसे परिचय के बारे में सोच रहा हूं जो दोनों कारण विश्लेषण के सिद्धांतों की व्याख्या करता है और दिखाता है कि इन सिद्धांतों को लागू करने के लिए विभिन्न सांख्यिकीय तरीकों का उपयोग कैसे किया जा …

3
मल्टीलेबल डेटा की सटीकता के लिए क्या उपाय हैं?
एक परिदृश्य पर विचार करें, जहाँ आपको KnownLabel मैट्रिक्स और PredencedLabel मैट्रिक्स प्रदान किया गया है। मैं ज्ञात लॉबेल मैट्रिक्स के खिलाफ प्रेडिक्टेलबेल मैट्रिक्स की अच्छाई को मापना चाहता हूं। लेकिन यहां चुनौती यह है कि नाउनलैबेल मैट्रिक्स की कुछ पंक्तियाँ केवल एक 1 है और दूसरी कुछ पंक्तियों में …

5
क्लस्टरिंग प्रक्रिया जहां प्रत्येक क्लस्टर में समान अंक होते हैं?
मेरे पास में कुछ बिंदु , और मैं चाहता हूं कि अंक मिले:X={x1,...,xn}X={x1,...,xn}X=\{x_1,...,x_n\}RpRpR^p प्रत्येक क्लस्टर में के तत्वों की बराबर संख्या होती है । (मान लें कि क्लस्टर की संख्या विभाजित करती है ।)XXXnnn प्रत्येक क्लस्टर कुछ अर्थों में "स्थानिक रूप से सामंजस्यपूर्ण" है, जैसे -means से क्लस्टर ।kkk यह …

4
स्वतंत्र चर = यादृच्छिक चर?
मैं थोड़ा भ्रमित हूँ अगर एक सांख्यिकीय मॉडल में एक स्वतंत्र चर (जिसे भविष्यवक्ता या सुविधा भी कहा जाता है), उदाहरण के लिए, रैखिक प्रतिगमन में , एक यादृच्छिक चर है?एक्सXXY= β0+ β1एक्सY=β0+β1XY=\beta_0+\beta_1 X

2
यदि अवलोकनों की नक़ल की जाती है तो नमूने का विचलन क्यों बदल जाता है?
विचरण को प्रसार का एक उपाय कहा जाता है। इसलिए, मैंने सोचा था कि संख्याओं 3,5के विचरण 3,3,5,5समान हैं क्योंकि संख्याएँ समान रूप से फैली हुई हैं। लेकिन यह वैसा नहीं है 3,5, 2जबकि का विचरण 3,3,5,5है 1 1/3। इस पहेली ने मुझे यह समझा दिया कि विचरण को फैलने …
25 variance 

2
वेक्टर रिग्रेशन का समर्थन सहज तरीके से कैसे करता है?
एसवीएम के सभी उदाहरण वर्गीकरण से संबंधित हैं। मुझे समझ में नहीं आता है कि प्रतिगमन के लिए एक एसवीएम (सपोर्ट वेक्टर रेजिस्टर) का उपयोग प्रतिगमन में कैसे किया जा सकता है। मेरी समझ से, एक एसवीएम अधिकतम हाइपरप्लेन को खोजने के लिए दो वर्गों के बीच के अंतर को …
25 regression  svm 

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.