सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
एक वेक्टर में मूल्य का अनुमानित मात्रा
मेरे पास वास्तविक संख्याओं का एक समूह है। मुझे एक नई संख्या की मात्रा का अनुमान लगाने की आवश्यकता है। क्या आर में ऐसा करने का कोई साफ तरीका है? सामान्य रूप में? मुझे आशा है कि यह अति-तुच्छ नहीं है; ;-) आपकी प्रतिक्रिया के लिए बहुत सराहना की। पी
26 r 

2
समस्वरता सम्‍मिलित होने पर सम्‍मिलित निदान सम्‍मिलित करता है
मैंने यूएस काउंटियों पर एक प्रतिगमन चलाया है, और अपने 'स्वतंत्र' चर में कोलिनियरिटी के लिए जाँच कर रहा हूँ। Belsley, Kuh, और Welsch का Regगमन डायग्नॉस्टिक्स सुझाव देता है कि वह इंडेक्स इंडेक्स और वियरेन्स अपघटन अनुपात देख रहा है: library(perturb) ## colldiag(, scale=TRUE) for model with interaction Condition …

2
एक विशाल विरल मैट्रिक्स के एसवीडी की गणना कैसे करें?
एक बहुत बड़े धनात्मक मैट्रिक्स (65M x 3.4M) के एकवचन मान अपघटन (SVD) की गणना करने का सबसे अच्छा तरीका क्या है जहाँ डेटा अत्यंत विरल है? मैट्रिक्स का 0.1% से कम गैर शून्य है। मुझे एक तरीका चाहिए: मेमोरी में फिट होगा (मुझे पता है कि ऑनलाइन तरीके मौजूद …
26 svd  numerics 

3
मैं अपने ग्लैमर आउटपुट में 'निश्चित प्रभावों के सहसंबंध' की व्याख्या कैसे करूं?
मेरे पास निम्न आउटपुट हैं: Generalized linear mixed model fit by the Laplace approximation Formula: aph.remain ~ sMFS2 +sAG2 +sSHDI2 +sbare +season +crop +(1|landscape) AIC BIC logLik deviance 4062 4093 -2022 4044 Random effects: Groups Name Variance Std.Dev. landscape (Intercept) 0.82453 0.90804 Number of obs: 239, groups: landscape, 45 Fixed …

3
गौसियन प्रक्रिया मॉडल को गैर-पैरामीट्रिक क्यों कहा जाता है?
मैं थोड़ा असमंजस में हूँ। गौसियन प्रक्रियाओं को गैर पैरामीट्रिक मॉडल क्यों कहा जाता है? वे मानते हैं कि कार्यात्मक मान, या उनमें से एक सबसेट, गॉसियन है जिसका मतलब मीन 0 से पहले है और कर्नेल फ़ंक्शन के रूप में दिए गए कोवरियनस फ़ंक्शन। इन कर्नेल फ़ंक्शंस में स्वयं …

2
"डबल लैस्सो" या दो बार लैस्सो करने के फायदे?
मैंने एक बार दो बार लासो का उपयोग करने की एक विधि (एक डबल-लासो की तरह) सुनी थी जहाँ आप चर के मूल सेट पर लासो प्रदर्शन करते हैं, S1 कहते हैं, S2 नामक एक विरल सेट प्राप्त करें, और फिर सेट S2 प्राप्त करने के लिए S2 पर फिर …

2
आर में कई प्रतिगमन के लिए परिवर्तनशील चर
में एक से अधिक प्रतिगमन करने की कोशिश कर रहा हूँ R। हालाँकि, मेरे आश्रित चर में निम्नलिखित कथानक हैं: यहाँ मेरे सभी चरों के साथ एक स्कैप्लेट मैट्रिक्स है ( WARआश्रित चर है): मुझे पता है कि मुझे इस चर (और संभवतः स्वतंत्र चर?) पर एक परिवर्तन करने की …

1
क्या मेंटल टेस्ट को असममित मैट्रिसेस तक बढ़ाया जा सकता है?
मेंटल परीक्षण आमतौर पर सममित दूरी / अंतर मैट्रिक्स लिए आवेदन किया है। जहां तक ​​मैं समझता हूं, परीक्षण की एक धारणा यह है कि मतभेदों को परिभाषित करने के लिए इस्तेमाल किया जाने वाला उपाय कम से कम एक अर्ध-मीट्रिक होना चाहिए (एक मीट्रिक की मानक आवश्यकताओं को पूरा …

6
डेटा के लिए एक साइनसोइडल शब्द को फिट करें
हालाँकि मैं इस पोस्ट को पढ़ता हूं , फिर भी मुझे नहीं पता कि इसे अपने डेटा पर कैसे लागू किया जाए और मुझे उम्मीद है कि कोई मेरी मदद कर सकता है। मेरे पास निम्न डेटा है: y <- c(11.622967, 12.006081, 11.760928, 12.246830, 12.052126, 12.346154, 12.039262, 12.362163, 12.009269, 11.260743, …
26 r  regression  fitting 

5
विभिन्न दर्शकों के लिए उन्नत आँकड़े पेश करने की रणनीतियाँ
मैं मुख्य रूप से चिकित्सा, सामाजिक विज्ञान और शिक्षा जैसे क्षेत्रों में गैर-सांख्यिकीविदों के साथ काम करता हूं। चाहे मैं स्नातक छात्रों के साथ परामर्श कर रहा हूं, लेखों के साथ शोधकर्ताओं की मदद कर रहा हूं या पत्रिकाओं के लिए लेखों की समीक्षा कर रहा हूं, मुझे अक्सर यह …
26 consulting 

3
विषय मॉडल और शब्द सह-घटना विधियाँ
एलडीए जैसे लोकप्रिय विषय मॉडल आमतौर पर क्लस्टर शब्द होते हैं जो एक साथ एक ही विषय (क्लस्टर) में होते हैं। इस तरह के विषय मॉडल और अन्य सरल सह-घटना आधारित पीएमआई जैसे क्लस्टरिंग दृष्टिकोणों के बीच मुख्य अंतर क्या है? (पीएमआई का मतलब पॉइंटवाइज म्युचुअल इंफॉर्मेशन से है, और …

1
रैखिक प्रतिगमन में गुणांक मानक त्रुटियों की व्याख्या कैसे करें?
मैं सोच रहा हूं कि आर में प्रदर्शन फ़ंक्शन का उपयोग करते समय एक प्रतिगमन के गुणांक मानक त्रुटियों की व्याख्या कैसे करें। निम्न आउटपुट में उदाहरण के लिए: lm(formula = y ~ x1 + x2, data = sub.pyth) coef.est coef.se (Intercept) 1.32 0.39 x1 0.51 0.05 x2 0.81 0.02 …

6
लॉजिस्टिक प्रतिगमन के लिए नमूना आकार?
मैं अपने सर्वेक्षण डेटा से एक लॉजिस्टिक मॉडल बनाना चाहता हूं। यह चार आवासीय कॉलोनियों का एक छोटा सा सर्वेक्षण है जिसमें केवल 154 उत्तरदाताओं का साक्षात्कार लिया गया था। मेरा आश्रित चर "काम करने के लिए संतोषजनक संक्रमण" है। मैंने पाया कि, 154 उत्तरदाताओं में से 73 ने कहा …

2
बिना टी-टेस्ट के बजाय विलकॉक्सन रैंक-सम टेस्ट का उपयोग कब करें?
फ्रैंक हारेल ने यहां जो लिखा है, यह एक अनुवर्ती प्रश्न है : मेरे अनुभव में टी वितरण के लिए आवश्यक नमूना आकार अक्सर हाथ में नमूना आकार से बड़ा होता है। जैसा कि आपने कहा, विलकॉक्सन हस्ताक्षरित रैंक परीक्षण बेहद कुशल है, और यह मजबूत है, इसलिए मैं लगभग …

2
दंडित रैखिक प्रतिगमन की ज्यामितीय व्याख्या
मुझे पता है कि रैखिक प्रतिगमन को "सभी बिंदुओं के लंबवत रूप से निकटतम रेखा" के रूप में सोचा जा सकता है : लेकिन कॉलम स्पेस की कल्पना करके, इसे देखने का एक और तरीका है, "गुणांक मैट्रिक्स के कॉलम द्वारा स्पेस किए गए स्पेस पर प्रोजेक्शन" : मेरा सवाल …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.