सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

3
आरआईएमए मॉडल के आर में मापदंडों के पी-मूल्य की गणना कैसे करें?
आर में समय श्रृंखला अनुसंधान करते समय, मैंने पाया कि arima फिट किए गए मॉडल के केवल गुणांक मान और उनकी मानक त्रुटियां प्रदान करता है। हालांकि, मैं गुणांक के पी-मूल्य भी प्राप्त करना चाहता हूं। मुझे ऐसा कोई फंक्शन नहीं मिला जो कॉफ की महत्ता प्रदान करता हो। इसलिए …

2
सांख्यिकीय फोरेंसिक: बेनफोर्ड और उससे आगे
तृतीय पक्ष द्वारा निर्मित वैज्ञानिक कार्यों में धोखाधड़ी, विसंगतियों, फ्रॉडिंग आदि का पता लगाने के लिए क्या व्यापक तरीके हैं? (मुझे हाल ही में मार्क हाउजर के संबंध में यह पूछने के लिए प्रेरित किया गया था ।) आमतौर पर चुनाव और लेखांकन धोखाधड़ी के लिए, बेनफोर्ड के कानून के …

2
PCA और एसिम्प्टोटिक PCA में क्या अंतर है?
1986 और 1988 में दो पत्रों में , कॉनर और कोरजज़ीक ने मॉडलिंग एसेट रिटर्न के लिए एक दृष्टिकोण प्रस्तावित किया। चूंकि इन समय श्रृंखला में आमतौर पर समयावधि टिप्पणियों की तुलना में अधिक संपत्ति होती है, इसलिए उन्होंने परिसंपत्ति रिटर्न के क्रॉस-अनुभागीय सहसंयोजकों पर एक पीसीए प्रदर्शन करने का …
23 pca  econometrics 

2
उनके बीच सहसंबंधों के आधार पर क्लस्टरिंग चर
प्रशन: मेरे पास एक बड़ा सहसंबंध मैट्रिक्स है। व्यक्तिगत सहसंबंधों को क्लस्ट करने के बजाय, मैं एक दूसरे से उनके सहसंबंधों के आधार पर चर चर करना चाहता हूं, यदि चर ए और चर बी में चर से जेड तक समान सहसंबंध हैं, तो ए और बी एक ही क्लस्टर …

2
स्थानिक आँकड़े मॉडल: सीएआर बनाम एसएआर
जब कोई व्यक्ति भू-संदर्भित हवाई डेटा को आकृतिकृत करता है, तो एक सिमोलिनस ऑटोरोग्रेसिव मॉडल पर एक सशर्त ऑटोरेग्रेसिव मॉडल का उपयोग कब करना पसंद करेगा?
23 modeling  spatial 

9
गणना डेटा के लिए समय श्रृंखला, मायने रखता है <20 के साथ
मैंने हाल ही में एक तपेदिक क्लिनिक के लिए काम करना शुरू किया। हम समय-समय पर टीबी के उन मामलों की संख्या पर चर्चा करते हैं जिनसे हम वर्तमान में व्यवहार कर रहे हैं, परीक्षण किए गए परीक्षणों की संख्या आदि, मैं इन गणनाओं को शुरू करना चाहता हूं ताकि …

5
इस "भोली" एल्गोरिथ्म में क्या गलत है?
यह बेतरतीब ढंग से एक सरणी फेरबदल के बारे में एक Stackoverflow सवाल के लिए अनुवर्ती है । वहाँ स्थापित एल्गोरिदम (जैसे कि नथ-फिशर-येट्स शफल ) हैं, जिसे किसी व्यक्ति को "भोले" तदर्थ कार्यान्वयन पर भरोसा करने के बजाय एक सरणी में फेरबदल करने के लिए उपयोग करना चाहिए। मुझे …

1
वास्तव में ध्यान तंत्र क्या हैं?
ध्यान तंत्र का उपयोग पिछले कुछ वर्षों में विभिन्न डीप लर्निंग पेपर में किया गया है। इल्या सुतकीवर, ओपन एआई के शोध प्रमुख, ने उत्साहपूर्वक उनकी प्रशंसा की: https://towardsdatascience.com/the-fall-of-rnn-lstm-2d1594c74ce0 पर्ड्यू विश्वविद्यालय में यूजीनियो क्यूलुरसेलो ने दावा किया है कि आरएनएन और एलएसटीएम को पूरी तरह से ध्यान आधारित तंत्रिका नेटवर्क …

1
Xgboost एल्गोरिथ्म में min_child_weight का स्पष्टीकरण
Xgboost में min_child_weight पैरामीटर की परिभाषा इस प्रकार दी गई है: एक बच्चे में आवश्यक वजन का न्यूनतम योग (हेसियन)। यदि वृक्ष विभाजन चरण लीफ नोड में एक परिणाम के साथ होता है, उदाहरण के लिए न्यूनतम वजन min_child_weight से कम होता है, तो निर्माण प्रक्रिया आगे विभाजन को छोड़ …

1
हैमिल्टनियन मोंटे कार्लो बनाम अनुक्रमिक मोंटे कार्लो
मैं सापेक्ष योग्यता और कमियां, साथ ही इन दो MCMC योजनाओं के विभिन्न अनुप्रयोग डोमेन के लिए एक महसूस करने की कोशिश कर रहा हूं। आप कब और किसका उपयोग करेंगे? जब कोई विफल हो सकता है लेकिन दूसरा नहीं (जैसे कि एचएमसी कहां लागू है लेकिन एसएमसी नहीं है, …

2
दो अलग-अलग लॉजिस्टिक लॉस फॉर्मेशन / नोटेशन क्यों हैं?
मैंने दो प्रकार के लॉजिस्टिक लॉस फॉर्मूलेशन देखे हैं। हम आसानी से दिखा सकते हैं कि वे समान हैं, एकमात्र अंतर लेबल की परिभाषा है ।yyy गठन / संकेतन 1, :y∈{0,+1}y∈{0,+1}y \in \{0, +1\} L(y,βTx)=−ylog(p)−(1−y)log(1−p)L(y,βTx)=−ylog⁡(p)−(1−y)log⁡(1−p) L(y,\beta^Tx)=-y\log(p)-(1-y)\log(1-p) जहां , जहां लॉजिस्टिक फ़ंक्शन वास्तविक संख्या से 0,1 अंतराल का मानचित्र बनाता है।p=11+exp(−βTx)p=11+exp⁡(−βTx)p=\frac …

3
क्या एक उच्च कभी बेकार है?
इस सवाल को स्टैक ओवरफ्लो से माइग्रेट किया गया था क्योंकि इसका जवाब क्रॉस वैलिडेट पर दिया जा सकता है। 4 साल पहले चले गए । आँकड़ों में हम रेखीय प्रतिगमन कर रहे हैं, उनमें से बहुत शुरुआत है। सामान्य तौर पर, हम जानते हैं कि जितना बेहतर होगा, लेकिन …

2
लाप्लास पूर्व में विरल समाधान क्यों पैदा कर रहा है?
मैं नियमितीकरण पर साहित्य के माध्यम से देख रहा था, और अक्सर पैराग्राफ को देखता हूं जो गौसियन से पहले एल 2 विनियमन को जोड़ता है, और एल 1 शून्य पर केंद्रित लैप्लस के साथ। मुझे पता है कि ये पुजारी कैसे दिखते हैं, लेकिन मुझे समझ में नहीं आता …

2
उच्चतम घनत्व क्षेत्र (HDR) क्या है?
में सांख्यिकीय निष्कर्ष , समस्या 9.6b, एक "उच्चतम घनत्व क्षेत्र (एचडीआर)" उल्लेख किया है। हालाँकि, मुझे पुस्तक में इस शब्द की परिभाषा नहीं मिली। इसी तरह का एक शब्द है हाईएस्ट पोस्टीरियर डेंसिटी (एचपीडी)। लेकिन यह इस संदर्भ में फिट नहीं है, क्योंकि 9.6b में एक पूर्व के बारे में …

3
समन्वय बनाम ढाल वंश
मैं सोच रहा था कि दो एल्गोरिदम, कोऑर्डिनेट डिसेंट और ग्रेडिएंट डिसेंट के लिए अलग-अलग उपयोग के मामले क्या हैं । मुझे पता है कि समन्वित वंश को गैर-चिकनी कार्यों के साथ समस्या है लेकिन इसका उपयोग एसवीएम और एलएएसओ जैसे लोकप्रिय एल्गोरिदम में किया जाता है। हालांकि धीरे-धीरे मुझे …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.