सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

11
बहुभिन्नरूपी विश्लेषण के लिए पुस्तक सिफारिशें
मुझे मल्टीवेरिएट विश्लेषण के बारे में कुछ किताबें प्राप्त करने में रुचि है, और आपकी सिफारिशों की आवश्यकता है। नि: शुल्क पुस्तकों का हमेशा स्वागत है, लेकिन यदि आप कुछ महान गैर-मुक्त एमवीए पुस्तक के बारे में जानते हैं, तो कृपया इसे बताएं।

7
विपरीत कोड वाले R में टाइप III SS ANOVA कैसे करता है?
कृपया R कोड प्रदान करें, जो किसी को -3, -1, 1, 3 कंट्रास्ट के साथ एक अंतर-विषय एनोवा का संचालन करने की अनुमति देता है। मैं समझता हूं कि इस तरह के विश्लेषण के लिए उपयुक्त योगों के वर्ग (एसएस) प्रकार के बारे में बहस चल रही है। हालांकि, एसएएस …

7
मैं कैसे तय करता हूं कि आरएएस में LOESS रिग्रेशन में क्या उपयोग करना है?
मैं आर में LOESS प्रतिगमन मॉडल चला रहा हूं, और मैं अलग-अलग नमूना आकारों के साथ 12 विभिन्न मॉडलों के आउटपुट की तुलना करना चाहता हूं। मैं वास्तविक विवरणों को अधिक विवरणों में वर्णित कर सकता हूं यदि यह प्रश्न का उत्तर देने में मदद करता है। यहाँ नमूना आकार …
26 r  regression  loess 

5
फिशर का "अधिक डेटा कब प्राप्त होता है" दृष्टिकोण समझ में आता है?
का हवाला देते हुए गुंग के महान जवाब कथित तौर पर, एक शोधकर्ता ने एक बार 'गैर-महत्वपूर्ण' परिणामों के साथ फिशर से संपर्क किया, उनसे पूछा कि उन्हें क्या करना चाहिए, और फिशर ने कहा, 'अधिक डेटा प्राप्त करें'। नेमन-पीयरसन के दृष्टिकोण से, यह ज़बरदस्त फेकिंग है, लेकिन क्या कोई …

2
तंत्रिका नेटवर्क: बाइनरी वर्गीकरण के लिए 1 या 2 आउटपुट न्यूरॉन्स का उपयोग करें?
मान लें कि मैं बाइनरी वर्गीकरण करना चाहता हूं (कुछ कक्षा ए या वर्ग बी से संबंधित है)। तंत्रिका नेटवर्क के आउटपुट लेयर में ऐसा करने की कुछ संभावनाएँ हैं: 1 आउटपुट नोड का उपयोग करें। आउटपुट 0 (<0.5) वर्ग ए माना जाता है और 1 (> = 0.5) वर्ग …

1
प्रशिक्षण हानि नीचे और ऊपर फिर जाती है। क्या हो रहा है?
मेरा प्रशिक्षण नुकसान नीचे और फिर ऊपर जाता है। यह बहुत ही अजीब है। क्रॉस-वेलिडेशन लॉस प्रशिक्षण हानि को ट्रैक करता है। क्या हो रहा है? मेरे पास दो स्टैक्ड LSTMS इस प्रकार हैं (करेस पर): model = Sequential() model.add(LSTM(512, return_sequences=True, input_shape=(len(X[0]), len(nd.char_indices)))) model.add(Dropout(0.2)) model.add(LSTM(512, return_sequences=False)) model.add(Dropout(0.2)) model.add(Dense(len(nd.categories))) model.add(Activation('sigmoid')) model.compile(loss='binary_crossentropy', …

2
क्वांटाइल (उलटा सीडीएफ) फ़ंक्शन को समझने में मेरी मदद करें
मैं क्वांटाइल फ़ंक्शन के बारे में पढ़ रहा हूं, लेकिन यह मेरे लिए स्पष्ट नहीं है। क्या आप नीचे दिए गए एक से अधिक सहज स्पष्टीकरण प्रदान कर सकते हैं? चूँकि c एक नीरस रूप से बढ़ता हुआ कार्य है, इसका उलटा होता है; आइए हम इसे दर्शाते हैं । …

3
क्या बड़े नमूना आकार के साथ बायेसियन पादरी अप्रासंगिक हो जाते हैं?
बायेसियन इंट्रेंस प्रदर्शन करते समय, हम मापदंडों के बारे में हमारे पास मौजूद पुजारियों के साथ संयोजन में हमारे संभावना समारोह को अधिकतम करके संचालित करते हैं। चूँकि लॉग-लाइबिलिटी अधिक सुविधाजनक है, इसलिए हम MCMC का उपयोग करते हुए प्रभावी रूप से अधिकतम करते हैं या अन्यथा जो पीछे के …
26 bayesian  prior 

5
संभावना पर विकिपीडिया प्रविष्टि अस्पष्ट लगती है
मेरे पास "सशर्त संभावना" और "संभावना" के बारे में एक सरल प्रश्न है। (मैं पहले ही इस सवाल का सर्वेक्षण कर चुका हूं लेकिन कोई फायदा नहीं हुआ।) यह संभावना पर विकिपीडिया पृष्ठ से शुरू होता है । वे यह कहते हैं: संभावना पैरामीटर मान का एक सेट की, , …

3
आर में पीयरसन सहसंबंध में पी-मूल्य का पता लगाना
क्या आर में पीयरसन सहसंबंध में पी-मान प्राप्त करना संभव है? पीयरसन सहसंबंध को खोजने के लिए, मैं आमतौर पर ऐसा करता हूं col1 = c(1,2,3,4) col2 = c(1,4,3,5) cor(col1,col2) # [1] 0.8315218 लेकिन मैं इसका पी-मूल्य कैसे पा सकता हूं?

5
रैखिक प्रतिगमन सामान्य वितरण का उपयोग कैसे करता है?
रैखिक प्रतिगमन में, प्रत्येक अनुमानित मान को संभावित मानों के सामान्य वितरण से उठाया गया है। निचे देखो। लेकिन प्रत्येक अनुमानित मूल्य को सामान्य वितरण से क्यों माना जाता है? रैखिक प्रतिगमन इस धारणा का उपयोग कैसे करता है? क्या होगा यदि संभव मानों को आम तौर पर वितरित नहीं …

7
विभिन्न स्रोतों से संभावनाओं / सूचनाओं को मिलाना
आइए बताते हैं कि मेरे पास तीन स्वतंत्र स्रोत हैं और उनमें से प्रत्येक कल के मौसम के लिए भविष्यवाणियां करता है। पहला व्यक्ति कहता है कि कल बारिश की संभावना 0 है, फिर दूसरा कहता है कि संभावना 1 है, और अंत में अंतिम कहता है कि संभावना 50% …

4
प्रतिगमन के लिए कोई KNN का उपयोग क्यों करेगा?
जो मैं समझता हूं, हम केवल एक प्रतिगमन फ़ंक्शन का निर्माण कर सकते हैं जो प्रशिक्षण डेटा के अंतराल के भीतर है। उदाहरण के लिए (केवल एक पैनल आवश्यक है): मैं भविष्य में KNN प्रतिगामी का उपयोग करने की भविष्यवाणी कैसे करूंगा? फिर से, यह केवल एक फ़ंक्शन को अनुमानित …

4
मानक विचलन के पीछे अंतर्ज्ञान
मैं मानक विचलन की बेहतर सहज समझ हासिल करने की कोशिश कर रहा हूं। जो मुझे समझ में आया है, वह उस डेटा सेट के माध्य से सेट किए गए डेटा में टिप्पणियों के सेट के अंतर के औसत का प्रतिनिधि है। हालांकि यह वास्तव में मतभेदों के औसत के …

3
वैरिएबल के लैस्सो-पहचाने गए सबसेट पर ओएलएस अनुमानों पर लास्सो अनुमानों का उपयोग क्यों करें?
k β एल एक रों रों ओ = ( β एल एक रों रों ओ 1 , β एल एक रों रों ओ 2 , । । । , β एल एकL(β)=(Xβ−y)′(Xβ−y)+λ∥β∥1,L(β)=(Xβ−y)′(Xβ−y)+λ‖β‖1,L(\beta)=(X\beta-y)'(X\beta-y)+\lambda\|\beta\|_1,kkkβ^lasso=(β^lasso1,β^lasso2,...,β^lassok,0,...0)β^lasso=(β^1lasso,β^2lasso,...,β^klasso,0,...0)\hat{\beta}^{lasso}=\left(\hat{\beta}_1^{lasso},\hat{\beta}_2^{lasso},...,\hat{\beta}_k^{lasso},0,...0\right) हम जानते हैं कि एक है पक्षपाती अनुमान , इसलिए हम अंतिम समाधान के रूप में अधिक 'वाजिब' …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.