सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

10
क्यों न केवल तंत्रिका नेटवर्क और गहरी सीखने को डंप करें? [बन्द है]
बंद हो गया । यह सवाल राय आधारित है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस सवाल में सुधार करना चाहते हैं? प्रश्न को अपडेट करें ताकि इस पोस्ट को संपादित करके तथ्यों और उद्धरणों के साथ उत्तर दिया जा सके । 2 साल पहले बंद …

6
उत्तल समस्याओं के लिए, स्टोकेस्टिक ग्रेडिएंट डिसेंट (SGD) में ढाल हमेशा वैश्विक चरम मूल्य पर इंगित करता है?
उत्तल लागत फ़ंक्शन को देखते हुए, अनुकूलन के लिए SGD का उपयोग करते हुए, अनुकूलन प्रक्रिया के दौरान एक निश्चित बिंदु पर हमारे पास एक ढाल (वेक्टर) होगा। मेरा सवाल यह है कि उत्तल बिंदु को देखते हुए, ग्रेडिएंट केवल उसी दिशा में इंगित करता है जिस पर फ़ंक्शन तेजी …

1
क्या कोई परिणाम है जो बूटस्ट्रैप प्रदान करता है मान्य है यदि और केवल अगर आंकड़ा सुचारू है?
हम मान लेते हैं कि हमारा आँकड़ा कुछ डेटा का एक कार्य है जो वितरण फ़ंक्शन से खींचा गया है ; हमारे नमूने के अनुभवजन्य वितरण समारोह । So एक यादृच्छिक चर के रूप में देखा जाने वाला आँकड़ा है और सांख्यिकी का बूटस्ट्रैप संस्करण है। हम दूरी के रूप …

3
कई LSTM को ढेर करने के क्या फायदे हैं?
फायदे क्या हैं, क्यों एक-एक नेटवर्क में, कई LSTM का उपयोग किया जाएगा, एक-एक करके, एक तरफ? मैं एक इनपुट के अनुक्रम का प्रतिनिधित्व करने के लिए एक LSTM का उपयोग कर रहा हूं। इसलिए एक बार मेरे पास यह एकल प्रतिनिधित्व है - मैं इसे फिर से क्यों पास …

1
क्यों सुधारा गया रैखिक इकाइयों को गैर-रैखिक माना जाता है?
रेक्टिफाइड रैखिक इकाइयों (ReLU) के सक्रियण कार्यों को गैर-रैखिक क्यों माना जाता है? च( x ) = अधिकतम ( 0 , x )च(एक्स)=अधिकतम(0,एक्स) f(x) = \max(0,x) जब इनपुट सकारात्मक होता है तो वे रैखिक होते हैं और गहरी नेटवर्क की प्रतिनिधि शक्ति को अनलॉक करने के लिए मेरी समझ से …

5
लापता डेटा को संभालने के लिए मशीन लर्निंग एल्गोरिदम
मैं प्रयोगशाला मूल्यों सहित उच्च-आयामी नैदानिक ​​डेटा का उपयोग करके एक पूर्वानुमान मॉडल विकसित करने की कोशिश कर रहा हूं। डेटा स्पेस 5k नमूने और 200 चर के साथ विरल है। विचार एक सुविधा चयन विधि (आईजी, आरएफ आदि) का उपयोग करके चर को रैंक करना है और भविष्य कहनेवाला …

4
स्वतंत्र यादृच्छिक चर के कार्य
क्या यह दावा है कि स्वतंत्र यादृच्छिक चर के कार्य स्वयं स्वतंत्र, सत्य हैं? मैंने देखा है कि परिणाम अक्सर कुछ प्रमाणों में स्पष्ट रूप से उपयोग किया जाता है, उदाहरण के लिए एक सामान्य वितरण के नमूना माध्य और नमूना प्रसरण के बीच स्वतंत्रता के प्रमाण में, लेकिन मुझे …

2
डिरिचलेट वितरण से ड्राइंग
मान लीजिए कि हमारे पास -dimensional वेक्टर पैरामीटर । मैं इस वितरण से एक नमूना (एक आयामी वेक्टर) कैसे आकर्षित कर सकता हूं ? मुझे (संभवतः) सरल स्पष्टीकरण की आवश्यकता है।→ अल्फा = [ अल्फा 1 , अल्फा 2 , । । । , α K ] केKKKα⃗ =[α1,α2,...,αK]α→=[α1,α2,...,αK]\vec\alpha = …

2
लॉजिस्टिक रिग्रेशन के पीछे अंतर्ज्ञान
हाल ही में मैंने मशीन लर्निंग का अध्ययन करना शुरू किया, हालांकि मैं लॉजिस्टिक रिग्रेशन के पीछे के अंतर्ज्ञान को समझने में असफल रहा । लॉजिस्टिक रिग्रेशन के बारे में निम्नलिखित तथ्य हैं जो मुझे समझ में आए। परिकल्पना के आधार के रूप में हम सिग्माइड फ़ंक्शन का उपयोग करते …

3
बायेसियन वितरण की तुलना कैसे करते हैं?
इसलिए, मुझे लगता है कि मेरे पास लगातार संभावना और सांख्यिकीय विश्लेषण (और कितनी बुरी तरह इसका इस्तेमाल किया जा सकता है) की बुनियादी बातों का एक सभ्य समझ है। एक निरंतर दुनिया में, यह इस तरह के प्रश्न को पूछने के लिए समझ में आता है जैसे "क्या यह …

5
क्या आपको कभी भी बाइनरी वैरिएबल को मानकीकृत करना चाहिए?
मेरे पास सुविधाओं के एक सेट के साथ एक डेटा सेट है। उनमें से कुछ द्विआधारी (1=(1=(1= सक्रिय या निकाल दिए गए, 0=0=0= निष्क्रिय या निष्क्रिय) हैं, और बाकी वास्तविक मूल्यवान हैं, जैसे 4564.3424564.3424564.342 । मैं इस डेटा को एक मशीन लर्निंग एल्गोरिदम को खिलाना चाहता हूं, इसलिए मैं सभी …

1
बिनर्ड टिप्पणियों का मानक विचलन
मेरे पास नमूना टिप्पणियों का एक डेटासेट है, जो सीमा डिब्बे के भीतर मायने रखता है। उदाहरण के लिए: min/max count 40/44 1 45/49 2 50/54 3 55/59 4 70/74 1 अब, इस से औसत का अनुमान लगाना बहुत सीधा है। बस एक सीमा के रूप में प्रत्येक रेंज बिन …

3
एसवीएम जैसे असतत क्लासीफायर के लिए आरओसी वक्र: हम अभी भी इसे "वक्र" क्यों कहते हैं ?, क्या यह सिर्फ एक "बिंदु" नहीं है?
चर्चा में: बाइनरी वर्गीकरण के लिए आरसी वक्र कैसे उत्पन्न किया जाए , मुझे लगता है कि भ्रम यह था कि "बाइनरी क्लासिफायरियर" (जो किसी भी क्लासिफायरियर को 2 वर्गों को अलग करता है) यांग के लिए था जिसे "असतत क्लासिफायरफायर" कहा जाता है (जो उत्पादन करता है असतत आउटपुट …

1
छुट्टी-एक-आउट क्रॉस-सत्यापन कैसे काम करता है? विभिन्न मॉडलों में से अंतिम मॉडल का चयन कैसे करें ?
मेरे पास कुछ डेटा है और मैं इस डेटा से एक मॉडल (एक रैखिक प्रतिगमन मॉडल कहना) का निर्माण करना चाहता हूं। अगले चरण में, मैं मॉडल पर लीव-वन-आउट क्रॉस-वैलिडेशन (LOOCV) लागू करना चाहता हूं ताकि देखें कि यह कितना अच्छा प्रदर्शन करता है। अगर मुझे LOOCV सही समझ में …

1
पंक्ति और स्तंभ लंबाई पर बाधाओं के साथ रैंडम मैट्रेस
मुझे पंक्तियों और स्तंभों के साथ यादृच्छिक गैर-वर्ग मैट्रिसेस उत्पन्न करने की आवश्यकता है , तत्वों को बेतरतीब ढंग से = 0 के साथ वितरित किया गया है, और ऐसा विवश किया गया है कि प्रत्येक पंक्ति की लंबाई (L2 मानदंड) और प्रत्येक कॉलम की लंबाई । समान रूप से, …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.