सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

4
कुछ और के बजाय सिग्मोइड फ़ंक्शन क्यों?
डी-फैक्टो स्टैंडर्ड सिग्मोइड फ़ंक्शन, , इतना लोकप्रिय (गैर-गहन) तंत्रिका-नेटवर्क और लॉजिस्टिक प्रतिगमन में क्यों लोकप्रिय है?11+e−x11+e−x\frac{1}{1+e^{-x}} क्यों हम कई अन्य व्युत्पन्न कार्यों का उपयोग नहीं करते हैं, तेजी से गणना समय या धीमी क्षय के साथ (ताकि गायब होने वाला ढाल कम होता है)। सिग्मोइड कार्यों के बारे में कुछ …

6
सिमुलेशन का उपयोग कब करें?
तो यह एक बहुत ही सरल और बेवकूफ सवाल है। हालाँकि, जब मैं स्कूल में था, तब मैंने कक्षा में सिमुलेशन की पूरी अवधारणा पर बहुत कम ध्यान दिया और इससे मुझे उस प्रक्रिया से थोड़ा डर लगा। क्या आप आम शब्दों में सिमुलेशन प्रक्रिया की व्याख्या कर सकते हैं? …
40 simulation 

5
R - ची-स्क्वैयर सन्निकटन में चेतावनी गलत हो सकती है
मेरे पास फायर फाइटर प्रवेश परीक्षा परिणाम दिखाने वाला डेटा है। मैं इस परिकल्पना का परीक्षण कर रहा हूं कि परीक्षा परिणाम और जातीयता परस्पर स्वतंत्र नहीं हैं। इसे जांचने के लिए, मैंने आर में पियर्सन ची-स्क्वायर टेस्ट चलाया। परिणाम दिखाते हैं कि मुझे क्या उम्मीद थी, लेकिन इसने चेतावनी …

5
रिज प्रतिगमन समाधान कैसे प्राप्त करें?
मैं रिज प्रतिगमन के समाधान के व्युत्पन्न के साथ कुछ मुद्दे रख रहा हूं। मैं नियमितीकरण शब्द के बिना प्रतिगमन समाधान जानता हूं: β=(XTX)−1XTy.β=(XTX)−1XTy.\beta = (X^TX)^{-1}X^Ty. λ∥β∥22λ‖β‖22\lambda\|\beta\|_2^2 β=(XTX+λI)−1XTy.β=(XTX+λI)−1XTy.\beta = (X^TX + \lambda I)^{-1}X^Ty.

4
वर्गीकरण में स्मरण और शुद्धता
मैंने याद और सटीकता की कुछ परिभाषाएं पढ़ीं, हालांकि यह सूचना पुनर्प्राप्ति के संदर्भ में हर बार है। मैं सोच रहा था कि क्या कोई इसे वर्गीकरण के संदर्भ में थोड़ा और समझा सकता है और शायद कुछ उदाहरणों का वर्णन करता है। उदाहरण के लिए कहें कि मेरे पास …

3
ग्लोमनेट का उपयोग करके लस्सो के परिणाम कैसे प्रस्तुत करें?
मैं 30 स्वतंत्र चर के एक सेट के बाहर एक सतत निर्भर चर के लिए भविष्यवाणियों को खोजना चाहता हूं। मैं Lasso प्रतिगमन का उपयोग कर रहा हूँ जैसा कि R में glmnet पैकेज में लागू किया गया है। यहाँ कुछ डमी कोड है: # generate a dummy dataset with …

3
, या
मैं थोड़ी देर के लिए इस बारे में सोच रहा था; मुझे यह थोड़ा अजीब लगता है कि यह अचानक कैसे हो जाता है। असल में, हमें लिए केवल तीन वर्दी की आवश्यकता क्यों है ZnZnZ_nजैसे कि यह बाहर करता है? और स्मूथिंग-आउट इतनी जल्दी क्यों होता है? Z2Z2Z_2 : …

2
कुक की दूरी के भूखंडों को कैसे पढ़ें?
क्या किसी को पता है कि कैसे अंक 7, 16 और 29 प्रभावशाली अंक हैं या नहीं? मैंने कहीं पढ़ा है कि क्योंकि कुक की दूरी 1 से कम है, वे नहीं हैं। क्या मैं सही हू?

3
छिपे हुए मार्कोव मॉडल और तंत्रिका नेटवर्क के बीच अंतर क्या हैं?
मैं सिर्फ अपने पैरों को आंकड़ों में गीला कर रहा हूं इसलिए मुझे खेद है कि अगर यह सवाल समझ में नहीं आता है। मैंने खोज इंजन पर उपयोगकर्ताओं के क्लिक का अध्ययन करने के लिए छिपे हुए राज्यों (अनुचित कैसीनो, डाइस रोल, आदि) और तंत्रिका नेटवर्क की भविष्यवाणी करने …

1
बूटस्ट्रैपिंग या मोंटे कार्लो दृष्टिकोण का उपयोग करके महत्वपूर्ण प्रमुख घटकों का निर्धारण कैसे करें?
मैं एक प्रिंसिपल कंपोनेंट एनालिसिस (PCA) या एम्पिरिकल ऑर्थोगोनल फंक्शन (EOF) एनालिसिस से निकलने वाले महत्वपूर्ण पैटर्न की संख्या निर्धारित करने में दिलचस्पी रखता हूँ। मुझे इस पद्धति को जलवायु डेटा पर लागू करने में विशेष रुचि है। डेटा फ़ील्ड MxN मैट्रिक्स है जिसमें M समय आयाम (जैसे दिन) और …
40 r  pca  bootstrap  monte-carlo 

15
भूखंड तैयार करते समय मुझे किन सर्वोत्तम प्रथाओं का पालन करना चाहिए?
प्लॉट्स तैयार करते समय मैं आमतौर पर अपनी खुद की पहचान बनाता हूं। हालांकि, मुझे आश्चर्य है कि क्या भूखंडों के निर्माण के लिए कोई सर्वोत्तम प्रथाएं हैं। नोट: इस सवाल के जवाब के लिए रॉब की टिप्पणी यहां बहुत प्रासंगिक है।

13
मोंटी हॉल समस्या - हमारी अंतर्ज्ञान हमें कहाँ असफल करती है?
विकिपीडिया से: मान लीजिए कि आप गेम शो में हैं, और आपको तीन दरवाजों का विकल्प दिया गया है: एक दरवाजे के पीछे एक कार है; दूसरों के पीछे, बकरियाँ। आप एक दरवाजा चुनते हैं, नंबर 1 कहते हैं, और मेजबान, जो जानता है कि दरवाजे के पीछे क्या है, …

4
रेक्टिलाइनियर सक्रियण फ़ंक्शन तंत्रिका नेटवर्क में लुप्त हो रही ढाल समस्या को कैसे हल करता है?
मैंने पाया कि रैखिक नेटवर्क (ReLU) ने कई स्थानों पर तंत्रिका नेटवर्क के लिए लुप्त हो रही ढाल समस्या के समाधान के रूप में प्रशंसा की । यही है, एक सक्रियण फ़ंक्शन के रूप में अधिकतम (0, x) का उपयोग करता है। जब सक्रियण सकारात्मक होता है, तो यह स्पष्ट …

6
सॉफ्टमैक्स / क्रॉस एंट्रोपी के साथ बैकप्रोपेगेशन
मैं समझने की कोशिश कर रहा हूं कि सॉफ्टपैक्स / क्रॉस-एन्ट्रापी आउटपुट लेयर के लिए बैकप्रॉपैगैशन कैसे काम करता है। क्रॉस एन्ट्रापी एरर फंक्शन है E(t,o)=−∑jtjlogojE(t,o)=−∑jtjlog⁡ojE(t,o)=-\sum_j t_j \log o_j साथ और न्यूरॉन में लक्ष्य और आउटपुट के रूप में , क्रमशः। आउटपुट लेयर में प्रत्येक न्यूरॉन के ऊपर योग होता …

5
गतिशील समय वारिंग क्लस्टरिंग
समय श्रृंखला की क्लस्टरिंग करने के लिए डायनामिक टाइम वार्पिंग (DTW) का उपयोग करने का तरीका क्या होगा? मैंने DTW के बारे में दो समय श्रृंखलाओं के बीच समानता खोजने के तरीके के रूप में पढ़ा है, जबकि उन्हें समय में स्थानांतरित किया जा सकता है। क्या मैं इस विधि …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.