सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

4
मेट्रोपोलिस-हेस्टिंग्स एल्गोरिदम व्यवहार में उपयोग किया जाता है
मैं आज क्रिश्चियन रॉबर्ट के ब्लॉग को पढ़ रहा था और नए मेट्रोपोलिस-हेस्टिंग्स एल्गोरिथम को काफी पसंद कर रहा था, जिसकी वह चर्चा कर रहे थे। यह सरल और लागू करने में आसान लग रहा था। जब भी मैं MCMC को कोड करता हूं, तो मैं बहुत ही मूल MH …

4
क्या एक मॉडल डेटा के लिए फिट है या एक मॉडल के लिए डेटा फिट है?
क्या एक मॉडल को डेटा को फिट करने और मॉडल को डेटा को फिट करने के बीच एक वैचारिक या प्रक्रियात्मक अंतर है? पहली वर्डिंग का एक उदाहरण https://courses.washington.edu/matlab1/ModelFitting.html में देखा जा सकता है , और दूसरे का https://reference.wolfram.com/applications/eda/FittingDoToLinearModelsByLeast-SquaresTechniques.html में देखा जा सकता है। ।

2
मंझला पूर्वानुमान करने के लिए MAE को न्यूनतम क्यों करता है और इसका मतलब नहीं है?
से पूर्वानुमान: सिद्धांत और व्यवहार रोब जम्मू Hyndman और जॉर्ज Athanasopoulos द्वारा पाठ्यपुस्तक , विशेष रूप से सटीकता माप पर अनुभाग : एक पूर्वानुमान विधि जो MAE को न्यूनतम करती है, माध्यिका के पूर्वानुमान को जन्म देगी, जबकि RMSE को कम करने से माध्य के पूर्वानुमान को बढ़ावा मिलेगा। क्या …
20 forecasting  mean  median  rms  mae 

2
बायसेपियन सोच ओवरफिटिंग के बारे में
मैंने पारंपरिक अक्सरवादी सांख्यिकीय डोमेन में पूर्वानुमान मॉडल को मान्य करने के लिए तरीकों और सॉफ्टवेयर के विकास के लिए बहुत समय समर्पित किया है । व्यवहार और शिक्षण में अधिक बायेसियन विचारों को रखने में मुझे गले लगाने के लिए कुछ महत्वपूर्ण अंतर दिखाई देते हैं। सबसे पहले, बेयसियन …

5
इंजीनियरिंग कार्य क्यों करता है?
हाल ही में मैंने सीखा है कि एमएल समस्याओं के लिए बेहतर समाधान खोजने का एक तरीका सुविधाओं का निर्माण है। उदाहरण के लिए, दो सुविधाओं को संक्षेपित करके ऐसा कर सकते हैं। उदाहरण के लिए, हमारे पास दो प्रकार के "हमले" और कुछ प्रकार के नायक के "बचाव" हैं। …

1
मशीन लर्निंग एल्गोरिदम में लापता डेटा और विरल डेटा के बीच अंतर
विरल डेटा और लापता डेटा के बीच मुख्य अंतर क्या हैं? और यह मशीन सीखने को कैसे प्रभावित करता है? अधिक विशेष रूप से, स्पार्क डेटा और गुम डेटा का वर्गीकरण एल्गोरिदम और रिग्रेशन (संख्याओं की भविष्यवाणी) के प्रकारों पर क्या प्रभाव पड़ता है। मैं एक स्थिति के बारे में …

2
LASSO वैरिएबल चयन के बाद OLS करना कैसे समझ में आता है?
हाल ही में मैंने पाया है कि लागू अर्थमिति साहित्य में, सुविधा चयन समस्याओं से निपटने के दौरान, चयनित चर का उपयोग करके ओएलएस प्रतिगमन के बाद LASSO प्रदर्शन करना असामान्य नहीं है। मैं सोच रहा था कि हम इस तरह की प्रक्रिया की वैधता कैसे प्राप्त कर सकते हैं। …

3
गहरे तंत्रिका नेटवर्क के प्रशिक्षण के लिए शुरुआती रोक का ठीक से उपयोग कैसे करें?
मेरे पास एक गहरा तंत्रिका नेटवर्क मॉडल है और मुझे इसे अपने डेटासेट पर प्रशिक्षित करने की आवश्यकता है जिसमें लगभग 100,000 उदाहरण हैं, मेरे सत्यापन डेटा में लगभग 1000 उदाहरण हैं। क्योंकि प्रत्येक उदाहरण (प्रत्येक उदाहरण के लिए लगभग 0.5s) को प्रशिक्षित करने के लिए समय लगता है और …

2
समान वितरण से घातीय वितरण और इसके विपरीत
यह शायद एक तुच्छ प्रश्न है, लेकिन मेरी खोज अब तक बेकार रही है, जिसमें इस विकिपीडिया लेख , और "डिस्ट्रीब्यूशन ऑफ़ डिस्ट्रिब्यूशन" दस्तावेज़ शामिल हैं । यदि का एक समान वितरण है, तो क्या इसका मतलब है कि एक घातीय वितरण का अनुसरण करता है?ई एक्सएक्सएक्सXइएक्सइएक्सe^X इसी तरह, यदि …

4
प्रतिक्रिया RNN और LSTM / GRU के बीच अंतर
मैं अलग-अलग आवर्तक तंत्रिका नेटवर्क (RNN) आर्किटेक्चर को समय श्रृंखला डेटा पर लागू करने के लिए समझने की कोशिश कर रहा हूं और RNN का वर्णन करते समय अक्सर उपयोग किए जाने वाले विभिन्न नामों के साथ थोड़ा भ्रमित हो रहा हूं। क्या दीर्घकालिक अल्पकालिक मेमोरी (LSTM) और गेटेड रिकरंट …

2
नाम में क्या है: परिशुद्धता (विचरण का विलोम)
वास्तव में, मतलब सिर्फ टिप्पणियों का औसत है। विचरण यह है कि ये अवलोकन माध्य से कितने भिन्न हैं। मैं जानना चाहूंगा कि विचरण के व्युत्क्रम को सटीकता के रूप में क्यों जाना जाता है। इससे हम क्या अंतर्ज्ञान कर सकते हैं? और सटीक मैट्रिक्स बहुभिन्नरूपी (सामान्य) वितरण में सहसंयोजक …

2
तंत्रिका जाल में, अन्य मेटाह्योरिस्टिक्स के बजाय ढाल विधियों का उपयोग क्यों करें?
गहरे और उथले तंत्रिका नेटवर्क के प्रशिक्षण में, अन्य मेटाफ्यूरिस्टिक्स के विपरीत ग्रेडिएंट मेथड्स (जैसे ग्रेडिएंट डिसेंट, नेस्टरोव, न्यूटन-राफसन) का आमतौर पर इस्तेमाल क्यों किया जाता है? मेटाह्यूरिस्टिक्स से मेरा मतलब है कि नकली एनालिंग, चींटी कॉलोनी ऑप्टिमाइज़ेशन आदि जैसे तरीके, जो एक स्थानीय मिनीमा में अटकने से बचने के …

2
एलएसटीएम के लिए कौन से अनुकूलन के तरीके सबसे अच्छे हैं?
मैं LSTMs के साथ प्रयोग करने के लिए थीनो का उपयोग कर रहा हूं, और सोच रहा था कि LSTM के लिए कौन से अनुकूलन के तरीके (SGD, Adagrad, Adadelta, RMSprop, Adam, etc) सबसे अच्छे हैं? क्या इस विषय पर कोई शोध पत्र हैं? इसके अलावा, क्या इसका जवाब इस …

2
पक्षपात-विचरण व्यापार की व्युत्पत्ति को समझना
मैं सांख्यिकीय सीखने के तत्वों के पूर्वाग्रह-विचरण व्यापार के अध्याय को पढ़ रहा हूं और मुझे पृष्ठ 29 पर सूत्र में संदेह है। डेटा एक मॉडल से उत्पन्न होने दें, जैसे कि जहाँ यादृच्छिक है अपेक्षित मान के साथ संख्या और वेरिएंट । बता दें कि मॉडल की त्रुटि का …

2
अवशिष्ट भूखंड: प्लॉट बनाम फिट मूल्यों, मनाया नहीं मान?
ओएलएस प्रतिगमन के संदर्भ में मैं समझता हूं कि एक अवशिष्ट भूखंड (बनाम सज्जित मूल्यों) को पारंपरिक रूप से निरंतर विचरण के लिए परीक्षण करने और मॉडल विनिर्देशन का आकलन करने के लिए देखा जाता है। रेजिडेंशियल फिट्स के खिलाफ क्यों साजिश रची जाती है, और मान नहीं? इन दोनों …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.