सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

3
एक k- साधन क्लस्टर विभाजन में सबसे महत्वपूर्ण सुविधाओं का अनुमान है
क्या यह निर्धारित करने का कोई तरीका है कि के-साधन क्लस्टर समाधान के भीतर डेटासेट की कौन सी विशेषताएं / चर सबसे महत्वपूर्ण / प्रभावी हैं?

3
"सामान्यीकरण" का क्या अर्थ है और यह कैसे सत्यापित करें कि नमूना या वितरण सामान्यीकृत है?
मेरा एक प्रश्न है जिसमें यह सत्यापित करने के लिए कहा जाता है कि क्या वर्दी वितरण ( सामान्यीकृत है।Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) एक के लिए, किसी भी वितरण को सामान्य बनाने के लिए इसका क्या मतलब है? और दो, हम यह सत्यापित करने के बारे में क्या कहते हैं कि वितरण …

1
सीधे पोस्ट-हॉक या नियोजित तुलना परीक्षणों में कूदने के बजाय एनोवा का उपयोग क्यों करें?
एक एनोवा समूह के बीच की स्थिति को देखते हुए, आप वास्तव में इस तरह के एनोवा टेस्ट को पहले करके क्या प्राप्त करते हैं, और दूसरा पोस्ट-हॉक (बोनफेरोनी, áidák, आदि) या नियोजित तुलना परीक्षणों का परीक्षण करते हैं? एनोवा कदम को पूरी तरह से क्यों नहीं छोड़ते? मैं यह …

2
समय श्रृंखला में उलटी प्रक्रिया का अंतर्ज्ञान क्या है?
मैं समय श्रृंखला पर एक किताब पढ़ रहा हूं और मैंने निम्नलिखित भाग में अपना सिर खुजलाना शुरू कर दिया है: क्या कोई मेरे लिए अंतर्ज्ञान की व्याख्या कर सकता है? मैं इसे इस पाठ से प्राप्त नहीं कर सका। हमें उल्टे होने की प्रक्रिया की आवश्यकता क्यों है? यहाँ …
19 time-series  arma 

2
परिणाम चर के लिए कई प्रतिनियुक्ति
मुझे कृषि परीक्षणों पर एक डेटासेट मिला है। मेरा प्रतिक्रिया चर एक प्रतिक्रिया अनुपात है: लॉग (उपचार / नियंत्रण)। मुझे इस बात में दिलचस्पी है कि अंतर में क्या अंतर है, इसलिए मैं आरई मेटा-रिग्रेशन (अनवीटेड चला रहा हूं, क्योंकि यह स्पष्ट है कि प्रभाव का आकार अनुमानों के विचलन …


1
2 डी हिस्टोग्राम के लिए फिट की अच्छाई
मेरे पास सितारों के मापदंडों का प्रतिनिधित्व करने वाले डेटा के दो सेट हैं: एक मनाया हुआ और एक मॉडल वाला। इन सेटों के साथ मैं वह बनाता हूं जिसे टू-कलर-डायग्राम (TCD) कहा जाता है। एक नमूना यहाँ देखा जा सकता है: एक मनाया गया डेटा और बी मॉडल से …

2
बैकप्रॉपैगैशन एल्गोरिथ्म
मुझे बहुपरत परसेप्ट्रॉन (MLP) में उपयोग किए जाने वाले बैकप्रोपैजेशन एल्गोरिथ्म पर थोड़ा भ्रम हुआ । त्रुटि को लागत फ़ंक्शन द्वारा समायोजित किया जाता है। बैकप्रोपेगेशन में, हम छिपी हुई परतों के वजन को समायोजित करने की कोशिश कर रहे हैं। आउटपुट एरर मैं समझ सकता हूं, वह है, e …

3
0-1 हानि समारोह स्पष्टीकरण
मैं नुकसान के कार्य का उद्देश्य क्या है, इस पर समझ पाने की कोशिश कर रहा हूं और मैं इसे समझ नहीं पा रहा हूं। इसलिए, जहां तक ​​मैं समझता हूं कि नुकसान समारोह कुछ प्रकार के मीट्रिक को शुरू करने के लिए है जिसके साथ हम एक गलत निर्णय …

2
नमूना माध्य और एसटीडी का उपयोग करके गामा वितरण मापदंडों का अनुमान लगाना
मैं एक गामा वितरण के मापदंडों का अनुमान लगाने की कोशिश कर रहा हूं जो मेरे डेटा नमूने के लिए सबसे उपयुक्त हैं। मैं केवल डेटा नमूने से माध्य , एसटीडी (और इसलिए विचरण ) का उपयोग करना चाहता हूं , वास्तविक मूल्यों का नहीं - क्योंकि ये हमेशा मेरे …

1
तंत्रिका नेटवर्क में दिन की सुविधा का निर्माण
प्रतिगमन समस्या पर काम करना मैंने "एक सप्ताह का दिन" सुविधा के प्रतिनिधित्व के बारे में सोचना शुरू कर दिया। मुझे आश्चर्य है कि कौन सा दृष्टिकोण बेहतर प्रदर्शन करेगा: एक विशेषता; सोमवार के लिए मूल्य 1/7; 2/7 मंगलवार के लिए ... 7 विशेषताएं: सोमवार के लिए (1, 0, 0, …

3
स्टोकेस्टिक क्रमिक वंश स्थानीय न्यूनतम की समस्या से कैसे बचा जा सकता है?
मुझे पता है कि स्टोकेस्टिक ग्रेडिएंट वंश में यादृच्छिक व्यवहार है, लेकिन मुझे नहीं पता कि क्यों। क्या इस बारे में कोई स्पष्टीकरण है?

2
ओवरसाइम्ड इम्बैलेंस डेटा पर परीक्षण वर्गीकरण
मैं गंभीर रूप से असंतुलित डेटा पर काम कर रहा हूं। साहित्य में, री-सैंपलिंग (ओवर- या अंडर-सैंपलिंग) का उपयोग करके डेटा को फिर से संतुलित करने के लिए कई तरीकों का उपयोग किया जाता है। दो अच्छे दृष्टिकोण हैं: SMOTE: सिंथेटिक माइनॉरिटी ओवर-सैंपलिंग TEchnique ( SMOTE ) ADASYN: असंतुलित शिक्षण …

3
आर में लापता डेटा के लिए पूरी जानकारी अधिकतम संभावना
संदर्भ : कुछ गुम डेटा के साथ पदानुक्रमित प्रतिगमन। प्रश्न : R में अनुपलब्ध डेटा को संबोधित करने के लिए मैं पूरी जानकारी अधिकतम संभावना (FIML) आकलन का उपयोग कैसे करूँ? क्या कोई पैकेज है जिसे आप सुझाएंगे, और विशिष्ट चरण क्या हैं? ऑनलाइन संसाधन और उदाहरण भी बहुत उपयोगी …

1
मल्टी-क्लास बूस्टेड क्लासिफायर को कैलिब्रेट करना
मैंने अलेक्जेंड्रू निकुलेस्कु-मिज़िल और रिच कारूआना के पेपर " बूस्टिंग से कैलिब्रेटेड प्रोबेबिलिटीज प्राप्त करना " और इस धागे में चर्चा को पढ़ा है । हालाँकि, मुझे अभी भी अपने मल्टी-क्लास बूस्टिंग क्लासिफ़ायर (निर्णय स्टंप के साथ कोमल-बूस्ट) के उत्पादन को जांचने के लिए लॉजिस्टिक या प्लाट की स्केलिंग को …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.