सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

6
सतत और श्रेणीबद्ध चरों के मिश्रण वाले डेटासेट पर प्रमुख घटक विश्लेषण लागू किया जा सकता है?
मेरे पास एक डेटासेट है जिसमें निरंतर और श्रेणीबद्ध डेटा दोनों हैं। मैं पीसीए का उपयोग करके विश्लेषण कर रहा हूं और सोच रहा हूं कि विश्लेषण के हिस्से के रूप में श्रेणीबद्ध चर को शामिल करना ठीक है या नहीं। मेरी समझ यह है कि पीसीए केवल निरंतर चर …

5
जब मेरा तंत्रिका नेटवर्क नहीं सीखता है तो मुझे क्या करना चाहिए?
मैं एक तंत्रिका नेटवर्क का प्रशिक्षण ले रहा हूं लेकिन प्रशिक्षण हानि कम नहीं होती है। मैं इसे कैसे ठीक करूं? मैं ओवरफिटिंग या नियमितीकरण के बारे में नहीं पूछ रहा हूं। मैं उस समस्या को हल करने के बारे में पूछ रहा हूं जहां प्रशिक्षण सेट पर मेरे नेटवर्क …

7
केंद्रीय सीमा प्रमेय के लिए कौन सी सहज व्याख्या है?
कई अलग-अलग संदर्भों में हम केंद्रीय सीमा प्रमेय का आह्वान करते हैं कि हम जो भी सांख्यिकीय पद्धति अपनाना चाहते हैं, उसे सही ठहराने के लिए (जैसे, सामान्य वितरण द्वारा द्विपद वितरण को अनुमानित करें)। मैं तकनीकी विवरणों को समझता हूं कि प्रमेय क्यों सच है लेकिन यह अभी मेरे …


6
गहरे तंत्रिका नेटवर्क में सिग्मॉइड फ़ंक्शन पर ReLU के फायदे क्या हैं?
गैर-रैखिकता की कला की स्थिति गहरी तंत्रिका नेटवर्क में सिग्मॉइड फ़ंक्शन के बजाय रेक्टिफाइड रैखिक इकाइयों (ReLU) का उपयोग करना है। क्या फायदे हैं? मुझे पता है कि जब ReLU का उपयोग किया जाता है तो एक नेटवर्क का प्रशिक्षण तेजी से होगा, और यह अधिक जैविक प्रेरित है, अन्य …

5
वास्तव में एक “अन्य चर के लिए नियंत्रण” कैसे होता है?
यहाँ वह लेख है जिसने इस प्रश्न को प्रेरित किया है: क्या अधीरता हमें मोटा करती है? मुझे यह लेख पसंद आया, और यह "अन्य चर के लिए नियंत्रण" (आईक्यू, कैरियर, आय, आयु, आदि) की अवधारणा को अच्छी तरह से प्रदर्शित करता है ताकि प्रश्न में सिर्फ 2 चर के …

5
क्रॉस-सत्यापन के बाद पूर्ण डेटासेट के साथ प्रशिक्षण?
क्रॉस-वेलिडेशन के बाद हमेशा पूर्ण डेटासेट के साथ प्रशिक्षित करना एक अच्छा विचार है ? इसे दूसरे तरीके से डालें, क्या मेरे डेटासेट के सभी नमूनों के साथ प्रशिक्षण लेना ठीक है और यह जांचने में सक्षम नहीं है कि क्या यह विशेष फिटिंग ओवरफिट है ? समस्या पर कुछ …

14
अमेज़ॅन साक्षात्कार प्रश्न - द्वितीय साक्षात्कार की संभावना
मुझे यह सवाल अमेज़न के साथ एक साक्षात्कार के दौरान मिला: 50% सभी लोग जो पहला साक्षात्कार प्राप्त करते हैं, दूसरा साक्षात्कार प्राप्त करते हैं आपके दोस्तों में से 95% को दूसरा साक्षात्कार मिला, उन्हें लगा कि उनका पहला साक्षात्कार अच्छा था आपके दोस्तों में से 75% को DID को …

8
क्या फेसबुक का अंत हो रहा है?
हाल ही में, इस पेपर पर बहुत अधिक ध्यान दिया गया है (जैसे WSJ से )। असल में, लेखक यह निष्कर्ष निकालते हैं कि 2017 तक फेसबुक अपने 80% सदस्यों को खो देगा। वे एसआईआर मॉडल के एक एक्सट्रपलेशन पर अपने दावों को आधार बनाते हैं , महामारी विज्ञान में …

4
कश्मीर की कश्मीर में गुना मोड़ना की पसंद
मैं का उपयोग कर रहे कुछ सीखने वाले एल्गोरिदम के प्रदर्शन का मूल्यांकन करने के लिए कुछ समय अब गुना पार सत्यापन, लेकिन मैं हमेशा मैं कैसे की मूल्य का चयन करना चाहिए के रूप में हैरान किया गया है ।केKKKKKK मैंने अक्सर का मान देखा और उपयोग किया है …

15
मानक विचलन की गणना करते समय द्वारा विभाजित करने के लिए सहज व्याख्या ?
मुझे आज क्लास में पूछा गया था कि आप मानक विचलन की गणना करते समय के साथ द्वारा वर्ग त्रुटि का योग क्यों विभाजित करते हैं ।एनn−1n−1n-1nnn मैंने कहा कि मैं इसका उत्तर कक्षा में नहीं दे रहा हूँ (क्योंकि मैं निष्पक्ष अनुमानकर्ताओं में नहीं जाना चाहता था), लेकिन बाद …

7
रैखिक कर्नेल के साथ SVM में C का क्या प्रभाव है?
मैं वर्तमान में अपने डेटा को वर्गीकृत करने के लिए एक रैखिक कर्नेल के साथ एक एसवीएम का उपयोग कर रहा हूं। प्रशिक्षण सेट पर कोई त्रुटि नहीं है। मैंने पैरामीटर ( 10 - 5 , … , 10 2 ) के लिए कई मान आज़माए । इससे परीक्षण सेट …

2
अनुप्रयोगों के साथ-साथ तंत्रिका नेटवर्क में उपयोग किए जाने वाले लागत कार्यों की एक सूची
तंत्रिका नेटवर्क के प्रदर्शन का मूल्यांकन करने में उपयोग किए जाने वाले सामान्य लागत कार्य क्या हैं? विवरण (बेझिझक इस सवाल के बाकी हिस्सों को छोड़ दें, मेरा इरादा यहाँ केवल इस बात पर स्पष्टीकरण देने के लिए है कि उत्तर सामान्य पाठक के लिए उन्हें अधिक समझने में मदद …

2
यह कैसे निर्धारित किया जाए कि कौन सा वितरण मेरे डेटा को सबसे उपयुक्त बनाता है?
मेरे पास एक डेटासेट है और यह पता लगाना चाहूंगा कि कौन सा वितरण मेरे डेटा को सबसे उपयुक्त मानता है। मैंने fitdistr()ग्रहण किए गए वितरण का वर्णन करने के लिए आवश्यक मापदंडों का अनुमान लगाने के लिए फ़ंक्शन का उपयोग किया (यानी वीबुल, कॉची, सामान्य)। उन मापदंडों का उपयोग …

5
मुख्य घटक विश्लेषण और बहुआयामी स्केलिंग के बीच अंतर क्या है?
पीसीए और शास्त्रीय एमडीएस अलग कैसे हैं? बिना एमडीएम बनाम एमडीएस के बारे में कैसे? क्या कोई समय है जब आप एक दूसरे को पसंद करेंगे? व्याख्याएं कैसे भिन्न होती हैं?

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.