सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

29
शिक्षण के उदाहरण: सहसंबंध का अर्थ कार्य-कारण नहीं है
एक पुरानी कहावत है: "सहसंबंध का मतलब करणीय नहीं है"। जब मैं सिखाता हूं, तो मैं इस बिंदु को स्पष्ट करने के लिए निम्नलिखित मानक उदाहरणों का उपयोग करता हूं: डेनमार्क में सारस और जन्म दर की संख्या; अमेरिका और शराब में पुजारियों की संख्या; 20 वीं शताब्दी की शुरुआत …

5
सादे अंग्रेजी में नियमितीकरण क्या है?
अन्य लेखों के विपरीत, मुझे इस विषय के लिए विकिपीडिया प्रविष्टि एक गैर-गणित व्यक्ति (मेरे जैसे) के लिए अप्राप्य लगी। मैंने मूल विचार को समझा, कि आप कम नियमों वाले मॉडल का पक्ष लेते हैं। मुझे क्या नहीं मिलता है कि आप नियमों के एक सेट से एक 'नियमितीकरण स्कोर' …

4
एक मनोविज्ञान पत्रिका ने पी-मूल्यों और आत्मविश्वास के अंतराल पर प्रतिबंध लगा दिया; क्या वास्तव में उनका उपयोग बंद करना बुद्धिमानी है?
25 फरवरी, 2015, पत्रिका बुनियादी और अनुप्रयुक्त सामाजिक मनोविज्ञान एक संपादकीय जारी प्रतिबंध लगाने भविष्य सभी कागजात से -values और विश्वास के अंतराल।पीpp विशेष रूप से, वे कहते हैं (स्वरूपण और जोर मेरा है): [...] प्रकाशन से पहले, लेखकों को NHSTP [अशक्त परिकल्पना महत्व परीक्षण प्रक्रिया] ( -values, t -values, …


6
रेखीय प्रतिगमन के लिए ढाल वंश का उपयोग क्यों करें, जब एक बंद-प्रपत्र गणित समाधान उपलब्ध हो?
मैं मशीन लर्निंग पाठ्यक्रम ऑनलाइन ले रहा हूं और परिकल्पना में इष्टतम मूल्यों की गणना के लिए ग्रेडिएंट डिसेंट के बारे में सीखा है। h(x) = B0 + B1X अगर हम आसानी से नीचे दिए गए फॉर्मूला के साथ मूल्यों को पा सकते हैं तो हमें ग्रेडिएंट डिसेंट का उपयोग …

3
"अधिकतम संभावना सीमित है" और इसका उपयोग कब किया जाना चाहिए?
मैंने इस पत्र के सार में पढ़ा है कि: "हार्टले ऑड राव की अधिकतम संभावना (एमएल) प्रक्रिया को पैटरसन और थॉम्पसन से रूपांतरण को संशोधित करके संशोधित किया जाता है, जो कि संभावना को दो भागों में सामान्यता प्रदान करता है, एक निश्चित प्रभाव से मुक्त होता है। इस भाग …

2
Resampling / सिमुलेशन विधि: मोंटे कार्लो, बूटस्ट्रैपिंग, जैकक्निफिंग, क्रॉस-मान्यता, यादृच्छिककरण परीक्षण, और क्रमपरिवर्तन परीक्षण
मैं विभिन्न resampling तरीकों (मोंटे कार्लो सिमुलेशन, पैरामीट्रिक बूटस्ट्रैपिंग, गैर पैरामीट्रिक बूटस्ट्रैपिंग, जैकक्निफिंग, क्रॉस-वैधीकरण, यादृच्छिककरण परीक्षण, और क्रमपरिवर्तन परीक्षण) और उनके उपयोग को अपने संदर्भ में आर के उपयोग से समझने की कोशिश कर रहा हूं । मैं निम्नलिखित स्थिति है कहो - मैं एक साथ एनोवा करना चाहते वाई …

6
गंगनम स्टाइल के यूट्यूब दृश्यों की संख्या की भविष्यवाणी करने के लिए मॉडल
PSY का संगीत वीडियो "गंगनम स्टाइल" लोकप्रिय है, 2 महीने से अधिक समय के बाद इसमें लगभग 540 मिलियन दर्शक हैं। मैंने पिछले सप्ताह रात के खाने में अपने पूर्वजों से यह सीखा और जल्द ही चर्चा इस दिशा में चली गई कि 10-12 दिनों में कितने दर्शक होंगे और …
73 modeling  web 

11
पीएचडी के बिना डाटा-माइनिंग में नौकरी करना
मैं कुछ समय के लिए डेटा-माइनिंग और मशीन-लर्निंग में बहुत रुचि रखता हूं, आंशिक रूप से क्योंकि मैंने स्कूल में उस क्षेत्र में पढ़ाई की है, लेकिन यह भी क्योंकि मैं वास्तव में उन समस्याओं को हल करने के लिए अधिक उत्साहित हूं, जिन्हें सिर्फ प्रोग्रामिंग की तुलना में थोड़ा …


2
सादे अंग्रेजी में "कर्नेल" क्या है?
कई विशिष्ट उपयोग हैं: कर्नेल घनत्व अनुमान गिरी चाल कर्नेल चौरसाई कृपया स्पष्ट करें कि उनमें "कर्नेल" का क्या मतलब है, सादे अंग्रेजी में, अपने शब्दों में।

6
एक क्लस्टरिंग विधि का चयन
समान मामलों को समूह में सेट किए गए डेटा पर क्लस्टर विश्लेषण का उपयोग करते समय, किसी को बड़ी संख्या में क्लस्टरिंग विधियों और दूरी के उपायों के बीच चयन करने की आवश्यकता होती है। कभी-कभी, एक विकल्प दूसरे को प्रभावित कर सकता है, लेकिन तरीकों के कई संभावित संयोजन …

9
रेखीय प्रतिगमन विश्लेषण में आउटलेयर से कैसे निपटा जाना चाहिए?
अक्सर बार एक सांख्यिकीय विश्लेषक को एक सेट डेटासेट दिया जाता है और रैखिक प्रतिगमन जैसी तकनीक का उपयोग करके एक मॉडल को फिट करने के लिए कहा जाता है। बहुत बार डाटासेट "ओह, हाँ, हमने कुछ डेटा बिंदुओं को इकट्ठा करने में गड़बड़ी की - जो आप करते हैं" …

6
क्या ईएफए के बजाय पीसीए का उपयोग करने का कोई अच्छा कारण है? इसके अलावा, पीसीए कारक विश्लेषण का विकल्प हो सकता है?
कुछ विषयों में, पीसीए (प्रमुख घटक विश्लेषण) को बिना किसी औचित्य के व्यवस्थित रूप से उपयोग किया जाता है, और पीसीए और ईएफए (खोज कारक कारक) को समानार्थक शब्द माना जाता है। इसलिए मैंने हाल ही में पीसीए का उपयोग एक स्केल वैलिडेशन स्टडी के परिणामों का विश्लेषण करने के …

4
तंत्रिका नेटवर्क क्यों गहरे होते जा रहे हैं, लेकिन व्यापक नहीं हैं?
हाल के वर्षों में, convolutional तंत्रिका नेटवर्क (या सामान्य रूप में शायद गहरी तंत्रिका नेटवर्क) राज्य के अत्याधुनिक नेटवर्क 7 परतों (से जाने के साथ, गहरे और गहरे हो गए हैं AlexNet 1000 परतों (करने के लिए) अवशिष्ट जाल) 4 की अंतरिक्ष में वर्षों। एक गहरे नेटवर्क से प्रदर्शन को …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.