सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

4
वर्गीकरण संभावना सीमा
मेरे पास सामान्य तौर पर वर्गीकरण के संबंध में एक प्रश्न है। च एक क्लासिफायरियर होने दें, जो कुछ डेटा डी को दिए गए संभावनाओं के एक सेट को आउटपुट करता है। आम तौर पर, कोई भी कहेगा: ठीक है, अगर पी (सी | डी)> 0.5, हम एक कक्षा 1 …

1
स्टोचस्टिक ढाल वंश के लिए बैच का आकार कितना बड़ा होना चाहिए?
मैं समझता हूँ कि स्टोकेस्टिक ग्रेडिएंट वंश का उपयोग प्रशिक्षण डेटासेट के एक अलग नमूने के साथ प्रत्येक पुनरावृत्ति को अद्यतन करके एक तंत्रिका नेटवर्क को अनुकूलित करने के लिए किया जा सकता है। बैच का आकार कितना बड़ा होना चाहिए?


2
विभिन्न नमूना आकारों से साधनों की तुलना कैसे की जानी चाहिए?
एक वेबसाइट पर पुस्तक रेटिंग का मामला ले लो। बुक ए को 10,000 लोगों द्वारा औसत रेटिंग 4.25 के साथ रेट किया गया है और विचरण । इसी तरह बुक बी को 100 लोगों ने रेट किया है और इसकी रेटिंग 4.5 के साथ ।σ = 0.25σ= 0.5σ=0.5\sigma = 0.5σ= …

4
X और XY यादृच्छिक चर के बीच सहसंबंध गुणांक 0.7 क्यों हो जाता है
मेडिकल रिसर्च के लिए प्रैक्टिकल स्टेटिस्टिक्स से लिया गया जहां डगलस ऑल्टमैन पृष्ठ 285 में लिखते हैं: ... किसी भी दो मात्राओं के लिए X और Y, X का XY के साथ संबंध होगा। वास्तव में, भले ही X और Y यादृच्छिक संख्याओं के नमूने हैं, हम X और XY …

1
बूटस्ट्रैप बनाम कटहल
बूटस्ट्रैप और जैकनाइफ दोनों तरीकों का उपयोग पूर्वाग्रह का अनुमान लगाने के लिए किया जा सकता है और दोनों ही तरीकों के मानक त्रुटि का अनुमान बहुत बड़ा नहीं है: प्रतिस्थापन के साथ नमूनाकरण बनाम एक समय में एक अवलोकन छोड़ देते हैं। हालांकि, जैकनाइफ अनुसंधान और व्यवहार में बूटस्ट्रैप …

6
क्या अमेज़ॅन की "औसत रेटिंग" भ्रामक है?
अगर मैं सही तरीके से समझूं, तो 1-5 के पैमाने पर बुक रेटिंग्स लिकर्ट स्कोर हैं। यही है, मेरे लिए एक 3 जरूरी नहीं कि किसी और के लिए 3 हो। यह एक ऑर्डिनल स्केल IMO है। एक को वास्तव में औसतन तराजू नहीं चाहिए, लेकिन निश्चित रूप से मोड, …

3
लॉजिस्टिक रिग्रेशन एक रैखिक क्लासिफायरियर क्यों है?
चूंकि हम इनपुट के रैखिक संयोजन को गैर-रेखीय आउटपुट में बदलने के लिए लॉजिस्टिक फ़ंक्शन का उपयोग कर रहे हैं, इसलिए लॉजिस्टिक रिग्रेशन को रैखिक क्लासिफायरियर कैसे माना जा सकता है? रेखीय प्रतिगमन छिपी हुई परत के बिना एक तंत्रिका नेटवर्क की तरह है, इसलिए तंत्रिका नेटवर्क को गैर-रैखिक क्लासिफायरियर …

2
यादृच्छिक प्रभावों-, निश्चित प्रभावों- और सीमांत मॉडल के बीच क्या अंतर है?
मैं आंकड़ों के अपने ज्ञान का विस्तार करने की कोशिश कर रहा हूं। मैं सांख्यिकीय परीक्षण के लिए "नुस्खा आधारित" दृष्टिकोण के साथ एक भौतिक विज्ञान पृष्ठभूमि से आता हूं, जहां हम कहते हैं कि यह निरंतर है, क्या इसे सामान्य रूप से वितरित किया जाता है - ओएलएस प्रतिगमन …

6
संवेदनशीलता, विशिष्टता, सटीकता, सटीकता और याद करने के बीच अंतर को याद रखने का सबसे अच्छा तरीका क्या है?
502847894789 बार इन शब्दों को देखने के बावजूद, मैं अपने जीवन के लिए संवेदनशीलता, विशिष्टता, सटीकता, सटीकता और याद के बीच के अंतर को याद नहीं कर सकता। वे बहुत सरल अवधारणाएं हैं, लेकिन नाम मेरे लिए बहुत अचूक हैं, इसलिए मैं उन्हें एक-दूसरे के साथ भ्रमित करता रहता हूं। …

4
आर में यादृच्छिक वन कंप्यूटिंग समय
मैं आर पैकेज में 10,000 पंक्तियों और 34 विशेषताओं के साथ पार्टी पैकेज का उपयोग कर रहा हूं , और कुछ कारक विशेषताओं में 300 से अधिक स्तर हैं। कंप्यूटिंग का समय बहुत लंबा है। (इसमें अभी तक 3 घंटे का समय लगा है और यह अभी तक समाप्त नहीं …
49 r  random-forest 

1
प्रदर्शन मेट्रिक्स अप्रकाशित शिक्षा का मूल्यांकन करने के लिए
अप्रशिक्षित अधिगम (जैसे क्लस्टरिंग) के संबंध में, क्या प्रदर्शन का मूल्यांकन करने के लिए कोई मैट्रिक्स हैं?


4
क्या सहसंबंध = 0.2 का मतलब है कि एक संघ "केवल 5 लोगों में 1" है?
में बेवकूफ ब्रेन: एक Neuroscientist बताता है कि आपका सिर वास्तव में ऊपर करने के लिए है , डीन बर्नेट ने लिखा है ऊंचाई और बुद्धिमत्ता के बीच सहसंबंध का आमतौर पर रूप में उल्लेख किया जाता है , जिसका अर्थ है कि ऊंचाई और बुद्धिमत्ता केवल से लोगों में …

3
आवर्तक बनाम पुनरावर्ती तंत्रिका नेटवर्क: जो एनएलपी के लिए बेहतर है?
आवर्तक तंत्रिका नेटवर्क और पुनरावर्ती तंत्रिका नेटवर्क हैं। दोनों को आमतौर पर एक ही संक्षिप्त नाम से दर्शाया जाता है: आरएनएन। विकिपीडिया के अनुसार , आवर्तक एनएन वास्तव में पुनरावर्ती एनएन हैं, लेकिन मैं वास्तव में स्पष्टीकरण को नहीं समझता हूं। इसके अलावा, मुझे ऐसा नहीं लगता कि प्राकृतिक भाषा …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.