सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

5
रैखिक मॉडल की मान्यताओं और क्या करें यदि अवशेषों को सामान्य रूप से वितरित नहीं किया गया है
मैं थोड़ा उलझन में हूं कि रैखिक प्रतिगमन की धारणाएं क्या हैं। अब तक मैंने जाँच की कि क्या: सभी व्याख्यात्मक चर प्रतिक्रिया चर के साथ रैखिक रूप से संबंधित हैं। (यह मामला था) व्याख्यात्मक चरों के बीच किसी भी तरह की मिलीभगत थी। (थोड़ी मिलीभगत थी)। मेरे मॉडल के …

2
क्लस्टर समय श्रृंखला कैसे करें?
मेरे पास क्लस्टर विश्लेषण के बारे में एक प्रश्न है। 3000 कंपनियां हैं, जिन्हें 5 वर्षों में अपनी शक्ति के उपयोग के अनुसार क्लस्टर किया जाना है। प्रत्येक कंपनी में 5 साल के दौरान हर घंटे के लिए मान हैं। मैं यह पता लगाना चाहूंगा कि क्या कुछ कंपनियों की …

5
प्रतिगमन में असंतुलित डेटा के लिए नमूनाकरण
वर्गीकरण में असंतुलित डेटा को संभालने पर अच्छे सवाल किए गए हैं संदर्भ , लेकिन मैं सोच रहा हूं कि लोग प्रतिगमन के लिए क्या नमूना लेते हैं। कहो समस्या डोमेन संकेत के प्रति बहुत संवेदनशील है, लेकिन केवल लक्ष्य के परिमाण के प्रति कुछ हद तक संवेदनशील है। हालांकि …

6
छोटे नमूनों के लिए उपयुक्त सामान्यता परीक्षण
अब तक, मैं छोटे नमूनों में सामान्यता मान्यताओं का परीक्षण करने के लिए शापिरो-विल्क सांख्यिकीय का उपयोग कर रहा हूं। क्या आप कृपया दूसरी तकनीक सुझा सकते हैं?

5
अनुभवजन्य सीडीएफ बनाम सीडीएफ
मैं अनुभवजन्य संचयी वितरण समारोह के बारे में सीख रहा हूँ। लेकिन मुझे अभी भी समझ नहीं आ रहा है इसे 'एम्पिरिकल' क्यों कहा जाता है? क्या Empirical CDF और CDF में कोई अंतर है?

5
बेय्स 'प्रमेय अंतर्ज्ञान
मैं पहले , पीछे , संभावना और सीमांत संभावना के संदर्भ में बेयस प्रमेय की एक अंतर्ज्ञान आधारित समझ विकसित करने की कोशिश कर रहा हूं । उसके लिए मैं निम्नलिखित समीकरण का उपयोग करता हूं: P(B|A)=P(A|B)P(B)P(A)P(B|A)=P(A|B)P(B)P(A)P(B|A) = \frac{P(A|B)P(B)}{P(A)} जहांAAAएक परिकल्पना या विश्वास काप्रतिनिधित्व करताहै औरडेटा या सबूत का प्रतिनिधित्व …

4
डीप लर्निंग मॉडल के लिए सॉफ्टमैक्स आउटपुट एक अच्छा अनिश्चितता मापक क्यों नहीं है?
मैं पिछले कुछ समय से कन्वेंशनल न्यूरल नेटवर्क्स (CNNs) के साथ काम कर रहा हूं, ज्यादातर सिमेंटिक सेगमेंटेशन / इंस्टेंसेशन के लिए इमेज डेटा पर। मैंने अक्सर "हीट मैप" के रूप में नेटवर्क आउटपुट के सॉफ्टमैक्स की कल्पना की है, यह देखने के लिए कि एक निश्चित वर्ग के लिए …

5
कच्चा या रूढ़िवादी बहुपद प्रतिगमन?
मैं पर एक चर करना चाहता हूं । क्या मुझे कच्चे या रूढ़िवादी बहुपद का उपयोग करना चाहिए? मैंने इनसे निपटने वाली साइट पर प्रश्न देखा, लेकिन मुझे वास्तव में समझ नहीं आया कि इनका उपयोग करने में क्या अंतर है। yyyx,x2,…,x5x,x2,…,x5x,x^2,\ldots,x^5 क्यों मैं सिर्फ गुणांक पाने के लिए एक …

2
क्या पीसीए को समय श्रृंखला डेटा के लिए लागू किया जा सकता है?
मैं समझता हूं कि मूल घटक विश्लेषण (पीसीए) मूल रूप से क्रॉस अनुभागीय डेटा के लिए लागू किया जा सकता है। क्या पीसीए को समय श्रृंखला डेटा के लिए प्रभावी रूप से समय श्रृंखला चर के रूप में निर्दिष्ट करके और सामान्य रूप से पीसीए चलाने के लिए इस्तेमाल किया …
22 time-series  pca 

2
सांख्यिकी और एमएल में "कर्नेल" नाम क्यों?
यह ऑपरेटिंग सिस्टम और रैखिक बीजगणित के संदर्भ में अन्य एसई साइटों पर पूछा गया है, लेकिन एक ही सवाल मुझे सांख्यिकी और मशीन सीखने में उपयोग किए जाने वाले कर्नेल तरीकों के बारे में बताता है। अक्सर यह कहा जाता है कि कर्नेल, जैसे कि कर्नेल घनत्व अनुमान या …


3
एक यादृच्छिक संख्या जनरेटर में वास्तव में एक बीज क्या है?
मैंने कुछ सामान्य Google खोज आदि की कोशिश की, लेकिन मुझे जो उत्तर मिले वे या तो कुछ अस्पष्ट या भाषा / पुस्तकालय विशिष्ट हैं जैसे कि पायथन या सी ++ stdlib.hआदि। एक उदाहरण के रूप में, कई कहते हैं कि बीज यादृच्छिक संख्या जनरेटर का एक प्रारंभिक बिंदु है …

4
मेरे अनुकरण में केंद्रीय सीमा प्रमेय क्यों टूट जाता है?
मान लें कि मेरे पास निम्नलिखित संख्याएँ हैं: 4,3,5,6,5,3,4,2,5,4,3,6,5 मैं उनमें से कुछ का नमूना कहता हूं, उनमें से 5, और 5 नमूनों की राशि की गणना करते हैं। फिर मैं कई रकम पाने के लिए उस पर और फिर से दोहराता हूं, और मैं एक हिस्टोग्राम में रकम के …

3
क्या लाइकलीहुड की परिभाषा पर फ़्रीक्वेंटिस्ट और बेयसियन के बीच कोई अंतर है?
कुछ स्रोतों का कहना है कि संभावना समारोह सशर्त संभावना नहीं है, कुछ का कहना है कि यह है। यह मेरे लिए बहुत उलझन की बात है। सबसे सूत्रों मैंने देखा है के अनुसार, पैरामीटर के साथ एक वितरण की संभावना θθ\theta , यह देखते हुए संभावना जन कार्यों का …

4
वर्णनात्मक आंकड़ों की रिपोर्टिंग का क्या मतलब है?
मैंने सिर्फ लॉजिस्टिक रिग्रेशन का उपयोग करके अपने डेटा का विश्लेषण किया है, हालांकि मुझे अपनी रिपोर्ट में एक वर्णनात्मक सांख्यिकी भाग भी आवश्यक है। मैं ईमानदारी से इस बिंदु को नहीं देखता हूं और मैं उम्मीद कर रहा था कि कोई व्यक्ति यह समझाने में सक्षम हो सकता है …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.