सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

7
क्या कारण है कि हम अर्थमिति में फ़ंक्शन को निर्दिष्ट करने के लिए लॉग 10 से बेस 10 के बजाय प्राकृतिक लघुगणक (ln) का उपयोग करते हैं?
क्या कारण है कि हम अर्थमिति में कार्यों को निर्दिष्ट करने में लॉग 10 से आधार के बजाय प्राकृतिक लघुगणक (ln) का उपयोग करते हैं?

4
कण भौतिकी में साक्ष्य स्वीकार करने के लिए "5 " दहलीज की उत्पत्ति ?
समाचार रिपोर्टों में कहा गया है कि सर्न कल घोषणा करेगा कि हिग्स बोसोन को प्रयोगात्मक रूप से 5 सबूत के साथ पता चला है। उस लेख के अनुसार:σσ\sigma 5 99.99994% संभावना के बराबर है कि डेटा CMS और ATLAS डिटेक्टर देख रहे हैं कि केवल यादृच्छिक शोर नहीं है …

1
आर में एक तंत्रिका नेटवर्क मॉडल को कैसे प्रशिक्षित और मान्य किया जाए?
मैं तंत्रिका नेटवर्क के साथ मॉडलिंग करने के लिए नया हूं, लेकिन मैंने सभी उपलब्ध डेटा बिंदुओं के साथ एक तंत्रिका नेटवर्क स्थापित करने में कामयाबी पाई जो अवलोकन किए गए डेटा को अच्छी तरह से फिट करता है। तंत्रिका नेटवर्क R में nnet पैकेज के साथ किया गया था: …

3
आर के साथ एक ARIMAX- मॉडल कैसे फिट करें?
मेरे पास प्रति घंटे माप की चार अलग-अलग श्रृंखलाएं हैं: एक घर के अंदर गर्मी की खपत घर के बाहर का तापमान सौर विकिरण हवा की गति मैं घर के अंदर गर्मी की खपत की भविष्यवाणी करने में सक्षम होना चाहता हूं। एक स्पष्ट मौसमी प्रवृत्ति है, दोनों वार्षिक आधार …

4
विवादास्पद तर्क क्या है और इसे क्यों स्वीकार नहीं किया गया है?
आरए फिशर के दिवंगत योगदानों में से एक फिडुकल अंतराल और फिडुकल रियासती तर्क थे । हालांकि यह दृष्टिकोण कहीं न कहीं लगातार लोकप्रिय होता जा रहा है। विवादास्पद तर्क क्या है और क्यों स्वीकार नहीं किया गया है?

5
गणना डेटा के लिए पॉइसन प्रतिगमन का उपयोग क्यों किया जाता है?
मैं समझता हूं कि कुछ डेटासेट जैसे मतदान के लिए यह बेहतर प्रदर्शन करता है। साधारण रेखीय प्रतिगमन या उपस्कर प्रतिगमन पर पोइसन प्रतिगमन का उपयोग क्यों किया जाता है? इसके लिए गणितीय प्रेरणा क्या है?

2
क्या पॉइज़न वितरित डेटा के लिए एक बॉक्सप्लेट संस्करण है?
मैं जानना चाहूंगा कि क्या कोई बॉक्सप्लॉट वैरिएंट पोइसन वितरित डेटा (या संभवतः अन्य वितरण) के लिए अनुकूलित है? गॉसियन डिस्ट्रीब्यूशन के साथ, व्हिस्कर्स को एल = क्यू 1 - 1.5 आईक्यूआर और यू = क्यू 3+ 1.5 आईक्यूआर में रखा गया है, बॉक्सप्लेट में संपत्ति है कि लगभग कम …


4
R में मानक त्रुटि क्लस्टरिंग (या तो मैन्युअल रूप से या plm में)
मैं मानक त्रुटि "क्लस्टरिंग" को समझने की कोशिश कर रहा हूं और आर में निष्पादित कैसे करना है (यह स्टाटा में तुच्छ है)। आरआई में plmया तो अपने स्वयं के फ़ंक्शन का उपयोग करने या लिखने में असफल रहा है। मैं पैकेज diamondsसे डेटा का उपयोग करूँगा ggplot2। मैं या …

10
आँकड़ों से डरने वाले छात्रों को कैसे पढ़ाएँ?
मैं इस सेमेस्टर के मेडिकल छात्रों को आंकड़े पढ़ाने में मदद करने वाला हूं। मैंने सीखने के आंकड़ों से इन छात्रों के डर के बारे में कई डरावनी कहानियाँ सुनी हैं। क्या कोई सुझाव दे सकता है कि इस डर का क्या करना है? (इस पर चर्चा करने वाले लोगों …
33 teaching 

14
उत्तरजीविता विश्लेषण के लिए संदर्भ
मैं उत्तरजीविता विश्लेषण के बारे में जानने के लिए एक अच्छी पुस्तक / ट्यूटोरियल की तलाश कर रहा हूं। आर में उत्तरजीविता विश्लेषण करने के संदर्भ में भी मेरी दिलचस्पी है।
33 r  survival  references 

3
किसी वस्तु के रंग का निर्धारण करने का सबसे सटीक तरीका क्या है?
मैंने एक कंप्यूटर प्रोग्राम लिखा है जो कंप्यूटर की दृष्टि के लिए कुछ मानक तकनीकों (गाऊसी ब्लर, थ्रॉल्डिंग, ह्यू-ट्रांसफॉर्म आदि) का उपयोग करके एक स्थिर छवि (.jpeg, .png, आदि) में सिक्कों का पता लगा सकता है। किसी दिए गए चित्र से उठाए गए सिक्कों के अनुपात का उपयोग करके, मैं …

6
दो हिस्टोग्राम की समानता का आकलन कैसे करें?
दो हिस्टोग्रामों को देखते हुए, हम कैसे आकलन करते हैं कि वे समान हैं या नहीं? क्या केवल दो हिस्टोग्राम को देखना पर्याप्त है? सरल वन टू वन मैपिंग में यह समस्या होती है कि यदि हिस्टोग्राम थोड़ा अलग और थोड़ा शिफ्ट होता है तो हमें वांछित परिणाम नहीं मिलेगा। …

2
एक यादृच्छिक चर के एक समारोह का भिन्न
कहते हैं कि हमारे पास ज्ञात चर और माध्य के साथ यादृच्छिक चर XXX है। प्रश्न यह है: किसी दिए गए फ़ंक्शन के लिए का विचरण क्या है f(X)f(X)f(X)। एकमात्र सामान्य विधि जिसके बारे में मुझे पता है वह डेल्टा विधि है, लेकिन यह केवल प्रतिफल देती है। अब मैं …

1
GBM, XGBoost, LightGBM, CatBoost के बीच गणितीय अंतर?
मॉडल के GBDT परिवार के कई कार्यान्वयन मौजूद हैं जैसे: जीबीएम XGBoost LightGBM Catboost। इन विभिन्न कार्यान्वयनों के बीच गणितीय अंतर क्या हैं ? कैटबॉस्ट इस बेंच मार्क के अनुसार केवल अपने डिफ़ॉल्ट मापदंडों का उपयोग करके अन्य कार्यान्वयन को बेहतर बनाने के लिए लगता है , लेकिन यह अभी …
33 boosting  xgboost 

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.