सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
बूस्टिंग: सीखने की दर को नियमितीकरण पैरामीटर क्यों कहा जाता है?
सीखने की दर पैरामीटर ( ) ढाल में सिकुड़ती बढ़ाने प्रत्येक नया आधार मॉडल -typically एक उथले tree- कि श्रृंखला में जोड़ा जाता है का योगदान। यह नाटकीय रूप से परीक्षण सेट सटीकता को बढ़ाने के लिए दिखाया गया था, जो कि छोटे कदमों के साथ समझ में आता है, …

3
जूलिया: यह कैसे कर रहा है का जायजा लेते हुए
यह पोस्ट तेजी से बदलती घटना से संबंधित है। मुझे 2012 का एक प्रश्न आया, जिसमें विभिन्न प्रकार के सांख्यिकीय कार्यों के लिए आर / पायथन के विकल्प के रूप में जूलिया के बारे में बहुत अच्छी चर्चा थी। यहां जूलिया के वादे के बारे में 2012 से मूल प्रश्न …
19 r  python  computing  julia 

1
रैखिक प्रतिगमन में परिपत्र भविष्यवाणियों का उपयोग
मैं पवन डेटा (0, 359) और दिन के समय (0, 23) का उपयोग करके एक मॉडल को फिट करने की कोशिश कर रहा हूं, लेकिन मुझे चिंता है कि वे खराब रेखीय प्रतिगमन में फिट होंगे, क्योंकि वे स्वयं रैखिक पैरामीटर नहीं हैं। मैं उन्हें पायथन का उपयोग करके बदलना …

3
आरसीएन (LSTM) का उपयोग समय के वैक्टर (थीनो) की भविष्यवाणी के लिए
मुझे बहुत ही साधारण समस्या है लेकिन मुझे इसे हल करने के लिए एक सही उपकरण नहीं मिल रहा है। मेरे पास उसी लंबाई के वैक्टर के कुछ अनुक्रम हैं। अब मैं इन अनुक्रमों के ट्रेन नमूने पर LSTM RNN को प्रशिक्षित करना चाहता हूं और फिर कई प्राइमिंग वैक्टरों …

5
सहसंबंधित डेटा सिमुलेशन के लिए चोल्स्की अपघटन, या एक विकल्प का उपयोग कैसे करें
मैं एक सहसंबंध मैट्रिक्स दिया सहसंबद्ध यादृच्छिक चर का अनुकरण करने के लिए चोल्स्की अपघटन का उपयोग करता हूं। बात यह है, परिणाम कभी भी सहसंबंध संरचना को पुन: पेश नहीं करता है जैसा कि दिया गया है। यहां स्थिति का वर्णन करने के लिए पायथन में एक छोटा सा …

3
तंत्रिका नेटवर्क में पूर्वाग्रह नोड का महत्व
मैं यह जानने के लिए उत्सुक हूं कि आधुनिक तंत्रिका नेटवर्क की प्रभावशीलता के लिए पूर्वाग्रह नोड कितना महत्वपूर्ण है। मैं आसानी से समझ सकता हूं कि यह केवल कुछ इनपुट चर के साथ उथले नेटवर्क में महत्वपूर्ण हो सकता है। हालांकि, आधुनिक तंत्रिका जाल जैसे कि गहरी शिक्षा में …

1
विषय (दोहरी) अंतरिक्ष में पीसीए की ज्यामितीय समझ
मैं विषय (दोहरी) अंतरिक्ष में प्रमुख घटक विश्लेषण (पीसीए) कैसे काम करता है , इसकी सहज जानकारी प्राप्त करने की कोशिश कर रहा हूं । दो चर, के साथ 2 डी डाटासेट पर विचार करें और , और डेटा बिंदुओं (डेटा मैट्रिक्स है और केंद्रित हो माना जाता है)। पीसीए …

3
दुर्लभ घटना लॉजिस्टिक रिग्रेशन पूर्वाग्रह: कम से कम उदाहरण के साथ कम करके आंका गया p कैसे अनुकरण करें?
CrossValidated पर किंग और ज़ेंग (2001) द्वारा दुर्लभ घटना पूर्वाग्रह सुधार कब और कैसे लागू किया जाए, इस पर कई सवाल हैं । मैं कुछ अलग खोज रहा हूं: एक न्यूनतम सिमुलेशन-आधारित प्रदर्शन जो पूर्वाग्रह मौजूद है। विशेष रूप से, राजा और ज़ेंग राज्य "... दुर्लभ घटनाओं के आंकड़ों में …

1
इस लस्सो साजिश (glmnet) से क्या निष्कर्ष निकाला जाए
निम्नलिखित डिफ़ॉल्ट अल्फा (1, इसलिए lasso) के साथ Glmnet की साजिश है, जिसमें mtcarsडेटा सेट का उपयोग mpgDV और अन्य के साथ भविष्यवक्ता चर के रूप में किया गया है। glmnet(as.matrix(mtcars[-1]), mtcars[,1]) विशेष रूप से am, cylऔर wt(लाल, काली और हल्की नीली रेखाओं) के संबंध में हम इस कथानक से …

3
पियर्सन पैरामीट्रिक और स्पीयरमैन गैर पैरामीट्रिक क्यों है
जाहिर तौर पर पियर्सन का सहसंबंध गुणांक पैरामीट्रिक है और स्पीयरमैन का आरएच गैर पैरामीट्रिक है। मुझे यह समझने में परेशानी हो रही है। जैसा कि मैं समझता हूँ कि पियर्सन की गणना में की जाती है और स्पीयरमैन की गणना उसी तरह से की जाती है, सिवाय इसके कि …

3
सहसंबद्ध यादृच्छिक चर उत्पन्न करने का सूत्र कैसे काम करता है?
यदि हमारे पास 2 सामान्य, असंबद्ध यादृच्छिक चर तो हम सूत्र के साथ 2 सहसंबद्ध यादृच्छिक चर बना सकते हैंएक्स1, एक्स2X1,X2X_1, X_2 Y= ρ एक्स1+ 1 - ρ2-----√एक्स2Y=ρX1+1−ρ2X2Y=\rho X_1+ \sqrt{1-\rho^2} X_2 और फिर का साथ सहसंबंध ।ρ X १YYYρρ\rhoएक्स1X1X_1 क्या कोई समझा सकता है कि यह सूत्र कहाँ से आता …

2
अनुक्रम वर्गीकरण के लिए आवर्तक तंत्रिका नेटवर्क का उपयोग कैसे किया जा सकता है?
RNN का उपयोग भविष्यवाणी के लिए किया जा सकता है, या अनुक्रम से अनुक्रम मैपिंग के लिए किया जा सकता है। लेकिन आरएनएन को वर्गीकरण के लिए कैसे इस्तेमाल किया जा सकता है? मेरा मतलब है, हम एक पूरे अनुक्रम को एक लेबल देते हैं।

2
लोचदार / रिज / लासो विश्लेषण, फिर क्या?
मैं वास्तव में पूर्वसूचक संकोचन / चयन के लिए लोचदार शुद्ध प्रक्रिया में दिलचस्पी ले रहा हूं। यह बहुत शक्तिशाली लगता है। लेकिन वैज्ञानिक दृष्टिकोण से मुझे पता नहीं है कि मुझे एक बार गुणांक प्राप्त करने के लिए क्या करना चाहिए। मैं किस प्रश्न का उत्तर दे रहा हूं? …

5
क्या स्ट्रीमिंग डेटा के लिए टी-एसएनई के कोई संस्करण हैं?
टी-एसएनई और बार्न्स-हट सन्निकटन की मेरी समझ यह है कि सभी डेटा बिंदुओं की आवश्यकता होती है ताकि सभी बल इंटरैक्शन की गणना एक ही समय में की जा सके और प्रत्येक बिंदु को 2 डी (या निम्न आयामी) मानचित्र में समायोजित किया जा सके। क्या टी-स्नेन के कोई संस्करण …

1
क्रॉस-वेलिडेशन (CV) पर आधारित भविष्यवाणी अंतराल
टेक्स्ट बुक्स और यूट्यूब लेक्चर्स में मैंने इसे बढ़ाने के रूप में पुनरावृत्त मॉडल के बारे में बहुत कुछ सीखा, लेकिन मैंने कभी भी एक भविष्यवाणी अंतराल प्राप्त करने के बारे में कुछ नहीं देखा। क्रॉस सत्यापन निम्नलिखित के लिए उपयोग किया जाता है: मॉडल का चयन : अलग-अलग मॉडल …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.