सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

8
क्या संभावना है कि यह व्यक्ति महिला है?
पर्दे के पीछे एक व्यक्ति है - मुझे नहीं पता कि वह व्यक्ति महिला है या पुरुष। मुझे पता है कि व्यक्ति के लंबे बाल हैं, और लंबे बालों वाले सभी 90% महिलाएं हैं मुझे पता है कि व्यक्ति के पास एक दुर्लभ रक्त प्रकार AX3 है, और इस रक्त …

5
राजनीतिक चुनावों के इतने बड़े नमूने क्यों होते हैं?
जब मैं समाचार देखता हूं तो मैंने देखा है कि राष्ट्रपति चुनाव जैसी चीजों के लिए गैलप चुनावों में 1,000 से अधिक अच्छी तरह से [मैं यादृच्छिक] नमूना आकार ग्रहण करता हूं। कॉलेज के आँकड़ों से मुझे जो याद आया, वह यह था कि 30 का एक नमूना आकार "काफी …

1
पीसीए एक k- साधन क्लस्टरिंग विश्लेषण के साथ कैसे मदद करेगा?
पृष्ठभूमि : मैं किसी शहर के आवासीय क्षेत्रों को उनकी सामाजिक-आर्थिक विशेषताओं के आधार पर समूहों में वर्गीकृत करना चाहता हूं, जिसमें आवास इकाई घनत्व, जनसंख्या घनत्व, हरा अंतरिक्ष क्षेत्र, आवास मूल्य, स्कूलों की संख्या / स्वास्थ्य केंद्र / दिन देखभाल केंद्र आदि शामिल हैं। मैं यह समझना चाहता हूं …

2
ओएलएस रैखिक प्रतिगमन में लागत समारोह
मशीन सीखने के बारे में कौरसेरा पर एंड्रयू एनजी द्वारा दिए गए रैखिक प्रतिगमन पर एक व्याख्यान से मैं थोड़ा भ्रमित हूं। वहां, उन्होंने एक लागत समारोह दिया जो योग के वर्गों को न्यूनतम करता है: 12m∑i=1m(hθ(X(i))−Y(i))212m∑i=1m(hθ(X(i))−Y(i))2 \frac{1}{2m} \sum _{i=1}^m \left(h_\theta(X^{(i)})-Y^{(i)}\right)^2 मैं समझता हूं कि कहां से आता है। मुझे …

2
शतरंज के लिए कोई गहन सुदृढीकरण सीखने वाले इंजन क्यों नहीं हैं, जो अल्फागो के समान है?
कंप्यूटर लंबे समय तक "ब्रूट-फोर्स" -टेक्नीक का उपयोग करके शतरंज खेलने में सक्षम है, एक निश्चित गहराई तक खोज और फिर स्थिति का मूल्यांकन करता है। हालाँकि, अल्फा गो कंप्यूटर केवल पदों का मूल्यांकन करने के लिए एक एएनएन का उपयोग करता है (यह किसी भी गहराई से खोज नहीं …

4
जब वास्तविक मूल्य शून्य हो तो सापेक्ष त्रुटि की गणना कैसे करें?
वास्तविक मूल्य शून्य होने पर मैं सापेक्ष त्रुटि की गणना कैसे करूं? कहें कि मेरे पास और । अगर मैं सापेक्ष त्रुटि को परिभाषित करता हूं:xtrue=0xtrue=0x_{true} = 0xtestxtestx_{test} relative error=xtrue−xtestxtruerelative error=xtrue−xtestxtrue\text{relative error} = \frac{x_{true}-x_{test}}{x_{true}} फिर सापेक्ष त्रुटि हमेशा अपरिभाषित होती है। अगर इसके बजाय मैं परिभाषा का उपयोग करता हूं: …

2
एसवीएम इष्टतम सी और गामा मापदंडों का निर्धारण करने के लिए कौन सी खोज सीमा है?
मैं वर्गीकरण के लिए एसवीएम का उपयोग कर रहा हूं और मैं रैखिक और आरबीएफ गुठली के लिए इष्टतम मापदंडों को निर्धारित करने की कोशिश कर रहा हूं। रैखिक कर्नेल के लिए मैं C को निर्धारित करने के लिए क्रॉस-वेरिफ़ाइड पैरामीटर चयन का उपयोग करता हूं और RBF कर्नेल के …

3
सहसंबंध या सहसंयोजन पर पीसीए: क्या सहसंबंध पर पीसीए कभी समझ में आता है? [बन्द है]
प्रमुख घटक विश्लेषण (पीसीए) में, कोई भी घटकों को खोजने के लिए सहसंयोजक मैट्रिक्स या सहसंबंध मैट्रिक्स चुन सकता है (अपने संबंधित eigenvectors से)। ये अलग-अलग परिणाम (पीसी लोडिंग और स्कोर) देते हैं, क्योंकि दोनों मैट्रिसेस के बीच आइजनवेक्टर समान नहीं हैं। मेरी समझ यह है कि यह इस तथ्य …

1
"दृढ़ संकल्प के गुणांक" और "औसत चुकता त्रुटि" के बीच अंतर क्या है?
प्रतिगमन समस्या के लिए, मैंने देखा है कि लोग "चयन के गुणांक" (उर्फ आर स्क्वार्ड) का उपयोग मॉडल चयन करने के लिए करते हैं, उदाहरण के लिए, नियमितीकरण के लिए उपयुक्त दंड गुणांक का पता लगाना। हालाँकि, प्रतिगमन सटीकता के माप के रूप में "माध्य चुकता त्रुटि" या "मूल माध्य …

3
क्या मशीन सीखने के लिए प्रोजेक्ट यूलर-अलाइक है?
मैंने प्रोग्रामिंग भाषा सीखने में अविश्वसनीय रूप से उपयोगी होने के लिए प्रोजेक्ट यूलर http://projecteuler.net/ पाया । क्या मशीन लर्निंग के लिए समान साइट है? मैंने http://www.kaggle.com/ को देखा , लेकिन यह प्रोजेक्ट यूलर के रूप में शुरुआती लोगों के लिए सुलभ नहीं है।
32 teaching 

1
PCA वस्तुनिष्ठ फ़ंक्शन: अधिकतम विचरण को कम करने और त्रुटि को कम करने के बीच क्या संबंध है?
पीसीए एल्गोरिथ्म को सहसंबंध मैट्रिक्स के रूप में तैयार किया जा सकता है (मान लें कि डेटा XXX पहले से ही सामान्य हो गया है और हम केवल पहले पीसी पर प्रक्षेपण पर विचार कर रहे हैं)। उद्देश्य समारोह के रूप में लिखा जा सकता है: maxw(Xw)T(Xw)s.t.wTw=1.maxw(Xw)T(Xw)s.t.wTw=1. \max_w (Xw)^T(Xw)\; \: …
32 pca  optimization 

3
एग्लोमेरेटिव पदानुक्रमित क्लस्टरिंग के लिए क्या स्टॉप-मानदंड व्यवहार में उपयोग किए जाते हैं?
मैंने व्यापक साहित्य को सभी प्रकार के मानदंडों (जैसे ग्लेन एट अल। 1985 (पीडीएफ) और जंग एट अल। 2002 (पीडीएफ)) का प्रस्ताव करते हुए पाया है । हालांकि, इनमें से अधिकांश को लागू करना आसान नहीं है (कम से कम मेरे दृष्टिकोण से)। मैं एक क्लस्टर पदानुक्रम प्राप्त करने के …
32 clustering 

3
आर एलएम में लापता मानों को कैसे संभालता है?
मैं मैट्रिक्स A में प्रत्येक कॉलम के खिलाफ एक वेक्टर B प्राप्त करना चाहता हूं। यह एक तुच्छ है यदि कोई लापता डेटा नहीं है, लेकिन यदि मैट्रिक्स A में लापता मान हैं, तो A के विरुद्ध मेरा प्रतिगमन केवल पंक्तियों को शामिल करने के लिए विवश है जहां सभी …

4
ओवर-छितरी हुई पॉइसन परिणामों के लिए मैं एक बहुस्तरीय मॉडल कैसे फिट करूं?
मैं एक बहुस्तरीय GLMM को आर का उपयोग करके एक पॉइसन वितरण (अति-फैलाव के साथ) फिट करना चाहता हूं फिलहाल मैं lme4 का उपयोग कर रहा हूं लेकिन मैंने देखा कि हाल ही में quasipoissonपरिवार को हटा दिया गया था। मैंने कहीं और देखा है कि आप एक स्तर प्रति …

2
एक दृढ़ तंत्रिका नेटवर्क में "फीचर मैप" (उर्फ "एक्टिवेशन मैप") की परिभाषा क्या है?
परिचय पृष्ठभूमि एक दृढ़ तंत्रिका नेटवर्क के भीतर, हमारे पास आमतौर पर एक सामान्य संरचना / प्रवाह होता है जो इस तरह दिखता है: इनपुट छवि (अर्थात एक 2D वेक्टर x) (1 संकेंद्रित परत (Conv1) यहां से शुरू होती है ...) w12 डी छवि (यानी z1 = w1*x + b1डॉट …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.