सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

1
ब्रिज पेनल्टी बनाम इलास्टिक नेट नियमितिकरण
कुछ दंड कार्यों और सन्निकटन का अच्छी तरह से अध्ययन किया जाता है, जैसे कि LASSO ( ) और रिज ( ) और ये कैसे प्रतिगमन में तुलना करते हैं।एल 2L1L1L_1L2L2L_2 मैं ब्रिज पेनल्टी के बारे में पढ़ रहा हूं, जो कि सामान्यीकृत जुर्माना है। उसकी तुलना उस LASSO से …

2
पैरामीटर अनुमान के लिए द्विपद वितरण के लिए संभावना फ़ंक्शन कैसे प्राप्त करें?
इंजीनियर्स के लिए मिलर और फ्रायंड की संभावना और सांख्यिकी, 8ed ( pp.217-218 ) के अनुसार, द्विपद वितरण (बर्नौली परीक्षण) के लिए अधिकतम होने की संभावना के रूप में दिया जाता है। L(p)=∏ni=1pxi(1−p)1−xiL(p)=∏i=1npxi(1−p)1−xiL(p) = \prod_{i=1}^np^{x_i}(1-p)^{1-x_i} इस समीकरण पर कैसे पहुंचे? यह मुझे अन्य वितरण, पॉसों और गाऊसी के बारे में …

2
क्या मुझे ब्रिटिश अंग्रेजी में "सामान्य वितरण" में "एन" को कैपिटल करना चाहिए?
यह सवाल थोड़ा वाम-क्षेत्र है, लेकिन मुझे लगा कि इस समुदाय के विषय पर शायद मजबूत विचार हैं! मैं अपनी पीएचडी थीसिस लिख रहा हूं। लगातार, जब मात्राओं के बारे में बात की जाती है जो औपचारिक रूप से गौसियन वितरण से संबंधित होती हैं, तो मैंने उन्हें संदर्भित करने …

4
झूठी और सच्ची सकारात्मक दर दिखाने वाले इस चार्ट का नाम क्या है और यह कैसे उत्पन्न होता है?
नीचे दी गई छवि झूठी सकारात्मक दरों बनाम वास्तविक सकारात्मक दरों के निरंतर वक्र को दर्शाती है: हालाँकि, मुझे तुरंत क्या नहीं मिलता है कि इन दरों की गणना कैसे की जा रही है। यदि कोई विधि डेटासेट में लागू होती है, तो इसमें एक निश्चित FP दर और एक …

1
दूरी मीट्रिक के रूप में सहसंबंध का उपयोग करना (पदानुक्रमित क्लस्टरिंग के लिए)
मैं अपने डेटा को श्रेणीबद्ध रूप से क्लस्टर करना चाहूंगा, लेकिन यूक्लिडियन दूरी का उपयोग करने के बजाय, मैं सहसंबंध का उपयोग करना चाहूंगा। इसके अलावा, चूंकि सहसंबंध गुणांक -1 से 1 तक होता है, मेरे अध्ययन में -1 और 1 दोनों को "सह-विनियमन" के साथ दर्शाया जाता है, मैं …

2
भविष्य कहनेवाला अनुमान लगाने के लिए कौन से गैर-बायेसियन तरीके हैं?
बायेसियन अनुमान में भविष्य के डेटा के लिए एक भविष्यवाणिय वितरण अज्ञात मापदंडों को एकीकृत करके प्राप्त किया जाता है; उन मापदंडों के पीछे वितरण पर एकीकरण से पहले से देखे गए लोगों पर भविष्य के डेटा सशर्त के लिए एक भविष्यवाणिय वितरण - भविष्यवाणिय वितरण मिलता है। भविष्य कहनेवाला …

2
कन्वेन्शनल न्यूरल नेटवर्क हाइपरपामेटर्स के चयन के नियम
क्या कोई अच्छा कागजात है जो फ़िल्टर के लिए आयामों को चुनने, इकाइयों को पूल करने और दोषपूर्ण परतों की संख्या का निर्धारण करने के कुछ तरीके को कवर करता है?

2
Shrunken
पियरसन सहसंबंध गुणांक के जनसंख्या मूल्य के दो प्रकार के अनुमानकों के बारे में मेरे सिर में कुछ भ्रम है। ए फिशर (1915) से पता चला कि द्विचर सामान्य जनसंख्या अनुभवजन्य के लिए rrr एक है नकारात्मक पक्षपाती की आकलनकर्ता ρρ\rho , हालांकि पूर्वाग्रह केवल छोटा सा नमूना आकार (के …

2
कम से कम वर्ग वर्ग प्रतिगमन कदम-दर-चरण रैखिक बीजगणित संगणना
R में रैखिक-मिश्रित मॉडल के बारे में एक प्रश्न के लिए एक प्रस्तावना के रूप में, और शुरुआती / मध्यवर्ती आंकड़ों aficionados के लिए एक संदर्भ के रूप में साझा करने के लिए, मैंने एक स्वतंत्र "क्यू एंड ए-स्टाइल" के रूप में पोस्ट करने का फैसला किया "मैनुअल की गणना" …

1
उचित स्कोरिंग नियमों में से चुनना
उचित स्कोरिंग नियमों के अधिकांश संसाधनों में लॉग-लॉस, बैरियर स्कोर या गोलाकार स्कोरिंग जैसे विभिन्न स्कोरिंग नियमों का उल्लेख है। हालांकि, वे अक्सर उनके बीच के मतभेदों पर ज्यादा मार्गदर्शन नहीं देते हैं। (प्रदर्शनी ए: विकिपीडिया ।) लॉगरिदमिक स्कोर को अधिकतम करने वाले मॉडल को चुनना अधिकतम संभावना मॉडल को …

2
सभी के बारे में "कम-रैंक प्रतिगमन" क्या है?
मैं द स्टैटिस्टिकल ऑफ स्टैटिस्टिकल लर्निंग पढ़ रहा हूं और मुझे समझ नहीं आ रहा है कि धारा 3.7 "मल्टीपल रिजल्ट सिकुड़न और सिलेक्शन" क्या है। यह आरआरआर (कम-रैंक प्रतिगमन) के बारे में बात करता है, और मैं केवल यह समझ सकता हूं कि आधार एक सामान्यीकृत बहुभिन्नरूपी रैखिक मॉडल …

4
आकस्मिक तालिकाओं के लिए सबसे अच्छा दृश्य कौन सा है?
सांख्यिकीय दृष्टिकोण से, एक आकस्मिक तालिका दिखाने के लिए कौन सा सबसे अच्छा प्लॉट है, जिसे आमतौर पर ची-स्क्वायर टेस्ट द्वारा विश्लेषण किया जा रहा है? क्या यह चकमा देने वाला बारप्लॉट, स्टैक्ड बारप्लॉट, हीटमैप, समोच्च प्लॉट, घबराना स्कैल्पलॉट, मल्टीपल लाइन्स प्लॉट या कुछ और है? क्या किसी को पूर्ण …

2
एक दिए गए नमूना सहसंयोजक मैट्रिक्स के साथ डेटा उत्पन्न करना
एक सहसंयोजक मैट्रिक्स को देखते हुए ΣरोंΣs\boldsymbol \Sigma_s, कैसे डेटा उत्पन्न करने के लिए कि इसमें नमूना covariance मैट्रिक्स Σ^= ΣरोंΣ^=Σs\hat{\boldsymbol \Sigma} = \boldsymbol \Sigma_s ? आम तौर पर: हम अक्सर घनत्व x (x \ vert \ boldsymbol \ theta) से डेटा उत्पन्न करने में रुचि रखते हैं च( x …

1
क्यों केवल देखते हैं
पीसीए में, जब आयामों की संख्या ( N के बराबर या उससे अधिक) के नमूनों की संख्या N से अधिक है , तो ऐसा क्यों है कि आपके पास अधिकांश N - 1 गैर-शून्य eigenvectors होंगे? दूसरे शब्दों में, लोगों के बीच सहप्रसरण मैट्रिक्स के पद घ ≥ एन आयाम …

3
क्या घनत्व अनुमान के लिए एक बायेसियन दृष्टिकोण है
मुझे एक सतत यादृच्छिक चर के घनत्व का अनुमान लगाने में दिलचस्पी है । ऐसा करने का एक तरीका जो मैंने सीखा है वह है कर्नेल डेंसिटी एस्टीमेशन का उपयोग।एक्सXX लेकिन अब मुझे एक बायेसियन दृष्टिकोण में दिलचस्पी है जो निम्नलिखित पंक्तियों के साथ है। मैं शुरू में मानता हूं …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.