सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

4
एक सहसंबंध मैट्रिक्स को क्लस्टर करना
मेरे पास एक सहसंबंध मैट्रिक्स है जो बताता है कि प्रत्येक आइटम को दूसरे आइटम से कैसे संबद्ध किया जाता है। इसलिए एन आइटम के लिए, मेरे पास पहले से ही एन * एन सहसंबंध मैट्रिक्स है। इस सहसंबंध मैट्रिक्स का उपयोग करते हुए मैं एम डिब्बे में एन आइटम …

3
क्यों बेईमान प्रमेय में सामान्यीकरण कारक आवश्यक है?
बेयस प्रमेय P(model|data)=P(model)×P(data|model)P(data)P(model|data)=P(model)×P(data|model)P(data) P(\textrm{model}|\textrm{data}) = \frac{P(\textrm{model}) \times P(\textrm{data}|\textrm{model})}{P(\textrm{data})} यह सब ठीक है। लेकिन, मैंने कहीं पढ़ा है: मूल रूप से, P (डेटा) एक सामान्यीकृत स्थिरांक के अलावा कुछ भी नहीं है, अर्थात, एक स्थिरांक जो एक के बाद के घनत्व को एकीकृत करता है। हम जानते हैं कि और । …

4
"एक संभावना घनत्व समारोह के नीचे कुल क्षेत्र 1 है" - किस के सापेक्ष?
वैचारिक रूप से मैं वाक्यांश का अर्थ समझ लेता हूं "एक पीडीएफ के नीचे का कुल क्षेत्र 1 है"। इसका मतलब यह होना चाहिए कि संभावनाओं के कुल अंतराल में परिणाम की संभावना 100% है। लेकिन मैं वास्तव में इसे "ज्यामितीय" दृष्टिकोण से नहीं समझ सकता। यदि, उदाहरण के लिए, …

2
-est और -est के बीच चुनना
पृष्ठभूमि: मैं परिकल्पना परीक्षण पर काम करने वाले सहयोगियों को एक प्रस्तुति दे रहा हूं, और इसमें से अधिकांश को ठीक समझता हूं, लेकिन एक पहलू यह है कि मैं खुद को गांठ बांध रहा हूं और साथ ही दूसरों को समझाने की कोशिश कर रहा हूं। यह वही है …

2
कई समय अवधि के साथ अंतर मॉडल में अंतर निर्दिष्ट करना
जब मैं दो समय अवधि के साथ अंतर मॉडल में अंतर का अनुमान लगाता हूं, तो समान प्रतिगमन मॉडल होगा ए। Yमैं एस टी= α + γरों∗ टीr e a t m e n t + λ dटी+ δ∗ ( टीआर ई एक टी एम ई एन टी * घटी) …

2
क्या अल्फा और लैम्ब्डा दोनों के लिए ग्लमैनेट क्रॉस-वैलेट के लिए कैरेट ट्रेन फ़ंक्शन है?
क्या आर caretपैकेज मॉडल के लिए alphaऔर दोनों पर क्रॉस-मान्य है ? इस कोड को चलाना,lambdaglmnet eGrid <- expand.grid(.alpha = (1:10) * 0.1, .lambda = (1:10) * 0.1) Control <- trainControl(method = "repeatedcv",repeats = 3,verboseIter =TRUE) netFit <- train(x =train_features, y = y_train, method = "glmnet", tuneGrid = eGrid, trControl …

4
सामान्य वितरण के मिश्रण से यादृच्छिक चर उत्पन्न करना
मैं मिश्रण वितरण और विशेष रूप से सामान्य वितरणों के मिश्रण से कैसे नमूना ले सकता हूं R? उदाहरण के लिए, अगर मैं से नमूना लेना चाहता था: 0.3× एन( 0 , 1 )+0.5× एन( 10 , 1 )+0.2× एन( ३ , १ )0.3×एन(0,1)+0.5×एन(10,1)+0.2×एन(3,.1) 0.3\!\times\mathcal{N}(0,1)\; + \;0.5\!\times\mathcal{N}(10,1)\; + \;0.2\!\times\mathcal{N}(3,.1) ऐसा …

3
बेंटियन सांख्यिकी के लिए गेंटलर दृष्टिकोण
मैंने हाल ही में बोलस्टैड द्वारा "बायेसियन स्टेटिस्टिक्स का परिचय" दूसरा संस्करण पढ़ना शुरू किया। मेरे पास एक परिचयात्मक आँकड़े वर्ग है जो मुख्य रूप से सांख्यिकीय परीक्षणों को कवर करता है और लगभग प्रतिगमन विश्लेषण में एक वर्ग के माध्यम से होता है। इस एक को समझने के लिए …

3
GLM में इंटरसेप्ट शब्द की व्याख्या कैसे करें?
मैं आर का उपयोग कर रहा हूं और मैं अपने डेटा का जीएलएम के साथ द्विपद लिंक के साथ विश्लेषण कर रहा हूं। मैं जानना चाहता हूं कि आउटपुट टेबल में इंटरसेप्ट का मतलब क्या है। मेरे एक मॉडल के लिए अवरोधन काफी अलग है, हालांकि चर नहीं है। इसका …

2
जब आप एक ही मूल्य के वजन को इनिशियलाइज़ करते हैं तो बैकप्रॉपैगैशन काम क्यों नहीं करता है?
जब आप सभी वजन को एक ही मूल्य (0.5) कहते हैं, तो बैकप्रॉपैगैशन काम क्यों नहीं करता है, लेकिन यादृच्छिक संख्याओं को देखते हुए ठीक काम करता है? क्या एल्गोरिथ्म को त्रुटि की गणना नहीं करनी चाहिए और वहां से काम करना चाहिए, इस तथ्य के बावजूद कि वजन शुरू …

2
जब मैं अपने प्रतिगमन में एक चुकता चर शामिल करता हूं तो क्या होता है?
मैं अपने ओएलएस प्रतिगमन के साथ शुरू करता हूं: जहां D एक डमी चर है, अनुमान कम पी-मान के साथ शून्य से अलग हो जाते हैं। मैं तब एक रैमसे RESET टेस्ट को प्रीफ़ॉर्म करता हूं और पाता हूं कि मेरे पास समीकरण का कुछ मिसअस्पेक्शन है, इस प्रकार मैं …

2
संभावना वितरण को एक टिल्ड के साथ निरूपित क्यों किया जाता है?
संभावना वितरण को निर्दिष्ट करते समय टिल्ड का क्या अर्थ है? उदाहरण के लिए: जेड~ सामान्य ( 0 , 1 ) ।जेड~साधारण(0,1)।Z \sim \mbox{Normal}(0,1).

5
कम रैंक सन्निकटन से परेशान क्यों?
यदि आपके पास n पंक्तियों और m स्तंभों के साथ एक मैट्रिक्स है, तो आप दिए गए मैट्रिक्स के निम्न-रैंक सन्निकटन की गणना करने के लिए SVD या अन्य विधियों का उपयोग कर सकते हैं । हालाँकि, निम्न रैंक सन्निकटन में अभी भी n पंक्तियाँ और m कॉलम होंगे। मशीन …

4
सांख्यिकीय अंतर्ज्ञान / डेटा अर्थ
मैं दूसरे वर्ष का स्नातक छात्र हूं, मैथ की पढ़ाई कर रहा हूं, और मैं अपने एक प्रोफेसर से गणित की क्षमता और सांख्यिकीय क्षमता के बीच के अंतर के बारे में अच्छी बात कर रहा हूं। उनके द्वारा लाए गए प्रमुख अंतरों में से एक "डेटा सेंस" था, जिसे …

5
क्या कोई आर फ़ंक्शन है जो कोसाइन डिसिमिलरिटी मैट्रिक्स की गणना करेगा? [बन्द है]
बन्द है। यह सवाल ऑफ टॉपिक है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस प्रश्न को सुधारना चाहते हैं? प्रश्न को अपडेट करें ताकि यह क्रॉस मान्य के लिए विषय पर हो । पिछले साल बंद हुआ । मैं कॉशन दूरी के आधार पर पंक्ति क्लस्टरिंग …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.