सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
बाइनरी परिणामों के लिए सापेक्ष जोखिम का अनुमान लगाने के लिए पॉइसन प्रतिगमन
संक्षिप्त सारांश पॉइज़न रिग्रेशन (सापेक्ष जोखिमों के साथ) के विपरीत बाइनरी परिणामों के साथ लॉजिस्टिक रिग्रेशन (ऑड्स रेशियो के साथ) का उपयोग करना अधिक आम क्यों है? पृष्ठभूमि स्नातक और स्नातक सांख्यिकी और महामारी विज्ञान पाठ्यक्रम, मेरे अनुभव में, आम तौर पर सिखाते हैं कि द्विआधारी परिणामों के साथ मॉडलिंग …

2
बर्नौली नमूने के लिए आत्मविश्वास अंतराल
मेरे पास बर्नौली यादृच्छिक चर का एक यादृच्छिक नमूना है , जहां iidrv और , और एक अज्ञात पैरामीटर है।X1...XNX1...XNX_1 ... X_NXiXiX_iP(Xi=1)=pP(Xi=1)=pP(X_i = 1) = pppp जाहिर है, कोई : लिए एक अनुमान लगा सकता है ।pppp^:=(X1+⋯+XN)/Np^:=(X1+⋯+XN)/N\hat{p}:=(X_1+\dots+X_N)/N मेरा सवाल यह है कि मैं लिए एक विश्वास अंतराल कैसे बना सकता …

5
लॉजिस्टिक रिग्रेशन गुणांक का क्या महत्व है?
मैं वर्तमान में 2000 और 2004 के चुनाव में मतदान के स्थान और मतदान की प्राथमिकता से संबंधित एक पेपर पढ़ रहा हूं । इसमें, एक चार्ट है जो लॉजिस्टिक रिग्रेशन गुणांक प्रदर्शित करता है। पाठ्यक्रम वर्षों से और थोड़ा पढ़ने में, मैं कई स्वतंत्र चर और एक द्विआधारी प्रतिक्रिया …

5
क्या मशीन सीखना कार्य-क्षमता को समझने के लिए कम उपयोगी है, इस प्रकार सामाजिक विज्ञान के लिए कम दिलचस्प है?
मशीन लर्निंग / अन्य सांख्यिकीय पूर्वानुमान तकनीकों के बीच अंतर की मेरी समझ बनाम सामाजिक वैज्ञानिकों (जैसे, अर्थशास्त्री) का उपयोग करने वाले आंकड़ों की तरह यह है कि अर्थशास्त्रियों को एक या कई चर के प्रभाव को समझने में बहुत रुचि लगती है - दोनों के संदर्भ में परिमाण और …

3
PCA का उद्देश्य क्या है?
प्रधान घटक विश्लेषण मैट्रिक्स अपघटन का उपयोग कर सकते हैं , लेकिन यह वहां पहुंचने के लिए सिर्फ एक उपकरण है। आप मैट्रिक्स बीजगणित के उपयोग के बिना प्रमुख घटक कैसे पाएंगे? उद्देश्य फ़ंक्शन (लक्ष्य) क्या है, और क्या बाधाएं हैं?
42 pca 

8
भारित सामाजिक नेटवर्क / ग्राफ में सामुदायिक पहचान कैसे करें?
मैं सोच रहा हूं कि क्या कोई सुझाव दे सकता है कि सामुदायिक शुरुआत / ग्राफ़ विभाजन / भारित , अप्रत्यक्ष किनारों वाले ग्राफ़ पर क्लस्टरिंग / क्लस्टरिंग का प्रदर्शन करने के लिए अच्छे शुरुआती बिंदु क्या हैं । प्रश्न में ग्राफ में लगभग 3 मिलियन किनारों हैं और प्रत्येक …

5
कैसे एक समय श्रृंखला स्थिर बनाने के लिए?
अंतर लेने के अलावा, एक गैर-स्थिर समय श्रृंखला, स्थिर बनाने के लिए अन्य तकनीकें क्या हैं? आमतौर पर एक श्रृंखला को " ऑर्डर पी के एकीकृत " के रूप में संदर्भित किया जाता है यदि इसे लैग ऑपरेटर माध्यम से स्थिर बनाया जा सकता है ।(1−L)PXt(1−L)PXt(1-L)^P X_t


8
मैं लोगों को डेटा की बेहतर देखभाल करने के लिए कैसे प्राप्त करूं?
मेरे कार्यस्थल में बहुत विस्तृत विषयों के कर्मचारी हैं, इसलिए हम विभिन्न रूपों में बहुत सारे डेटा उत्पन्न करते हैं। नतीजतन, प्रत्येक टीम ने डेटा भंडारण के लिए अपनी प्रणाली विकसित की है। कुछ एक्सेस या SQL डेटाबेस का उपयोग करते हैं; कुछ टीमें (मेरे आतंक के लिए) लगभग पूरी …

6
रेखीय प्रतिगमन में किस एल्गोरिथ्म का उपयोग किया जाता है?
मैं आमतौर पर "साधारण न्यूनतम वर्ग" के बारे में सुनता हूं। क्या रेखीय प्रतिगमन के लिए सबसे व्यापक रूप से उपयोग किया जाने वाला एल्गोरिदम है? क्या एक अलग का उपयोग करने के कारण हैं?

6
क्यों घटा?
मान लीजिए मैं एक क्लासिफायर सीखना चाहता हूं जो ईमेल स्पैम होने पर भविष्यवाणी करता है। और मान लीजिए कि केवल 1% ईमेल स्पैम हैं। सबसे आसान बात यह है कि तुच्छ क्लासिफायरियर सीखना होगा जो कहता है कि कोई भी ईमेल स्पैम नहीं है। यह क्लासिफायर हमें 99% सटीकता …

3
क्या दो बूलियन वैक्टर के बीच पियर्सन या स्पीयरमैन सहसंबंध की गणना करना सार्थक है?
दो बूलियन वैक्टर हैं, जिनमें 0 और 1 ही हैं। यदि मैं पियरसन या स्पीयरमैन सहसंबंध की गणना करता हूं, तो क्या वे सार्थक या उचित हैं?

2
एलएम में इंटरैक्शन शब्द लिखने के विभिन्न तरीके?
मेरे पास एक सवाल है जिसके बारे में एक प्रतिगमन मॉडल में बातचीत को निर्दिष्ट करने का सबसे अच्छा तरीका है। निम्नलिखित आंकड़ों पर विचार करें: d <- structure(list(r = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L), …

5
निरंतर और श्रेणीबद्ध (नाममात्र) चर के बीच संबंध
मैं एक सतत (निर्भर चर) और एक श्रेणीबद्ध (नाममात्र: लिंग, स्वतंत्र चर) चर के बीच सहसंबंध को खोजना चाहता हूं। निरंतर डेटा सामान्य रूप से वितरित नहीं किया जाता है। इससे पहले, मैंने स्पीयरमैन के का उपयोग करके इसकी गणना की थी । हालाँकि, मुझे बताया गया है कि यह …

5
SVM फीचर वेट की व्याख्या कैसे करता है?
मैं एक रैखिक एसवीएम फिटिंग द्वारा दिए गए चर भार की व्याख्या करने की कोशिश कर रहा हूं। (मैं scikit- सीख का उपयोग कर रहा हूँ ): from sklearn import svm svm = svm.SVC(kernel='linear') svm.fit(features, labels) svm.coef_ मुझे प्रलेखन में कुछ भी नहीं मिला, जो विशेष रूप से बताता है …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.