सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

4
सांख्यिकी सहयोग
एक जीवविज्ञानी के रूप में, कुछ बिंदुओं पर काम करने वाले कई शोध प्रोजेक्ट में मैं एक सांख्यिकीविद् के साथ सहयोग करता हूं, चाहे वह सरल सलाह के लिए हो या मेरे डेटा के लिए एक मॉडल को लागू करने और परीक्षण करने के लिए हो। मेरे सांख्यिकी सहयोगी मानते …
25 academia 

2
आर में संभावना अनुपात परीक्षण
मान लीजिए, मैं इस तरह के कई स्वतंत्र चर पर एक संयुक्त लॉजिस्टिक प्रतिगमन करने जा रहा हूं: mod.a <- glm(x ~ a, data=z, family=binominal("logistic")) mod.b <- glm(x ~ b, data=z, family=binominal("logistic")) मैंने यह देखने के लिए एक मॉडल तुलना (संभावना अनुपात परीक्षण) किया कि क्या मॉडल इस कमांड द्वारा …
25 r  logistic  diagnostic 

2
बहु-प्रश्न परीक्षा में धोखा देने के पैटर्न का पता लगाना
सवाल: मेरे पास परीक्षा के सवालों (सही / गलत) पर बाइनरी डेटा है। कुछ व्यक्तियों के पास प्रश्नों और उनके सही उत्तरों के सबसे पहले उपयोग हो सकता है। मैं नहीं जानता कि कौन, कितने या कौन से हैं। अगर कोई धोखा थे, लगता है मुझे आइटम के लिए एक …

8
अनुमान कैसे करें कि एक घटना में कितने लोग शामिल हुए (जैसे, एक राजनीतिक रैली)?
एक छात्र ने आज मुझसे पूछा, "वे कैसे जानते हैं कि कितने लोग एक बड़े समूह के कार्यक्रम में भाग लेते हैं, उदाहरण के लिए, वाशिंगटन डीसी में स्टीवर्ट / कोलबर्ट 'रैली टू रिस्टोर टू सनिटी'?" न्यूज़ आउटलेट्स दसियों हज़ारों में अनुमान लगाते हैं, लेकिन उन अनुमानों को प्राप्त करने …

2
आंतरिक या अंतराल डेटा के लिए अंतर-रेटर विश्वसनीयता
ऑर्डिनल या इंटरवल डेटा के लिए कौन-से इंटर-रेटर विश्वसनीयता के तरीके सबसे उपयुक्त हैं? मेरा मानना ​​है कि "समझौते की संयुक्त संभावना" या "कप्पा" नाममात्र डेटा के लिए डिज़ाइन किए गए हैं। जब भी "पीयरसन" और "स्पीयरमैन" का उपयोग किया जा सकता है, वे मुख्य रूप से दो चूहे के …

3
हिंग की हानि का क्रम
मैं मूल ढाल वंश को लागू करने की कोशिश कर रहा हूं और मैं इसे एक काज हानि समारोह के साथ परीक्षण कर रहा हूं अर्थात एलकाज= अधिकतम ( 0 , 1 - y x ⋅ w )एलकाज=अधिकतम(0,1-y एक्स⋅w)l_{\text{hinge}} = \max(0,1-y\ \boldsymbol{x}\cdot\boldsymbol{w}) । हालांकि, मैं काज हानि के ढाल के …

4
अमीबा का साक्षात्कार प्रश्न
एक मालिकाना ट्रेडिंग फर्म के साथ एक व्यापारिक स्थिति के लिए एक साक्षात्कार के दौरान मुझसे यह सवाल पूछा गया था। मैं इस प्रश्न का उत्तर और इसके पीछे के अंतर्ज्ञान को जानना चाहूंगा। अमीबा प्रश्न: अमीबाओं की जनसंख्या 1 से शुरू होती है। 1 अवधि के बाद अमीबा 1, …

2
छोटे-नमूनों के अध्ययन में खोजपूर्ण डेटा विश्लेषण और डेटा ड्रेजिंग का सामना कैसे करें?
खोजपूर्ण डेटा विश्लेषण (EDA) अक्सर अन्य "ट्रैक्स" का पता लगाने की ओर जाता है जो जरूरी नहीं कि परिकल्पना के प्रारंभिक सेट से संबंधित हैं। मैं एक सीमित नमूना आकार और विभिन्न प्रश्नावली (सामाजिक-जनसांख्यिकी डेटा, न्यूरोसाइकोलॉजिकल या चिकित्सा तराजू के माध्यम से एकत्र किए गए डेटा के साथ अध्ययन के …

7
एक संभावना और एक अनुपात के बीच अंतर क्या है?
कहते हैं कि मैंने सालों से हर मंगलवार को हैम्बर्गर खाया है। आप कह सकते हैं कि मैं हैम्बर्गर 14% समय खाता हूं, या यह कि मेरे द्वारा दिए गए सप्ताह में एक हैमबर्गर खाने की संभावना 14% है। संभाव्यता और अनुपात के बीच मुख्य अंतर क्या हैं? क्या संभाव्यता …

3
विज़ुअलाइज़िंग लिकर आइटम रिस्पॉन्स डेटा
लिकर्ट प्रतिक्रियाओं के सेट की कल्पना करने के अच्छे तरीके क्या हैं? उदाहरण के लिए, ए, बी, सी, डी, ई, एफ एंड जी के बारे में किसी के फैसले के लिए एक्स के महत्व के बारे में पूछताछ करने वाली वस्तुओं का एक सेट? क्या स्टैक्ड बार चार्ट की तुलना …

3
समय-श्रृंखला-आधारित विसंगति का पता लगाने वाले एल्गोरिदम के लिए तरंगिकाओं का अनुप्रयोग
मैं एंड्रयू मूर द्वारा सांख्यिकीय डेटा माइनिंग ट्यूटोरियल के माध्यम से अपना काम करना शुरू कर रहा हूं (इस क्षेत्र में पहले किसी और के लिए अनुशंसित)। मैंने इस बेहद दिलचस्प पीडीएफ को "टाइम-सीरीज़-आधारित-विसंगति का पता लगाने वाले एल्गोरिदम का परिचयात्मक अवलोकन" पढ़कर शुरू किया , जिसमें बीमारी के प्रकोप …

5
ARIMA स्पष्टीकरण के कुछ प्रकार की तलाश
यह पता लगाने के लिए मुश्किल हो सकता है, लेकिन मैं पढ़ना चाहते हैं एक अच्छी तरह से समझाया ARIMA उदाहरण है कि न्यूनतम गणित का उपयोग करता है विशिष्ट मामलों का पूर्वानुमान करने के लिए उस मॉडल का उपयोग करके एक मॉडल बनाने से परे चर्चा का विस्तार करता …

3
कोलमोगोरोव-स्मिर्नोव परीक्षण क्यों काम करता है?
2-नमूना केएस परीक्षण के बारे में पढ़ने में, मुझे ठीक-ठीक समझ में आ रहा है कि यह क्या कर रहा है, लेकिन मुझे समझ नहीं आ रहा है कि यह क्यों काम करता है । दूसरे शब्दों में, मैं अनुभवजन्य वितरण कार्यों की गणना करने के लिए सभी चरणों का …

2
मैंने सुना है कि यादृच्छिक चर के अनुपात या व्युत्क्रम अक्सर समस्याग्रस्त होते हैं, अपेक्षाएं नहीं होती हैं। ऐसा क्यों है?
शीर्षक सवाल है। मुझे बताया गया है कि अनुपात और यादृच्छिक चर के व्युत्क्रम अक्सर समस्याग्रस्त होते हैं। क्या मतलब है कि उम्मीद अक्सर मौजूद नहीं है। क्या इसका एक सरल, सामान्य अन्वेषण है?

3
बातचीत की शर्तों के साथ LASSO - क्या मुख्य प्रभाव शून्य तक सिकुड़ गए हैं तो यह ठीक है?
LASSO प्रतिगमन शून्य की ओर गुणांक सिकुड़ता है, इस प्रकार प्रभावी रूप से मॉडल चयन प्रदान करता है। मेरा मानना ​​है कि मेरे डेटा में नाममात्र और निरंतर कोवरिएट्स के बीच सार्थक बातचीत हैं। हालांकि, जरूरी नहीं कि वे सच्चे मॉडल के 'मुख्य प्रभाव' सार्थक (गैर-शून्य) हों। निश्चित रूप से …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.