सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

9
सांख्यिकी और बायोस्टैटिस्टिक्स के बीच अंतर क्या है?
यह मेरे साथ हुआ है, जबकि मैंने वर्षों में आँकड़ों और बायोस्टैटिस्टिक्स के बीच के अंतर के बारे में कुछ विचारों को एक साथ रखा है, मैंने कभी औपचारिक विवरण नहीं सुना है। इन दो विषयों (वर्तमान में) में क्या अंतर है? और यह भेद पहली जगह में क्यों शुरू …

6
आर: समूह द्वारा सहसंबंध की गणना
ताला लगा हुआ । यह सवाल और इसके जवाब बंद हैं क्योंकि यह सवाल ऑफ-टॉपिक है लेकिन इसका ऐतिहासिक महत्व है। यह वर्तमान में नए उत्तर या इंटरैक्शन स्वीकार नहीं कर रहा है। आर में, मेरे पास एक डेटा फ्रेम है जिसमें एक क्लास लेबल सी (एक कारक) और दो …
17 r  correlation 

1
दोहराया उपायों के लिए असंतुलित मिश्रित प्रभाव एनोवा
मेरे पास सर्जरी के दौरान 2 अलग-अलग तरह के उपचारों से रोगियों का डेटा है। मुझे हृदय गति पर इसके प्रभाव का विश्लेषण करने की आवश्यकता है। हर 15 मिनट में हृदय गति माप ली जाती है। यह देखते हुए कि प्रत्येक रोगी के लिए सर्जरी की लंबाई अलग-अलग हो …

3
क्या आप कह सकते हैं कि सांख्यिकी और संभावना इंडक्शन और डिडक्शन की तरह है?
मैंने इस धागे के माध्यम से पढ़ा है , और यह मुझे ऐसा लगता है कि यह कहा जा सकता है: आँकड़े = प्रेरण? संभाव्यता = कटौती? लेकिन मैं सोच रहा हूं कि क्या तुलना में कुछ और विवरण हो सकते हैं जो मुझे याद आ रहे हैं। उदाहरण के …

2
यदि चर कर्नेल चौड़ाई अक्सर कर्नेल प्रतिगमन के लिए अच्छी होती है, तो वे आमतौर पर कर्नेल घनत्व के अनुमान के लिए अच्छे क्यों नहीं होते हैं?
यह प्रश्न अन्यत्र चर्चा से प्रेरित है । परिवर्तनीय गुठली का उपयोग अक्सर स्थानीय प्रतिगमन में किया जाता है। उदाहरण के लिए, लोस व्यापक रूप से उपयोग किया जाता है और एक प्रतिगमन चिकनी के रूप में अच्छी तरह से काम करता है, और चर चौड़ाई के कर्नेल पर आधारित …

4
दो आत्मविश्वास अंतराल / बिंदु अनुमानों का मेल
मान लीजिए कि एक ही आबादी से दो स्वतंत्र नमूने हैं, और दो नमूनों पर बिंदु अनुमान और विश्वास अंतराल प्राप्त करने के लिए विभिन्न तरीकों का उपयोग किया गया था। तुच्छ मामलों में एक समझदार व्यक्ति सिर्फ दो नमूनों को पूल करेगा और विश्लेषण करने के लिए एक विधि …

3
मतलाब और पायथन के बीच, सांख्यिकीय विश्लेषण के लिए कौन सी भाषा अच्छी है?
मतलाब और पायथन के बीच, सामान्य सांख्यिकीय डेटा विश्लेषण के लिए कौन सी भाषा अच्छी है? पेशेवरों और विपक्ष, पहुंच के अलावा, प्रत्येक के लिए क्या हैं?
17 matlab  python 

4
मतलब के लिए मजबूत टी-टेस्ट
मैं एक वैकल्पिक चर लिए, स्थानीय वैकल्पिक विपरीत n का परीक्षण करने का प्रयास कर रहा हूं , जो कि मध्यम से मध्यम तिरछा और यादृच्छिक चर के कर्टोसिस के अधीन है। विलकॉक्स द्वारा 'परिचय टू रोबस्ट एस्टिमेशन एंड हाइपोथिसिस टेस्टिंग' में दिए गए सुझावों के बाद, मैंने ट्रिम किए …

12
सांख्यिकीय डेटा विश्लेषण के लिए एक परिचय के लिए सर्वश्रेष्ठ पुस्तकें?
ताला लगा हुआ । यह सवाल और इसके जवाब बंद हैं क्योंकि यह सवाल ऑफ-टॉपिक है लेकिन इसका ऐतिहासिक महत्व है। यह वर्तमान में नए उत्तर या इंटरैक्शन स्वीकार नहीं कर रहा है। मैंने यह पुस्तक खरीदी: किसी भी चीज को कैसे मापें: व्यवसाय में अंतरंगियों के मूल्य का पता …

3
क्वेश्चन आइटम से बने प्रश्नावली का कारक विश्लेषण
मैं एक साइकोमेट्रिक दृष्टिकोण से वस्तुओं का विश्लेषण करता था। लेकिन अब मैं प्रेरणा और अन्य विषयों पर अन्य प्रकार के प्रश्नों का विश्लेषण करने की कोशिश कर रहा हूं। ये सवाल सभी लिकर्ट स्केल पर हैं। मेरा प्रारंभिक विचार कारक विश्लेषण का उपयोग करना था, क्योंकि प्रश्न कुछ अंतर्निहित …

5
बड़े डेटा के साथ पॉइसन रिग्रेशन: माप की इकाई को बदलना गलत है?
एक पोइसन डिस्ट्रीब्यूशन में फैक्टरियल के कारण, अवलोकन बड़े होने पर पॉइसन मॉडल (उदाहरण के लिए, अधिकतम संभावना का उपयोग करके) का अनुमान लगाना अव्यावहारिक हो जाता है। उदाहरण के लिए, यदि मैं किसी मॉडल को दिए गए वर्ष में आत्महत्याओं की संख्या समझाने के लिए अनुमान लगाने की कोशिश …

7
लिनक्स के तहत प्रकाशन-गुणवत्ता वाले भूखंड बनाने का सबसे आसान तरीका क्या है?
हम मान सकते हैं कि हमारे पास CSV फ़ाइल है और हम एक प्लॉट और एक साधारण किंवदंती पर कई लाइनों के साथ एक बहुत ही मूल लाइन प्लॉट चाहते हैं।

2
क्या समय श्रृंखला पूर्वानुमान को स्वचालित करना संभव है?
मैं एक एल्गोरिथ्म का निर्माण करना चाहूंगा जो किसी भी समय श्रृंखला का विश्लेषण करने में सक्षम हो और "स्वचालित रूप से" विश्लेषण किए गए समय श्रृंखला डेटा के लिए सबसे अच्छा पारंपरिक / सांख्यिकीय पूर्वानुमान विधि (और इसके मापदंडों) का चयन करें। क्या ऐसा कुछ करना संभव होगा? यदि …

2
यदि एक ऑटो-रिग्रेसिव टाइम सीरीज़ मॉडल गैर-रैखिक है, तो क्या यह अभी भी स्थिरता की आवश्यकता है?
समय श्रृंखला पूर्वानुमान के लिए आवर्तक तंत्रिका नेटवर्क का उपयोग करने के बारे में सोचना। वे मूल रूप से ARMA और ARIMA मॉडल की तुलना में सामान्यीकृत गैर-रैखिक ऑटो-प्रतिगमन का एक प्रकार लागू करते हैं, जो रैखिक ऑटो-प्रतिगमन का उपयोग करते हैं। यदि हम नॉन-लीनियर ऑटो-रिग्रेशन का प्रदर्शन कर रहे …

1
आउटर डिटेक्शन के लिए रोबस्ट पीसीए बनाम मजबूत महालनोबिस दूरी
मजबूत पीसीए (के रूप में द्वारा विकसित Candes एट अल 2009 या बेहतर अभी तक Netrepalli एट अल 2014 ) है मल्टीवेरिएट बाहरी पता लगाने के लिए एक लोकप्रिय तरीका है, लेकिन महालनोबिस दूरी भी एक दिया बाहरी पता लगाने के लिए इस्तेमाल किया जा सकता सहप्रसरण मैट्रिक्स के मजबूत, …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.