सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

3
मॉडल बनाने से पहले चर को अक्सर समायोजित किया जाता है (जैसे मानकीकृत) - यह एक अच्छा विचार कब है, और यह एक बुरा कब है?
मॉडल फिटिंग से पहले आप किन परिस्थितियों में एक चर को मापना या मानकीकृत नहीं करना चाहते हैं? और वैरिएबल स्केलिंग के क्या फायदे / नुकसान हैं?

6
डेटा में मौसमी का पता लगाने के लिए किस पद्धति का उपयोग किया जा सकता है?
मैं उन आंकड़ों में मौसमी का पता लगाना चाहता हूं जो मुझे प्राप्त हैं। कुछ विधियाँ हैं जो मुझे मौसमी सबज़रीज प्लॉट और ऑटोक्रेलेशन प्लॉट की तरह मिली हैं, लेकिन बात यह है कि मुझे समझ नहीं आ रहा है कि ग्राफ को कैसे पढ़ें, क्या कोई मदद कर सकता …

12
ग्राफ से डेटा को परिमार्जन करने के लिए आवश्यक सॉफ्टवेयर [बंद]
किसी को भी सॉफ़्टवेयर के साथ कोई भी अनुभव है (अधिमानतः मुक्त, अधिमानतः खुला स्रोत) जो कार्टेशियन निर्देशांक (एक मानक, रोजमर्रा की साजिश) पर प्लॉट किए गए डेटा की एक छवि लेगा और ग्राफ़ पर प्लॉट किए गए बिंदुओं के निर्देशांक को निकाल देगा? अनिवार्य रूप से, यह डेटा-माइनिंग समस्या …

8
परिकल्पना परीक्षण (जब आत्मविश्वास अंतराल उपलब्ध हो) का उपयोग सिखाना और जारी रखना क्यों जारी है?
क्यों उन समस्याओं के लिए परिकल्पना परीक्षण (अपनी सभी कठिन अवधारणाओं के साथ और जो सबसे अधिक सांख्यिकीय पापों में से हैं) का उपयोग करना जारी रखते हैं, जहां एक अंतराल आकलनकर्ता (आत्मविश्वास, बूटस्ट्रैप, विश्वसनीयता या जो भी हो) है? छात्रों को दी जाने वाली सबसे अच्छी व्याख्या (यदि कोई …

2
आंशिक संभावना, प्रोफाइल संभावना और सीमांत संभावना के बीच अंतर क्या है?
मैं देख रहा हूं कि ये शब्द इस्तेमाल किए जा रहे हैं और मैं उन्हें मिलाता रहता हूं। क्या उनके बीच मतभेदों की एक सरल व्याख्या है?

4
यादृच्छिक चर के एक सेट का न्यूनतम वितरण कैसे किया जाता है?
यदि स्वतंत्र रूप से जाने वाले यादृच्छिक चर हैं, तो सामान्य रूप से के वितरण के बारे में क्या कहा जा सकता है ?X1,...,XnX1,...,XnX_1, ..., X_nmin(X1,...,Xn)min(X1,...,Xn)\min(X_1, ..., X_n)

13
पिछले 15 वर्षों के आंकड़ों में क्या सफलता है?
मुझे अब भी फ्रीडमैन-हस्ती-तिब्शीरानी द्वारा बूस्टिंग पर सांख्यिकी के पेपर और अन्य लेखकों द्वारा उसी मुद्दों पर टिप्पणियों (फ्रंड और शापायर सहित) को याद किया जाता है। उस समय, स्पष्ट रूप से बूस्टिंग को कई मामलों में एक सफलता के रूप में देखा गया था: कम्प्यूटेशनल रूप से व्यवहार्य, एक …

6
टी-परीक्षणों (युग्मित और गैर-युग्मित) के बजाय आर में कौन से क्रमपरिवर्तन परीक्षण कार्यान्वयन।
मेरे पास एक प्रयोग से डेटा है जिसे मैंने टी-परीक्षणों का उपयोग करके विश्लेषण किया था। आश्रित चर अंतराल स्केल है और डेटा या तो अनपेयर्ड (यानी, 2 समूह) या बनते हैं (यानी, भीतर-विषयों)। जैसे (विषयों के भीतर): x1 <- c(99, 99.5, 65, 100, 99, 99.5, 99, 99.5, 99.5, 57, …

5
अर्थमिति में "यादृच्छिक प्रभाव मॉडल" वास्तव में अर्थमिति के बाहर मिश्रित मॉडल से कैसे संबंधित है?
मुझे लगता है कि अर्थमिति में "यादृच्छिक प्रभाव मॉडल" अर्थमिति के बाहर "यादृच्छिक अवरोधन के साथ मिश्रित मॉडल" से मेल खाता है, लेकिन अब मुझे यकीन नहीं है। क्या यह? इकोनोमेट्रिक्स मिश्रित मॉडल पर साहित्य से कुछ हद तक "निश्चित प्रभाव" और "यादृच्छिक प्रभाव" जैसे शब्दों का उपयोग करता है, …

8
विशिष्ट अर्थ और मानक विचलन के रूप में विशिष्ट बाधाओं को संतुष्ट करने वाले डेटा का अनुकरण कैसे करें?
यह प्रश्न मेटा-विश्लेषण पर मेरे प्रश्न से प्रेरित है । लेकिन मुझे लगता है कि यह उन संदर्भों को पढ़ाने में भी उपयोगी होगा जहां आप एक डेटासेट बनाना चाहते हैं जो मौजूदा प्रकाशित डेटासेट को ठीक तरह से दर्पण करता है। मुझे पता है कि किसी वितरण से यादृच्छिक …

2
चर चयन की एक अधिक निश्चित चर्चा
पृष्ठभूमि मैं दवा में नैदानिक ​​अनुसंधान कर रहा हूं और कई सांख्यिकी पाठ्यक्रम ले चुका हूं। मैंने लीनियर / लॉजिस्टिक रिग्रेशन का उपयोग करते हुए कभी कोई पेपर प्रकाशित नहीं किया है और वह चर चयन को सही तरीके से करना चाहता है। व्याख्या करना महत्वपूर्ण है, इसलिए कोई फैंसी …

10
आंकड़ों में एनाक्रोनोस्टिक प्रथाओं के कुछ उदाहरण क्या हैं?
मैं उन प्रथाओं का उल्लेख कर रहा हूं जो अभी भी अपनी उपस्थिति बनाए रखते हैं, भले ही समस्याओं (आमतौर पर कम्प्यूटेशनल) के साथ सामना करने के लिए डिज़ाइन किए गए थे ज्यादातर हल हो गए हैं। उदाहरण के लिए, येट्स 'निरंतरता सुधार के साथ फिशर सटीक परीक्षण अनुमान लगाने …

2
सिकुड़न क्यों काम करती है?
मॉडल चयन की समस्याओं को हल करने के लिए, कई तरीके (LASSO, रिज रिग्रेशन, आदि) भविष्यवाणियों के गुणांक को शून्य की ओर कम कर देंगे। मैं एक सहज व्याख्या की तलाश कर रहा हूं कि यह भविष्य कहनेवाला क्षमता में सुधार क्यों करता है। यदि चर का वास्तविक प्रभाव वास्तव …

1
लॉजिस्टिक रिग्रेशन के लिए वाल्ड टेस्ट
जहां तक ​​मैं समझता हूं कि लॉजिस्टिक रिग्रेशन के संदर्भ में वाल्ड टेस्ट का उपयोग यह निर्धारित करने के लिए किया जाता है कि एक निश्चित भविष्यवक्ता चर महत्वपूर्ण है या नहीं। यह संबंधित गुणांक शून्य होने की अशक्त परिकल्पना को खारिज करता है।XXX परीक्षण मानक त्रुटि द्वारा गुणांक का …

10
फ़्रीक्वेंटर्स कौन हैं?
हमारे पास पहले से ही एक धागा था जो पूछ रहा था कि कौन बायेसियन हैं और एक पूछ रहा है कि फ्रीक्वेंसी बायेसियन हैं , लेकिन कोई धागा नहीं था जो सीधे पूछ रहा था कि फ्रीक्वेंसियन कौन हैं ? यह एक प्रश्न है जो @whuber द्वारा इस थ्रेड …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.