सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
महत्व परीक्षण या क्रॉस सत्यापन?
सहसंबद्ध चर का चयन करने के लिए दो सामान्य दृष्टिकोण महत्व परीक्षण और क्रॉस सत्यापन हैं। प्रत्येक समस्या को क्या हल करने की कोशिश करता है और मैं एक दूसरे पर कब पसंद करूंगा?

4
"बड़े पी, छोटे एन" परिणामों का सारांश
क्या कोई मुझे "बड़े , छोटे एन " परिणामों पर एक सर्वेक्षण पत्र की ओर इशारा कर सकता है ? मुझे इस बात में दिलचस्पी है कि यह समस्या अलग-अलग शोध संदर्भों, जैसे प्रतिगमन, वर्गीकरण, हॉटेलिंग के परीक्षण, आदि में कैसे प्रकट होती है ।पीपीpnnn

3
वर्णक्रमीय घनत्व में चोटियों का परीक्षण महत्व
हम समय श्रृंखला में आवधिकता का विश्लेषण करने के लिए कभी-कभी वर्णक्रमीय घनत्व प्लॉट का उपयोग करते हैं। आम तौर पर हम दृश्य निरीक्षण द्वारा साजिश का विश्लेषण करते हैं और फिर आवधिकता के बारे में निष्कर्ष निकालने की कोशिश करते हैं। लेकिन क्या सांख्यिकीविदों ने यह जांचने के लिए …

2
क्षणों का उपयोग करके पूर्णांकों की एक धारा के लिए अनुमानित मात्राओं की गणना करें?
math.stackexchange से माइग्रेट किया गया । मैं पूर्णांकों की एक लंबी धारा को संसाधित कर रहा हूं और कुछ क्षणों को ट्रैक करने पर विचार कर रहा हूं ताकि बहुत अधिक डेटा संग्रहीत किए बिना धारा के लिए लगभग विभिन्न प्रतिशत की गणना करने में सक्षम हो। कुछ ही क्षणों …

2
मनोविज्ञान में अवलोकन अध्ययन का विश्लेषण करने के लिए संरचनात्मक समीकरण मॉडलिंग का उपयोग करना है या नहीं
मैंने देखा है कि यह मुद्दा सांख्यिकीय परामर्श सेटिंग्स में बहुत ऊपर आ रहा है और मैं आपके विचारों को पाने के लिए उत्सुक था। प्रसंग मैं अक्सर उन शोध छात्रों से बात करता हूं, जिन्होंने लगभग एक अध्ययन किया है: अवलोकन अध्ययन नमूना का आकार 100, 200, 300, आदि …

2
ट्रांसफॉर्मिंग अनुपात डेटा: जब आर्किसिन स्क्वायर रूट पर्याप्त नहीं है
प्रतिशत / अनुपात डेटा के लिए आर्किसिन स्क्वायर रूट परिवर्तन के लिए एक (मजबूत?) विकल्प है? वर्तमान में मैं जिस डेटा सेट पर काम कर रहा हूं, इस परिवर्तन को लागू करने के बाद, चिह्नित विषमता बनी हुई है, यानी अवशेषों बनाम सज्जित मूल्यों का कथानक अभी भी बहुत ही …

2
मौसमी अपघटन विधि का चयन
मौसमी समायोजन एक महत्वपूर्ण कदम है जो आगे के अनुसंधान के लिए डेटा को पूर्वनिर्मित करता है। हालांकि शोधकर्ता के पास ट्रेंड-साइकल-मौसमी अपघटन के लिए कई विकल्प हैं। सबसे आम (अनुभवजन्य साहित्य में उद्धरणों की संख्या को देखते हुए) प्रतिद्वंद्वी मौसमी अपघटन विधियां एक्स -11 (12) -एरिमा, ट्रामो / सीट्स …

2
StackExchange प्रश्नों के लिए "दिलचस्पता" फ़ंक्शन
मैं StackExchange साइटों के लिए डेटा-माइनिंग पैकेज को एक साथ रखने की कोशिश कर रहा हूं और विशेष रूप से, मैं "सबसे दिलचस्प" प्रश्नों को निर्धारित करने की कोशिश में फंस गया हूं। मैं प्रश्न स्कोर का उपयोग करना चाहूंगा, लेकिन विचारों की संख्या के कारण पूर्वाग्रह को हटा सकता …

3
आर में एक बहुराष्ट्रीय लॉगिट मॉडल कैसे सेट और अनुमान लगाया जाए?
मैंने JMP में एक बहुराष्ट्रीय लॉगिट मॉडल चलाया और वापस परिणाम प्राप्त किए जिसमें एआईसी के साथ-साथ प्रत्येक पैरामीटर अनुमान के लिए ची-स्क्वेर्ड पी-वैल्यू शामिल थे। मॉडल में एक श्रेणीगत परिणाम और 7 श्रेणीबद्ध व्याख्यात्मक संस्करण हैं। मैं तो फिट मैं क्या सोचा आर में एक ही मॉडल का निर्माण …
20 r  logistic  multinomial  logit  jmp 

6
सरल रेखीय प्रतिगमन आउटपुट व्याख्या
यदि वे सहसंबंधी हैं, तो यह निर्धारित करने के लिए मैंने 2 चर के प्राकृतिक लॉग का एक सरल रैखिक प्रतिगमन चलाया है। मेरा आउटपुट यह है: R^2 = 0.0893 slope = 0.851 p < 0.001 मैं उलझन में हूं। मान को देखते हुए , मैं कहूंगा कि दो चर …

10
शून्य परिकल्पना कौन सी है? विज्ञान सिद्धांत, तर्क और सांख्यिकी के बीच संघर्ष?
अशक्त परिकल्पना को स्थापित करने में अंतर्निहित तर्क को समझने में मुझे कठिनाई हो रही है । इस उत्तर में स्पष्ट रूप से स्वीकार किए गए प्रस्ताव में कहा गया है कि अशक्त परिकल्पना इस परिकल्पना है कि कोई प्रभाव नहीं होगा, सब कुछ एक जैसा रहता है, अर्थात सूर्य …

2
एक पदानुक्रमित मॉडल में फिशर जानकारी
निम्नलिखित श्रेणीबद्ध मॉडल, यह देखते हुए और, μ ~ एल एक पी एल एक सी ई ( 0 , ग ) जहां एन ( ⋅ , ⋅ ) एक सामान्य वितरण है। वहाँ एक रास्ता के सीमांत वितरण के फिशर जानकारी के लिए एक सटीक अभिव्यक्ति पाने के लिए है …

2
स्प्लिन्स, स्मूद स्प्लिन और गॉसियन प्रोसेस एमुलेटर का उपयोग करने के क्या फायदे / नुकसान हैं?
मुझे बहुपद प्रक्षेप के विकल्प के रूप में सीखने (और कार्यान्वित करने) में दिलचस्पी है। हालाँकि, मुझे यह वर्णन करने में समस्या हो रही है कि ये तरीके कैसे काम करते हैं, कैसे संबंधित हैं, और वे कैसे तुलना करते हैं। मैं पेशेवरों / विपक्ष / शर्तों पर आपके इनपुट …

1
NYTimes में सांख्यिकीय पद्धति के दुरुपयोग के बारे में लेख
मैं इस लेख का जिक्र कर रहा हूं: http://www.nytimes.com/2011/01/11/science/11esp.html निम्नलिखित प्रयोग पर विचार करें। मान लीजिए कि विश्वास करने का कारण था कि एक सिक्का सिर की ओर थोड़ा भारित था। एक परीक्षण में, सिक्का 1,000 में से 527 बार सिर के ऊपर आता है। क्या यह महत्वपूर्ण सबूत है …

4
सहसंबंधी मूल्यों का लाभ उठाना
मान लें कि मैं परीक्षण Yकरता हूं कि चर Xविभिन्न प्रयोगात्मक परिस्थितियों में चर पर कैसे निर्भर करता है और निम्नलिखित ग्राफ प्राप्त करता है: ऊपर दिए गए ग्राफ़ में डैश लाइनें प्रत्येक डेटा श्रृंखला (प्रयोगात्मक सेटअप) के लिए रेखीय प्रतिगमन का प्रतिनिधित्व करती हैं और किंवदंती में संख्या प्रत्येक …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.