सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

6
यदि then सहसंबंध कार्य के लिए अभिप्रेत नहीं है ’, तो यदि मुझे सांख्यिकीय रूप से महत्वपूर्ण सहसंबंध मिलता है, तो मैं कार्य-कारण कैसे साबित कर सकता हूं?
मैं समझता हूं कि सहसंबंध कार्य-कारण नहीं है । मान लीजिए हमें दो चर के बीच उच्च सहसंबंध मिलता है। यदि आप इस सहसंबंध को वास्तव में कार्य-कारण के कारण जांचते हैं तो आप कैसे देखते हैं? या, किन परिस्थितियों में, वास्तव में, क्या हम दो या अधिक चर के …

2
बिमोडल वितरण के लिए परीक्षण
मुझे आश्चर्य होता है कि क्या एक बायोमॉडल वितरण के महत्व को "परीक्षण" करने के लिए कोई सांख्यिकीय परीक्षण है। मेरा मतलब है, मेरा डेटा बिमोडल वितरण से कितना मिलता है या नहीं? यदि हां, तो क्या आर कार्यक्रम में कोई परीक्षण है?

1
जब द्विपद वितरण कार्य इसके ऊपर / नीचे Poisson वितरण समारोह को सीमित करता है?
चलो को निरूपित मानकों के साथ द्विपद बंटन समारोह (DF) और पर मूल्यांकन किया जाता : और F (\ nu, r) पोइसन DF को पैरामीटर के साथ a \ mathbb R ^ + में r \ _ 0,1,2 में मूल्यांकन किया गया , \ ldots \} : \ start {समीकरण} …

2
lme और lmer तुलना
मैं सोच रहा था कि क्या कोई मुझे इन दो कार्यों के बीच मौजूदा मतभेदों के बारे में बता सकता है। मुझे निम्नलिखित प्रश्न मिला: मिश्रित प्रभाव वाले मॉडल के लिए nlme या lme4 R लाइब्रेरी का चयन कैसे करें? , लेकिन कुछ साल पहले की तारीखों से। सॉफ्टवेयर सर्किल …

5
डेटा "अन्वेषण" बनाम डेटा "स्नूपिंग" / "यातना"?
कई बार मैं "डेटा स्नूपिंग" (यहां एक मनोरंजक उदाहरण ) के खिलाफ अनौपचारिक चेतावनी भर आया हूं , और मुझे लगता है कि मेरे पास मोटे तौर पर एक सहज विचार है कि इसका क्या मतलब है, और यह समस्या क्यों हो सकती है। दूसरी ओर, "खोजपूर्ण डेटा विश्लेषण" आंकड़ों …

2
नकारात्मक द्विपद प्रतिगमन की धारणाएं क्या हैं?
मैं एक बड़े डेटा सेट के साथ काम कर रहा हूं (गोपनीय, इसलिए मैं बहुत अधिक साझा नहीं कर सकता), और निष्कर्ष पर आया कि एक नकारात्मक द्विपद प्रतिगमन आवश्यक होगा। मैंने पहले कभी glm रिग्रेशन नहीं किया है, और मुझे इस बारे में कोई स्पष्ट जानकारी नहीं मिल सकती …

8
डेटा खनन और मशीन सीखने के लिए आप कौन से गणित विषय सुझाएंगे?
मैं डेटा माइनिंग और मशीन लर्निंग सीखने की तैयारी के लिए एक स्व-निर्देशित गणित पाठ्यक्रम को एक साथ रखने की कोशिश कर रहा हूं। यह कोर्टेरा पर एंड्रयू एनजी की मशीन सीखने की कक्षा शुरू करने और महसूस करने से प्रेरित है कि आगे बढ़ने से पहले मुझे अपने गणित …

4
पीसीए के साथ आर में आयामी कमी कैसे करें
मेरे पास एक बड़ा डेटासेट है और मैं एक आयामी कमी करना चाहता हूं। अब हर जगह मैंने पढ़ा है कि मैं इसके लिए पीसीए का उपयोग कर सकता हूं। हालाँकि, मुझे अभी भी पीसीए की गणना / प्रदर्शन करने के बाद क्या करना है, यह प्रतीत नहीं होता है। …
30 r  pca 

4
तार सीखने की मशीन सीखने की तकनीक?
मेरे पास बहुत सारे पते हैं: 1600 Pennsylvania Ave, Washington, DC 20500 USA मैं उन्हें अपने घटकों में पार्स करना चाहता हूं: street: 1600 Pennsylvania Ave city: Washington province: DC postcode: 20500 country: USA लेकिन निश्चित रूप से डेटा गंदा है: यह कई देशों से कई भाषाओं में आता है, …

3
कैसे दृढ़ता से संभावना को परिभाषित करने के लिए?
उदाहरण के लिए, संभावना को कई तरीकों से परिभाषित किया जा सकता है: फ़ंक्शन से जो मैप्स से यानी ।LLLΘ×XΘ×X\Theta\times{\cal X}(θ,x)(θ,x)(\theta,x)L(θ∣x)L(θ∣x)L(\theta \mid x)L:Θ×X→RL:Θ×X→RL:\Theta\times{\cal X} \rightarrow \mathbb{R} यादृच्छिक समारोहL(⋅∣X)L(⋅∣X)L(\cdot \mid X) हम यह भी विचार कर सकते हैं कि संभावना केवल "मनाया गया" संभावनाL(⋅∣xobs)L(⋅∣xobs)L(\cdot \mid x^{\text{obs}}) व्यवहार में, संभावना केवल एक …

3
सहकर्मी की समीक्षा के लिए ओपन-सोर्स जर्नल की सिफारिश?
मेरे पास एक मतलब की परिकल्पना के परीक्षण के लिए एक बूटस्ट्रैप विधि पर एक पांडुलिपि है, और मैं इसे प्रकाशन के लिए भेजना चाहूंगा, लेकिन मुझे एक नैतिक दुविधा है। मैंने उनके अनैतिक व्यावसायिक व्यवहारों के लिए एल्सेवियर के विरोध पर हस्ताक्षर किए हैं, और पूरे मामले को पढ़ने …

5
नमूना वितरण सिखाने के लिए रणनीतियाँ
Tl; डॉ। संस्करण आप एक प्रारंभिक स्नातक स्तर पर नमूना वितरण (उदाहरण के लिए, नमूना उदाहरण के लिए) को पढ़ाने के लिए कौन सी सफल रणनीति अपनाते हैं? पृष्ठ - भूमि सितंबर में मैं डेविड मूर द्वारा द बेसिक प्रैक्टिस ऑफ़ स्टैटिस्टिक्स का उपयोग करते हुए द्वितीय वर्ष के सामाजिक …

3
एक मल्टीस्कूलर क्लासिफायर की गुणवत्ता का निर्धारण कैसे करें
दिया हुआ उदाहरणों के साथ एक डाटासेट xixix_i एक साथ के साथ कक्षाएं जहां हर उदाहरण वास्तव में करने के लिए एक वर्ग के अंतर्गत आता हैNNNxixix_iyiyiy_i एक बहुस्तरीय क्लासिफायरियर प्रशिक्षण और परीक्षण के बाद मैं मूल रूप से के साथ एक मेज है सच वर्ग और भविष्यवाणी की वर्ग …

3
कैसे पता चलेगा कि एक समय श्रृंखला स्थिर या गैर-स्थिर है?
मैं आर उपयोग कर रहा हूँ, मैं गूगल पर खोज की है और सीखा है कि kpss.test(), PP.test(), और adf.test()समय श्रृंखला का stationarity के बारे में पता करने के लिए उपयोग किया जाता है। लेकिन मैं कोई सांख्यिकीविद् नहीं हूं, जो उनके परिणामों की व्याख्या कर सकता हूं > PP.test(x) …

3
स्कैल्पलेट बनाने के लिए आर का उपयोग करने का एक अच्छा तरीका क्या है जो उपचार द्वारा डेटा को अलग करता है?
मैं सामान्य रूप से आर और सांख्यिकी के साथ बहुत नया हूं, लेकिन मुझे एक स्कैप्लेट बनाने की जरूरत है जो मुझे लगता है कि इसकी मूल क्षमताओं से परे हो सकती है। मेरे पास टिप्पणियों के वैक्टर के एक जोड़े हैं और मैं उनके साथ एक स्कैप्लेट बनाना चाहता …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.