सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

3
टी-टेस्ट करने के लिए एक्सेल का उपयोग करके सामान्य वितरण की जांच कैसे करें?
मैं यह जानना चाहता हूं कि एक्सेल में सामान्यता के लिए सेट किए गए डेटा की जांच कैसे करें, बस यह सत्यापित करने के लिए कि टी-टेस्ट का उपयोग करने के लिए आवश्यकताओं को पूरा किया जा रहा है । सही पूंछ के लिए, क्या किसी माध्य और मानक विचलन …

5
क्या बायेसियन पोस्टीरियर को उचित वितरण की आवश्यकता है?
मुझे पता है कि पादरियों को उचित नहीं होना चाहिए और संभावना है कि फ़ंक्शन 1 पर भी एकीकृत नहीं होता है। लेकिन क्या पोस्टीरियर को उचित वितरण की आवश्यकता है? यदि यह / नहीं है तो इसके क्या निहितार्थ हैं?

6
पूर्व और संभावना से बहुत अलग है
यदि पूर्व और संभावना एक-दूसरे से बहुत अलग हैं, तो कभी-कभी ऐसी स्थिति होती है जहां पोस्टीरियर दोनों में से किसी के समान नहीं होता है। उदाहरण के लिए देखें यह चित्र, जो सामान्य वितरण का उपयोग करता है। यद्यपि यह गणितीय रूप से सही है, यह मेरे अंतर्ज्ञान के …

2
सामान्य रूप से वितरित डेटा के माध्य और विचरण का अनुमान लगाने के लिए कई अध्ययनों से जानकारी का संयोजन - बेसेसियन बनाम मेटा-एनालिटिक दृष्टिकोण
मैं कागजात का एक सेट की समीक्षा की है, प्रत्येक रिपोर्टिंग की माप की प्रेक्षित मतलब और एसडी में जाना जाता है आकार के अपने संबंधित नमूने में, एन । मैं एक नए अध्ययन में उसी माप के संभावित वितरण के बारे में सबसे अच्छा संभव अनुमान लगाना चाहता हूं …

2
गैर-वर्णनात्मक ची-वर्ग यादृच्छिक चर का योग
मुझे यादृच्छिक चर को खोजने की आवश्यकता है, जहां और सभी s स्वतंत्र हैं। मुझे पता है कि पहले s के लिए सभी क्षण उत्पन्न करने वाले कार्यों के उत्पाद को खोजना संभव है , और फिर के वितरण को प्राप्त करने के लिए वापस बदलना । हालांकि, मुझे आश्चर्य …

1
परिवर्तित करना (सामान्य करना) प्रायिकता के लिए बहुत कम संभावना मूल्यों को दर्शाता है
मैं एक एल्गोरिथ्म लिख रहा हूं, जहां एक मॉडल दिया गया है, मैं डेटासेट की एक सूची के लिए संभावना की गणना करता हूं और फिर संभावना में से हर एक को सामान्य (संभाव्यता) करने की आवश्यकता होती है। तो कुछ [0.00043, 0.00004, 0.00321] की तरह परिवर्तित हो सकता है …

3
पहले एक संयुग्म होना: गहरी संपत्ति या गणितीय दुर्घटना?
कुछ वितरणों में पुजारी होते हैं और कुछ नहीं। क्या यह भेद सिर्फ एक दुर्घटना है? यही है, आप गणित करते हैं, और यह एक या दूसरे तरीके से काम करता है, लेकिन यह वास्तव में आपको वितरण के बारे में कुछ भी नहीं बताता है केवल तथ्य को छोड़कर? …

6
वर्णनात्मक और विभेदक आंकड़ों के बीच अंतर क्या है?
मेरी समझ यह थी कि वर्णनात्मक आँकड़े मात्रात्मक रूप से एक डेटा सैंपल की विशेषताओं का वर्णन करते थे, जबकि हीन सांख्यिकी आँकड़ों के बारे में अनुमान लगाते थे जिनसे नमूने लिए गए थे। हालाँकि, सांख्यिकीय अनुमान के लिए विकिपीडिया पृष्ठ : अधिकांश भाग के लिए, सांख्यिकीय निष्कर्ष जनसंख्या के …

5
बेतरतीब जंगल बनाम प्रतिगमन
मैंने 5 स्वतंत्र चर के साथ डेटा सेट पर एक ओएलएस प्रतिगमन मॉडल चलाया। स्वतंत्र चर और आश्रित चर दोनों निरंतर हैं और रैखिक रूप से संबंधित हैं। आर स्क्वायर लगभग 99.3% है। लेकिन जब मैं आर में यादृच्छिक वन का उपयोग करके समान चलाता हूं तो मेरा परिणाम '% …

3
बोनफेरोनी समायोजन का उपयोग कैसे और कब करें
बोन्फ्रोनी समायोजन का उपयोग करने के संबंध में मेरे दो प्रश्न हैं: क्या मल्टीपल टेस्टिंग के सभी मामलों में बोनफ्रोनी समायोजन का उपयोग करना उचित है? यदि कोई डेटा सेट पर एक परीक्षण करता है, तो एक उस डेटा को महीन स्तरों में विभाजित करता है (जैसे लिंग द्वारा डेटा …

1
गणना डेटा में आउटलेर का पता लगाना
मेरे पास वही है जो मैंने भली-भांति समझा था कि यह एक सीधे आगे की समस्या है जिसमें गणना डेटा के कई अलग-अलग सेटों के लिए एकमुश्त पता लगाना शामिल है। विशेष रूप से, मैं यह निर्धारित करना चाहता हूं कि क्या गणना डेटा की एक श्रृंखला में एक या …

5
यादृच्छिक जंगलों में गर्भपात की लागत को कैसे नियंत्रित करें?
क्या R पैकेज यादृच्छिकता में गर्भपात की लागत को नियंत्रित करना संभव है ? मेरे अपने काम में गलत नकारात्मक (जैसे, गलती से गायब होना कि किसी व्यक्ति को कोई बीमारी हो सकती है) झूठे सकारात्मक से कहीं अधिक महंगा है। पैकेज रिपर उपयोगकर्ता को अलग-अलग तरीके से वजन घटाने …

5
आर के माध्यम से आंकड़े / गणित सीखने के लिए (केवल दौड़ नहीं) के स्रोत
मैं आर के माध्यम से सांख्यिकीय और गणितीय अवधारणाओं को सीखने के लिए स्रोतों (आर कोड, आर पैकेज, किताबें, पुस्तक अध्याय, लेख, लिंक आदि) के उदाहरणों में दिलचस्पी रखता हूं (यह अन्य भाषाओं के माध्यम से भी हो सकता है, लेकिन आर मेरा पसंदीदा स्वाद है)। चुनौती यह है कि …

4
एकाधिक प्रतिरूपण और मॉडल का चयन
जब आप अनुमान लगाना चाहते हैं, तो एक पूर्व रेखीय मॉडल होने पर एकाधिक प्रतिरूपण काफी सीधा होता है । हालाँकि, चीजें थोड़ी पेचीदा लगती हैं, जब आप वास्तव में कुछ मॉडल चयन करना चाहते हैं (जैसे कि उम्मीदवार चर का एक बड़ा सेट से भविष्यवक्ता चर का "सबसे अच्छा" …

2
परिपत्र डेटा के साथ भिन्नताओं की समानता का परीक्षण कैसे करें
मैं 8 विभिन्न नमूनों (प्रत्येक एक अलग आबादी से) के भीतर परिवर्तनशीलता की मात्रा की तुलना करने में दिलचस्पी रखता हूं। मुझे पता है कि यह अनुपात डेटा के साथ कई तरीकों से किया जा सकता है: विचरण, लेवेन टेस्ट, आदि की एफ-टेस्ट समानता। हालाँकि, मेरा डेटा सर्कुलर / दिशात्मक …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.