सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

5
यादृच्छिक संख्याओं को मैन्युअल रूप से बनाना
उदाहरण के लिए, मानक सामान्य वितरण से 10 वास्तविकताओं के अनुसार, मैं किसी दिए गए वितरण से मैन्युअल रूप से एक यादृच्छिक संख्या कैसे उत्पन्न कर सकता हूं?

8
प्रत्येक सांख्यिकीविद् को क्या सिद्धांत जानना चाहिए?
मैं यह बहुत ही बुनियादी, न्यूनतम आवश्यकताओं के परिप्रेक्ष्य से सोच रहा हूं। एक उद्योग के लिए प्रमुख सिद्धांत क्या हैं (अकादमिक नहीं) सांख्यिकीविद को नियमित आधार पर जानना, समझना और उसका उपयोग करना चाहिए? एक बड़ा जो दिमाग में आता है वह है बड़ी संख्या का कानून । डेटा …

4
जाँच कर रहा है कि क्या दो पॉइसन नमूनों का एक ही मतलब है
यह एक प्रारंभिक प्रश्न है, लेकिन मैं इसका उत्तर नहीं खोज पाया। मेरे पास दो माप हैं: समय t1 में n1 घटनाएं और समय t2 में n2 घटनाएँ, दोनों संभवतः अलग-अलग लंबोदा मूल्यों के साथ पॉइसन प्रक्रियाओं द्वारा उत्पादित (कहते हैं)। यह वास्तव में एक समाचार लेख, से है जो …

4
क्लास-असंतुलन के तहत प्रेसिजन-रिकॉल कर्व्स का अनुकूलन
मेरे पास एक वर्गीकरण कार्य है जहां मेरे पास कई भविष्यवक्ता हैं (जिनमें से एक सबसे अधिक जानकारीपूर्ण है), और मैं अपने क्लासिफायर का निर्माण करने के लिए MARS मॉडल का उपयोग कर रहा हूं (मैं किसी भी सरल मॉडल में दिलचस्पी रखता हूं, और उदाहरण के लिए चित्र का …

3
आर वर्गीकरण पाठ कार्यों के लिए कितने पैमाने पर है? [बन्द है]
मैं आर के साथ गति प्राप्त करने की कोशिश कर रहा हूं। आखिरकार मैं आर लाइब्रेरी का उपयोग टेक्स्ट वर्गीकरण करने के लिए करना चाहता हूं। मैं बस सोच रहा था कि आर के स्केलेबिलिटी के संबंध में लोगों के अनुभव क्या हैं जब यह पाठ वर्गीकरण करने की बात …

6
लाइन ग्राफ में बहुत अधिक लाइनें हैं, क्या इसका बेहतर समाधान है?
मैं समय के साथ (इस मामले में, "पसंद") उपयोगकर्ताओं द्वारा कार्यों की संख्या को ग्राफ़ करने की कोशिश कर रहा हूं। इसलिए मेरे पास y- अक्ष के रूप में "कार्यों की संख्या" है, मेरा x- अक्ष समय (सप्ताह) है, और प्रत्येक पंक्ति एक उपयोगकर्ता का प्रतिनिधित्व करती है। मेरी समस्या …

9
एक आकलनकर्ता और एक सांख्यिकीय के बीच क्या अंतर है?
मैंने सीखा है कि एक आँकड़ा एक विशेषता है जिसे आप नमूनों से प्राप्त कर सकते हैं। एक ही आकार के कई नमूने लेना, उन सभी के लिए इस विशेषता की गणना करना और पीडीएफ की साजिश रचना, हमें संबंधित विशेषता का वितरण या संबंधित आंकड़ों का वितरण मिलता है। …

1
GAM में टेंसर उत्पाद इंटरैक्शन के पीछे अंतर्ज्ञान (R में MGCV पैकेज)
सामान्यीकृत योज्य मॉडल वे हैं जहां उदाहरण के लिए y=α+f1(x1)+f2(x2)+eiy=α+f1(x1)+f2(x2)+ei y = \alpha + f_1(x_1) + f_2(x_2) + e_i । कार्य सुचारू हैं, और अनुमान लगाया जाना है। आमतौर पर दंडित बंटवारे से। एमजीसीवी आर में एक पैकेज है जो ऐसा करता है, और लेखक (साइमन वुड) आर उदाहरण के …

3
कई सेट के चौराहों की कल्पना
क्या एक विज़ुअलाइज़ेशन मॉडल है जो कई सेटों के प्रतिच्छेदन ओवरलैप दिखाने के लिए अच्छा है? मैं वेन आरेखों की तरह कुछ सोच रहा हूं, लेकिन किसी तरह बड़ी संख्या में सेट जैसे 10 या अधिक के लिए खुद को बेहतर उधार दे सकता है। विकिपीडिया कुछ उच्च सेट वेन …

2
प्रमुख घटक विश्लेषण में द्विपद की व्याख्या
मैं इस अच्छे ट्यूटोरियल में आया: आर। अध्याय 13. प्रिंसिपल कंपोनेंट एनालिसिस का उपयोग करके सांख्यिकीय विश्लेषण की एक हैंडबुक: ओलंपिक हेप्टाथलॉन आर पीसी भाषा में पीसीए कैसे करें। मैं चित्र 13.3 की व्याख्या को नहीं समझता: तो मैं पहले eigenvector बनाम दूसरे eigenvector की साजिश रच रहा हूं। इसका …

2
सामान्यता के शापिरो-विलक परीक्षण और सामान्यता के कोलमोगोरोव-स्मिरनोव परीक्षण के बीच अंतर क्या है?
सामान्यता के शापिरो-विलक परीक्षण और सामान्यता के कोलमोगोरोव-स्मिरनोव परीक्षण के बीच अंतर क्या है? इन दोनों विधियों के परिणाम अलग-अलग कब होंगे?

6
जब विश्वास अंतराल उपयोगी होते हैं?
अगर मैं सही ढंग से समझता हूं कि एक पैरामीटर का एक आत्मविश्वास अंतराल एक विधि द्वारा निर्मित अंतराल है जो नमूनों के निर्दिष्ट अनुपात के लिए सही मूल्य वाले अंतराल की पैदावार करता है। इसलिए 'विश्वास' उस पद्धति के बारे में है जो अंतराल के बजाय मैं एक विशेष …

6
द्विपद विश्वास अंतराल अनुमान - यह सममित क्यों नहीं है?
मैंने एक द्विपद अनुपात के विश्वास अंतराल का अनुमान लगाने के लिए निम्नलिखित आर कोड का उपयोग किया है क्योंकि मैं समझता हूं कि "पावर गणना" के लिए विकल्प जब एक आबादी में बीमारियों का पता लगाने वाले रिसीवर ऑपरेटिंग विशेषता वक्र डिजाइन को डिजाइन करते हैं। n 150 है, …

1
PCA (SVD और eigen अपघटन के लिए) में कैसे अंतर पड़ता है?
PCA के लिए आपका डेटा केंद्रित (या de-meaning) क्या अंतर करता है? मैंने सुना है कि यह गणित को आसान बनाता है या यह पहला पीसी को चर के माध्यम से हावी होने से रोकता है, लेकिन मुझे लगता है कि मैं अभी तक अवधारणा को मजबूती से समझने में …
30 r  pca  svd  eigenvalues  centering 

3
सांख्यिकीय परीक्षण यह बताने के लिए कि क्या एक ही जनसंख्या से दो नमूने खींचे गए हैं?
मान लीजिए कि मेरे पास दो नमूने हैं। अगर मैं यह बताना चाहता हूं कि क्या उन्हें अलग-अलग आबादी से खींचा गया है, तो मैं एक टी-टेस्ट चला सकता हूं। लेकिन मान लीजिए कि मैं परीक्षण करना चाहता हूं कि नमूने एक ही आबादी के हैं या नहीं। कोई इसे …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.