Z- परीक्षण परिकल्पना परीक्षण के लिए एक सांख्यिकीय परीक्षण है जो परीक्षण सांख्यिकीय के नमूना वितरण के रूप में मानक सामान्य वितरण का उपयोग करता है। एक सामान्य उदाहरण दो अनुपातों के अंतर के लिए परीक्षण है।

चि स्क्वेर्ड टेस्ट और समान अनुपात के परीक्षण के बीच क्या संबंध है?
मान लीजिए कि मेरे पास चार, पारस्परिक रूप से अनन्य विशेषताओं के साथ तीन आबादी है। मैं प्रत्येक आबादी से यादृच्छिक नमूने लेता हूं और उन विशेषताओं के लिए एक क्रोस्टैब या आवृत्ति तालिका का निर्माण करता हूं जो मैं माप रहा हूं। क्या मैं यह कहने में सही हूं: …

मशीन लर्निंग में पदानुक्रमित / नेस्टेड डेटा से कैसे निपटें
मैं अपनी समस्या को एक उदाहरण से समझाता हूँ। मान लीजिए कि आप किसी व्यक्ति की आय का अनुमान लगाना चाहते हैं, जो कुछ विशेषताएं बताती है: {आयु, लिंग, देश, क्षेत्र, शहर}। आपके पास एक प्रशिक्षण डाटासेट है train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, …
-est और -est के बीच चुनना
पृष्ठभूमि: मैं परिकल्पना परीक्षण पर काम करने वाले सहयोगियों को एक प्रस्तुति दे रहा हूं, और इसमें से अधिकांश को ठीक समझता हूं, लेकिन एक पहलू यह है कि मैं खुद को गांठ बांध रहा हूं और साथ ही दूसरों को समझाने की कोशिश कर रहा हूं। यह वही है …

जैसे-जैसे पुनरावृत्तियों की संख्या बढ़ती है, धीरे-धीरे बूस्टिंग मशीन की सटीकता कम होती जाती है
मैं caretआर में पैकेज के माध्यम से ढाल बूस्टिंग मशीन एल्गोरिदम का प्रयोग कर रहा हूं । एक छोटे से कॉलेज प्रवेश डेटासेट का उपयोग करते हुए, मैंने निम्नलिखित कोड चलाया: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" …
किस स्तर पर एक है
पृष्ठभूमि: सुरक्षित रूप से छोड़ें - यह यहाँ संदर्भ के लिए है, और प्रश्न को वैध बनाने के लिए। इस पत्र का उद्घाटन पढ़ता है: "कार्ल पियर्सन की प्रसिद्ध ची-वर्ग आकस्मिक परीक्षण एक और आंकड़ा से ली गई है, z आंकड़ा कहा जाता है, सामान्य वितरण पर आधारित। का सबसे …

स्वतंत्र नमूने टी-टेस्ट: क्या डेटा को वास्तव में बड़े नमूना आकारों के लिए वितरित करने की आवश्यकता है?
मान लें कि मैं परीक्षण करना चाहता हूं कि क्या दो स्वतंत्र नमूनों के अलग-अलग साधन हैं। मुझे पता है कि अंतर्निहित वितरण सामान्य नहीं है । यदि मैं सही ढंग से समझता हूं, तो मेरा परीक्षण सांख्यिकीय मतलब है , और बड़े पर्याप्त नमूना आकारों के लिए, सामान्य रूप …

बहुत बड़ी संख्या में डेटा बिंदुओं में मानों की प्रतिरूपण कैसे करें?
मेरे पास एक बहुत बड़ा डेटासेट है और लगभग 5% यादृच्छिक मूल्य गायब हैं। ये चर एक दूसरे के साथ सहसंबद्ध हैं। निम्नलिखित उदाहरण R डाटासेट केवल एक खिलौना उदाहरण है जिसमें डमी सहसंबद्ध डेटा है। set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol …
संभावना अनुपात परीक्षण और वाल्ड परीक्षण आर में चमक के लिए अलग निष्कर्ष प्रदान करते हैं
मैं सामान्यीकृत, रैखिक और मिश्रित मॉडल से एक उदाहरण प्रस्तुत कर रहा हूं । मेरा MWE नीचे है: Dilution <- c(1/128, 1/64, 1/32, 1/16, 1/8, 1/4, 1/2, 1, 2, 4) NoofPlates <- rep(x=5, times=10) NoPositive <- c(0, 0, 2, 2, 3, 4, 5, 5, 5, 5) Data <- data.frame(Dilution, NoofPlates, …

हम कभी भी जनसंख्या परिवर्तन को कैसे जान सकते हैं?
परिकल्पना परीक्षण में, एक आम सवाल यह है कि जनसंख्या का विचरण क्या है? मेरा सवाल यह है कि हम कभी भी जनसंख्या परिवर्तन को कैसे जान सकते हैं? यदि हम संपूर्ण वितरण को जानते हैं, तो हम पूरी आबादी का मतलब भी जान सकते हैं । फिर परिकल्पना परीक्षण …
