डेटासेट पढ़ने के बाद:
dataset <- read.csv("forR.csv")
- मुझे मेरे द्वारा दिए गए मामलों की संख्या देने के लिए आर कैसे मिल सकता है?
- इसके अलावा, क्या लौटाए गए मूल्य में शामिल मामलों को शामिल नहीं किया जाएगा
na.omit(dataset)
?
डेटासेट पढ़ने के बाद:
dataset <- read.csv("forR.csv")
na.omit(dataset)
?जवाबों:
dataset
एक डेटा फ्रेम होगा। जैसा कि मेरे पास नहीं है forR.csv
, मैं चित्रण के लिए एक छोटा डेटा फ्रेम बनाऊंगा:
set.seed(1)
dataset <- data.frame(A = sample(c(NA, 1:100), 1000, rep = TRUE),
B = rnorm(1000))
> head(dataset)
A B
1 26 0.07730312
2 37 -0.29686864
3 57 -1.18324224
4 91 0.01129269
5 20 0.99160104
6 90 1.59396745
मामलों की संख्या प्राप्त करने के लिए, पंक्तियों की संख्या का उपयोग करके nrow()
या NROW()
:
> nrow(dataset)
[1] 1000
> NROW(dataset)
[1] 1000
को छोड़ते हुए के बाद डेटा गिनती करने के लिए NA
, एक ही उपकरण का उपयोग, लेकिन लपेट dataset
में na.omit()
:
> NROW(na.omit(dataset))
[1] 993
के बीच का अंतर NROW()
और NCOL()
और उनके लोअरकेस वेरिएंट ( ncol()
और nrow()
) कि लोअरकेस संस्करण केवल वस्तुओं है कि आयाम (सरणियों, मैट्रिक्स, डेटा फ्रेम) के लिए काम करेगा। अपरकेस संस्करण वैक्टर के साथ काम करेंगे, जिन्हें इस तरह से व्यवहार किया जाता है जैसे कि वे 1 कॉलम मैट्रिक्स थे, और यदि आप अपने डेटा को सब्सक्राइब करते हैं तो ऐसे मजबूत होते हैं जैसे R एक खाली आयाम छोड़ता है।
वैकल्पिक रूप से, इसका उपयोग करें complete.cases()
और sum
इसे ( complete.cases()
एक तार्किक वेक्टर देता है [ TRUE
या FALSE
] यह दर्शाता है कि क्या किसी NA
भी पंक्तियों के लिए कोई अवलोकन है ।
> sum(complete.cases(dataset))
[1] 993
संक्षेप में:
N और kdim(dataset)
दोनों को पुनः प्राप्त करने के लिए चलाएँ , आप भी उपयोग कर सकते हैं और (और सम और - अन्य प्रकार के लिए भी आवश्यक हैं)।nrow(df)
ncol(df)
NROW(df)
NCOL(df)
यदि आप उदाहरण के माध्यम से रूपांतरित करते हैं dataset <- na.omit(dataset)
, तो मामले चले गए हैं और गिने नहीं जाते हैं। लेकिन अगर आप उदाहरण के summary(dataset)
लिए NA मामलों के लिए जिम्मेदार हैं।
str()
कि यह आपकी वस्तु के बारे में अन्य उपयोगी विवरण प्रदान करता है। अक्सर समझा सकते हैं कि एक कॉलम व्यवहार क्यों नहीं कर रहा है क्योंकि इसे (संख्यात्मक आदि के बजाय कारक) होना चाहिए।