मैं R में किसी डेटा की पंक्तियों की संख्या कैसे प्राप्त करूं? [बन्द है]


157

डेटासेट पढ़ने के बाद:

dataset <- read.csv("forR.csv")
  • मुझे मेरे द्वारा दिए गए मामलों की संख्या देने के लिए आर कैसे मिल सकता है?
  • इसके अलावा, क्या लौटाए गए मूल्य में शामिल मामलों को शामिल नहीं किया जाएगा na.omit(dataset)?

1
मैं यह भी देखने की सलाह देता हूं str()कि यह आपकी वस्तु के बारे में अन्य उपयोगी विवरण प्रदान करता है। अक्सर समझा सकते हैं कि एक कॉलम व्यवहार क्यों नहीं कर रहा है क्योंकि इसे (संख्यात्मक आदि के बजाय कारक) होना चाहिए।
चेस करें

3
कृपया पहले ओवेन के आर गाइड को पढ़ें ( cran.r-project.org/doc/contrib/Owen-TheRGuide.pdf ), और यदि संभव हो तो, आर का परिचय ( cran.r-project.org/doc-manuals/R- intro.pdf )। दोनों आर की आधिकारिक वेबसाइट पर हैं। आप अविश्वसनीय रूप से भाग्यशाली हैं कि आपको वास्तव में उत्तर मिल गया है। आर-हेल्प लिस्ट में आप कम सुरुचिपूर्ण शब्दों में मैनुअल पर पुनर्निर्देशित करेंगे। मेरा मतलब आपको दोष देना नहीं।
जॉरिस मेस

11
@ जॉरिस - पॉइंट लिया गया (अपराध के बिना), लेकिन यह मेरी धारणा थी कि एसई साइटों को मैनुअल द्वारा वहन न करने की एक तरह से समस्या / समाधान सीखने के लिए तैयार किया गया था। इसके अतिरिक्त, यह प्रश्न अब अन्य शुरुआती लोगों के लिए उपलब्ध होगा। हालांकि लिंक के लिए धन्यवाद।
टॉम राइट

2
मैं आपके दावे से असहमत हूं कि यह सवाल अन्य शुरुआती लोगों के लिए मददगार होगा, खासकर यदि वे मैनुअल स्किम नहीं करते हैं। वे सिर्फ एक डुप्लीकेट प्रश्न बनाएंगे।
जोशुआ उलरिच

6
और, चार साल बाद, यह दूसरी हिट है जिसे मैंने Google पर इस प्रश्न का उत्तर खोजने की कोशिश की। मेरे लिए डुप्लिकेट (@JoshuaUlrich) बनाने की कोई आवश्यकता नहीं है।
रिचर्ड

जवाबों:


173

datasetएक डेटा फ्रेम होगा। जैसा कि मेरे पास नहीं है forR.csv, मैं चित्रण के लिए एक छोटा डेटा फ्रेम बनाऊंगा:

set.seed(1)
dataset <- data.frame(A = sample(c(NA, 1:100), 1000, rep = TRUE),
                      B = rnorm(1000))

> head(dataset)
   A           B
1 26  0.07730312
2 37 -0.29686864
3 57 -1.18324224
4 91  0.01129269
5 20  0.99160104
6 90  1.59396745

मामलों की संख्या प्राप्त करने के लिए, पंक्तियों की संख्या का उपयोग करके nrow()या NROW():

> nrow(dataset)
[1] 1000
> NROW(dataset)
[1] 1000

को छोड़ते हुए के बाद डेटा गिनती करने के लिए NA, एक ही उपकरण का उपयोग, लेकिन लपेट datasetमें na.omit():

> NROW(na.omit(dataset))
[1] 993

के बीच का अंतर NROW()और NCOL()और उनके लोअरकेस वेरिएंट ( ncol()और nrow()) कि लोअरकेस संस्करण केवल वस्तुओं है कि आयाम (सरणियों, मैट्रिक्स, डेटा फ्रेम) के लिए काम करेगा। अपरकेस संस्करण वैक्टर के साथ काम करेंगे, जिन्हें इस तरह से व्यवहार किया जाता है जैसे कि वे 1 कॉलम मैट्रिक्स थे, और यदि आप अपने डेटा को सब्सक्राइब करते हैं तो ऐसे मजबूत होते हैं जैसे R एक खाली आयाम छोड़ता है।

वैकल्पिक रूप से, इसका उपयोग करें complete.cases()और sumइसे ( complete.cases()एक तार्किक वेक्टर देता है [ TRUEया FALSE] यह दर्शाता है कि क्या किसी NAभी पंक्तियों के लिए कोई अवलोकन है ।

> sum(complete.cases(dataset))
[1] 993

36

संक्षेप में:

  1. N और kdim(dataset) दोनों को पुनः प्राप्त करने के लिए चलाएँ , आप भी उपयोग कर सकते हैं और (और सम और - अन्य प्रकार के लिए भी आवश्यक हैं)।nrow(df)ncol(df)NROW(df)NCOL(df)

  2. यदि आप उदाहरण के माध्यम से रूपांतरित करते हैं dataset <- na.omit(dataset), तो मामले चले गए हैं और गिने नहीं जाते हैं। लेकिन अगर आप उदाहरण के summary(dataset) लिए NA मामलों के लिए जिम्मेदार हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.