चयनित स्तंभों के लिए तालिका में NA मान कैसे बदलें

Question 1

NA मानों को बदलने के बारे में बहुत सारे पद हैं। मुझे पता है कि एक व्यक्ति निम्नलिखित तालिका / फ्रेम में NA को प्रतिस्थापित कर सकता है:

x[is.na(x)]<-0

लेकिन, क्या होगा अगर मैं इसे केवल कुछ स्तंभों तक सीमित करना चाहता हूं? आइए मैं आपको एक उदाहरण दिखाता हूं।

सबसे पहले, एक डाटासेट से शुरू करते हैं।

set.seed(1234)
x <- data.frame(a=sample(c(1,2,NA), 10, replace=T),
                b=sample(c(1,2,NA), 10, replace=T), 
                c=sample(c(1:5,NA), 10, replace=T))

जो देता है:

    a  b  c
1   1 NA  2
2   2  2  2
3   2  1  1
4   2 NA  1
5  NA  1  2
6   2 NA  5
7   1  1  4
8   1  1 NA
9   2  1  5
10  2  1  1

ठीक है, इसलिए मैं केवल कॉलम 'ए' और 'बी' के प्रतिस्थापन को प्रतिबंधित करना चाहता हूं। मेरा प्रयास था:

x[is.na(x), 1:2]<-0

तथा:

x[is.na(x[1:2])]<-0

जो काम न करे।

मेरा डेटाटेबल प्रयास, जहाँ y<-data.table(x), स्पष्ट रूप से कभी काम नहीं करने वाला था:

y[is.na(y[,list(a,b)]), ]

मैं is.na तर्क के अंदर कॉलम पास करना चाहता हूं लेकिन यह स्पष्ट रूप से काम नहीं करेगा।

मैं एक data.frame और एक data.table में ऐसा करना चाहूंगा। मेरा अंतिम लक्ष्य 'c' को '' a 'और' b 'के तरीके से 1: 2: 0 से 1: 1 में रखना है, क्योंकि यह एक तार्किक चर नहीं है। मेरे पास कॉलम का एक गुच्छा है, इसलिए मैं इसे एक-एक करके नहीं करना चाहता। और, मैं यह जानना चाहूंगा कि यह कैसे करना है।

क्या तुम्हारे पास कोई सुझाव है?

Question 2

तुम कर सकते हो:

x[, 1:2][is.na(x[, 1:2])] <- 0

या बेहतर (IMHO), चर नामों का उपयोग करें:

x[c("a", "b")][is.na(x[c("a", "b")])] <- 0

दोनों मामलों में, 1:2या c("a", "b")पूर्व-परिभाषित वेक्टर द्वारा प्रतिस्थापित किया जा सकता है।

Question 3

संपादित करें 2020-06-15

data.table1.12.4 (अक्टूबर 2019) के बाद से , data.tableयह सुविधा प्रदान करने के लिए दो कार्य करता है: nafillऔर setnafill।

nafill स्तंभों पर काम कर रहा है:

cols = c('a', 'b')
y[ , (cols) := lapply(.SD, nafill, fill=0), .SDcols = cols]

setnafill तालिकाओं पर काम करता है (प्रतिस्थापन-संदर्भ / जगह में होता है)

setnafill(y, cols=cols, fill=0)
# print y to show the effect
y[]

यह भी अन्य विकल्पों की तुलना में अधिक कुशल होगा; ?nafillअधिक देखने के लिए, अंतिम-अवलोकन-किया-फॉरवर्ड (LOCF) और NAसमय-श्रृंखला के लिए प्रतिरूपण का अगला-अवलोकन-किया-बैकवर्ड (NOCB) संस्करण ।

यह आपके data.tableसंस्करण के लिए काम करेगा :

for (col in c("a", "b")) y[is.na(get(col)), (col) := 0]

वैकल्पिक रूप से, जैसा कि डेविड अर्नबर्ग नीचे बताते हैं, आप उपयोग कर सकते हैं set(साइड बेनिफिट - आप इसे या तो उपयोग कर सकते हैं ) data.frameया data.table:

for (col in 1:2) set(x, which(is.na(x[[col]])), col, 0)

Question 4

@ रॉटर्ट मैकडॉनल्ड्स के tidyr::replace_na()उत्तर पर बिल्डिंग , यहाँ कुछ dplyrविकल्प दिए गए हैं जो नियंत्रित करने के लिए हैं कि कॉलम NAबदले गए हैं:

library(tidyverse)

# by column type:
x %>%
  mutate_if(is.numeric, ~replace_na(., 0))

# select columns defined in vars(col1, col2, ...):
x %>%
  mutate_at(vars(a, b, c), ~replace_na(., 0))

# all columns:
x %>%
  mutate_all(~replace_na(., 0))

Question 5

यह अब रिप्लेस_ना () के साथ टाइडर में तुच्छ है। फ़ंक्शन डेटा के लिए काम करने के लिए प्रकट होता है। टेबल्स के साथ-साथ डेटा। वर्कफ़्लो:

tidyr::replace_na(x, list(a=0, b=0))

Question 6

यह निश्चित नहीं है कि यह अधिक संक्षिप्त है, लेकिन यह फ़ंक्शन डेटा के चयनित कॉलमों में NA (या कोई भी मूल्य जो आपको पसंद है) को बदलने की अनुमति देगा।

update.mat <- function(dt, cols, criteria) {
  require(data.table)
  x <- as.data.frame(which(criteria==TRUE, arr.ind = TRUE))
  y <- as.matrix(subset(x, x$col %in% which((names(dt) %in% cols), arr.ind = TRUE)))
  y
}

इसे लागू करने के लिए:

y[update.mat(y, c("a", "b"), is.na(y))] <- 0

फ़ंक्शन चयनित कॉलम और पंक्तियों (सेल निर्देशांक) का एक मैट्रिक्स बनाता है जो इनपुट मानदंडों को पूरा करता है (इस मामले में is.na == टीआरए)।

Question 7

हम इसे फ़ंक्शन के data.tableसाथ हल कर सकते हैं tidyr::repalce_naऔरlapply

library(data.table)
library(tidyr)
setDT(df)
df[,c("a","b","c"):=lapply(.SD,function(x) replace_na(x,0)),.SDcols=c("a","b","c")]

इस तरह, हम NAस्ट्रिंग के साथ पेस्ट कॉलम भी हल कर सकते हैं । सबसे पहले, हम replace_na(x,""), फिर हम stringr::str_cकॉलम गठबंधन कर सकते हैं!

Question 8

एक विशिष्ट कॉलम के लिए, एक विकल्प है sapply

DF <- data.frame(A = letters[1:5],
             B = letters[6:10],
             C = c(2, 5, NA, 8, NA))

DF_NEW <- sapply(seq(1, nrow(DF)),
                    function(i) ifelse(is.na(DF[i,3]) ==
                                       TRUE,
                                       0,
                                       DF[i,3]))

DF[,3] <- DF_NEW
DF

Question 9

यह {data.table} और {stringr} के साथ काफी उपयोगी है

library(data.table)
library(stringr)

x[, lapply(.SD, function(xx) {str_replace_na(xx, 0)})]

FYI करें

Question 10

Data.table y से शुरू करके, आप बस लिख सकते हैं: इस कमांड को बनाने और चलाने
y[, (cols):=lapply(.SD, function(i){i[is.na(i)] <- 0; i}), .SDcols = cols]
से library(data.table)पहले मत भूलना y।

Question 11

यह मेरे लिए ठीक काम करता है

DataTable DT = new DataTable();

DT = DT.AsEnumerable().Select(R =>
{
      R["Campo1"] = valor;
      return (R);
}).ToArray().CopyToDataTable();