के लिए रिप्लेसमेंट "नाम बदलें" dplyr में


118

मुझे प्लायर का नाम बदलने का काम पसंद है rename। मैंने हाल ही में dplyr का उपयोग करना शुरू कर दिया है, और सोच रहा था कि क्या dplyr से फ़ंक्शन का उपयोग करके चर का नाम बदलने का एक आसान तरीका है, जो कि plyr के रूप में उपयोग करना आसान है rename?

जवाबों:


148

dplyr संस्करण 0.3 में एक नया rename()फंक्शन जोड़ा गया है जो बिल्कुल काम करता है plyr::rename()

df <- rename(df, new_name = old_name)

7
आप वाक्यविन्यास समझा सकते हैं? यह कमांड से ज्यादा महत्वपूर्ण है। मैं उपयोग कर रहा हूं, rename(TheDataFrame,OldVarName=NewVarName)लेकिन मुझे मिलता है Error: Unknown variables: NewVarName.और मुझे समझ नहीं आता कि क्यों।
s_a

2
@s_a मैंने स्पष्टीकरण जोड़ा है। इसे समीक्षा के बाद दिखाना चाहिए।
रयान

4
यदि आपके पास समस्याएं हैं, तो शायद पैकेज को स्पष्ट रूप से निर्दिष्ट करने से मदद मिलती है dplyr::rename(iris, petal_length = Petal.Length)
बोर्न

2
दो त्वरित टिप्पणियां: उपरोक्त कमांड को प्रभावी होने के लिए डेटाफ़्रेम को सौंपा जाना है iris <- dplyr::rename(iris, petal_length = Petal.Length)और नाम बदलना () रिक्त स्थान के साथ चर नामों को संभालना नहीं है, उदाहरण के लिए, dplyr::rename(iris, petal_length = "petal length")एक त्रुटि पैदा करता है।
एंथनी साइमन मिलेनिकज़ुक

2
आप setNames()कॉलम नाम थोक की जगह ले रहे हैं, तो आप उपयोग कर सकते हैं :df %>% mutate(foo = 1 +2) %>% setNames(c("blah", "blu", "bar"))
पागलबिन

46

Dplyr का अगला संस्करण चुनिंदा नाम के बेहतर संस्करण का समर्थन करेगा जिसमें नामकरण भी शामिल है:

> mtcars2 <- select( mtcars, disp2 = disp )
> head( mtcars2 )
                  disp2
Mazda RX4         160
Mazda RX4 Wag     160
Datsun 710        108
Hornet 4 Drive    258
Hornet Sportabout 360
Valiant           225
> changes( mtcars, mtcars2 )
Changed variables:
      old         new
disp  0x105500400
disp2             0x105500400

Changed attributes:
      old         new
names 0x106d2cf50 0x106d28a98

2
FYI करें changesनिर्यात किया जाता है (या यह होना चाहिए)
हेडली

2
अच्छा लगा। केवल एक चीज का मतलब यह होगा कि उपयोगकर्ता के हिस्से पर सोच में बदलाव होगा, क्योंकि plyrनाम बदलने का कार्य उपयोग करता है, "old"="new"जबकि dplyrउपयोग करता है new=oldजो इसे बाकी के कार्यों के अनुरूप रखता है। व्यक्तिगत रूप से, मैं इसे एक समस्या के रूप में नहीं समझता - आप नई चीजों के लिए जल्दी से अभ्यस्त हो जाते हैं, खासकर जब यह आपके डेटा प्रोसेसिंग में एक महत्वपूर्ण स्पीडअप का मतलब है।
verililcw

3
यह इच्छित विशेषता है, इसलिए क्रिया का विकल्प select। सुनिश्चित नहीं है कि हमारे पास ऐसा कुछ है जो कहता है कि सभी चर का चयन करें और वैसे ही इस कॉलम का नाम बदलें।
रोमेन फ्रेंकोइस

1
शायद भ्रम से बचने के लिए आप अपनी पोस्ट को संपादित कर सकते हैं ताकि कोड selectवास्तव में व्यवहार करने के तरीके को प्रतिबिंबित करे ? मैं dplyrसभी चर रखने के लिए एक आसान तरीका के लिए एक वोट में डाल दिया और सिर्फ एक या दो नाम बदल सकते हैं। :) अभी के लिए मैं लोड करना plyrऔर उपयोग करना जारी रखूंगा rename
vergilcw 16

2
@RomainFrancois @ARonwolen आप ओपी का उपयोग करके जो प्राप्त कर सकते हैं mtcars %>% select(matches(".*"),disp2=disp)। मैं एक अधिक पारिश्रमिक समाधान पसंद करूंगा लेकिन यह सभी स्तंभों (हालांकि उनके आदेश नहीं) को काम करता है और संरक्षित करता है। dispनकल नहीं होती।
farnsy

27

आप वास्तव में उपयोग कर सकते हैं plyrके renameहिस्से के रूप में समारोह dplyrजंजीरों। मुझे लगता है कि प्रत्येक फ़ंक्शन (क) data.frameपहले तर्क के रूप में लेता है और बी) data.frameचाइनिंग के लिए काम करता है। यहाँ एक उदाहरण है:

library('plyr')
library('dplyr')

DF = data.frame(var=1:5)

DF %>%
    # `rename` from `plyr`
    rename(c('var'='x')) %>%
    # `mutate` from `dplyr` (note order in which libraries are loaded)
    mutate(x.sq=x^2)

#   x x.sq
# 1 1    1
# 2 2    4
# 3 3    9
# 4 4   16
# 5 5   25

अद्यतन: फ़ंक्शन के dplyrभाग के रूप में सीधे नाम बदलने का समर्थन करता है का मौजूदा संस्करण select(ऊपर रोमेन फ्रैंकोइस पोस्ट देखें)। dplyrजंजीरों के हिस्से के रूप में गैर-डापर कार्यों का उपयोग करने के बारे में सामान्य कथन अभी भी मान्य है और renameएक दिलचस्प उदाहरण है।


5
इस मामले में प्लायर के बाद ड्रिपर को लोड करना सबसे अच्छा है । इस तरह से तेजी से dplyr कार्यों का उपयोग किया जाता है जब उपलब्ध है और आप dplyr के बजाय म्यूट का उपयोग कर सकते हैं :: उत्परिवर्ती
विंसेंट

ऐसा लगता है कि आप सही तरीके से गैर-डापर कार्यों का उपयोग करने में सक्षम हैं। mtcars%।% rename (c ("mpg", "सिलेंडर"), c ("mympg", "mycyl")) काम करता है, जहां नाम बदलने का कार्य मेरे उत्तर में परिभाषित है।
विंसेंट

मैंने dplyr और plyr के लोडिंग ऑर्डर को बदल दिया, धन्यवाद।
23250 पर user2503795

यह एक अच्छा समाधान है, हालांकि बड़े डेटा पर प्रदर्शन के बारे में एक दिलचस्प चर्चा होती है, जो कि dplyr के मुख्य लाभों में से एक है। सलाह के लिये धन्यवाद!
vergilcw

क्या डेटा नाम से सेटनेम जैसे संदर्भ द्वारा नाम बदलना काम करता है
MySchizoBuddy

9

इसे dplyr (अभी तक) में एक फ़ंक्शन के रूप में सूचीबद्ध नहीं किया गया है: http://cran.rstudio.org/web/packages/dplyr/dplyr.pdf

यदि आप plyr और dplyr दोनों को लोड नहीं करना चाहते हैं तो नीचे दिया गया कार्य काम करता है (लगभग) वही

rename <- function(dat, oldnames, newnames) {
  datnames <- colnames(dat)
  datnames[which(datnames %in% oldnames)] <- newnames
  colnames(dat) <- datnames
  dat
}

dat <- rename(mtcars,c("mpg","cyl"), c("mympg","mycyl"))
head(dat)

                  mympg mycyl disp  hp drat    wt  qsec vs am gear carb
Mazda RX4          21.0     6  160 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag      21.0     6  160 110 3.90 2.875 17.02  0  1    4    4
Datsun 710         22.8     4  108  93 3.85 2.320 18.61  1  1    4    1
Hornet 4 Drive     21.4     6  258 110 3.08 3.215 19.44  1  0    3    1
Hornet Sportabout  18.7     8  360 175 3.15 3.440 17.02  0  0    3    2
Valiant            18.1     6  225 105 2.76 3.460 20.22  1  0    3    1

संपादित करें: रोमैन की टिप्पणी निम्नलिखित का उत्पादन करती है (ध्यान दें कि परिवर्तन फ़ंक्शन के लिए dplyr .1.1 की आवश्यकता है)

> dplyr:::changes(mtcars, dat)
Changed variables:
          old         new        
disp      0x108b4b0e0 0x108b4e370
hp        0x108b4b210 0x108b4e4a0
drat      0x108b4b340 0x108b4e5d0
wt        0x108b4b470 0x108b4e700
qsec      0x108b4b5a0 0x108b4e830
vs        0x108b4b6d0 0x108b4e960
am        0x108b4b800 0x108b4ea90
gear      0x108b4b930 0x108b4ebc0
carb      0x108b4ba60 0x108b4ecf0
mpg       0x1033ee7c0            
cyl       0x10331d3d0            
mympg                 0x108b4e110
mycyl                 0x108b4e240

Changed attributes:
          old         new        
names     0x10c100558 0x10c2ea3f0
row.names 0x108b4bb90 0x108b4ee20
class     0x103bd8988 0x103bd8f58

3
यहां एकमात्र मुद्दा यह है कि डेटा की प्रतिलिपि बनाई गई है। कोई बड़ी बात नहीं है अगर यह खेलने के लिए है, अर्थात् mtcarsआदि ... लेकिन काफी नाटकीय अगर आप पर्याप्त डेटा के साथ सौदा करते हैं। जांचdplyr:::changes(mtcars, dat)
रोमेन फ्रेंकोइस

1
टिप्पणी के लिए धन्यवाद रोमैन। क्या कोई कारण परिवर्तन dplyr से निर्यात नहीं है? काफी उपयोगी फ़ंक्शन लगता है।
विंसेंट

1
मुझे लगता है कि हैडली ज्यादातर इसे हमारे लिए एक विकास उपकरण के रूप में देखता है।
रोमेन फ्रैंकोइस

1
इसे निश्चित रूप से निर्यात किया जाना चाहिए। मैं अभी भूल गया हूँ
हेडली

2

नाम बदलने के समय, dplyr::select_all()सुधार कॉलम के नामों का उपयोग नहीं किया जा सकता है। यह उदाहरण एक अंडरस्कोर के साथ रिक्त स्थान और अवधि को बदलता है और निचले मामले में सब कुछ परिवर्तित करता है:

iris %>%  
  select_all(~gsub("\\s+|\\.", "_", .)) %>% 
  select_all(tolower) %>% 
  head(2)
  sepal_length sepal_width petal_length petal_width species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa

1

मैंने dplyr का उपयोग करने का प्रयास किया :: नाम बदलने और मुझे एक त्रुटि मिली:

occ_5d <- dplyr::rename(occ_5d, rowname='code_5d')
Error: Unknown column `code_5d` 
Call `rlang::last_error()` to see a backtrace

मैंने इसके बजाय बेस आर फ़ंक्शन का उपयोग किया जो कि काफी सरल और प्रभावी निकला:

names(occ_5d)[1] = "code_5d"
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.