एक समाधान के लिए, जो बाहरी रूप से निर्भरता से मुक्त है *, अब है readxl
:
रीडएक्सएल पैकेज एक्सेल से और आर में डेटा प्राप्त करना आसान बनाता है। मौजूदा पैकेजों में से कई की तुलना में (जैसे gdata, xlsx, xlsReadWrite) रीडएक्सएल में कोई बाहरी निर्भरता नहीं है, इसलिए सभी ऑपरेटिंग सिस्टम को स्थापित करना और उपयोग करना आसान है। यह एक ही पत्रक में संग्रहीत सारणीबद्ध डेटा के साथ काम करने के लिए डिज़ाइन किया गया है।
Readxl दोनों विरासत .xls प्रारूप और आधुनिक xml- आधारित .xlsx प्रारूप का समर्थन करता है। .xls का समर्थन libxls C लाइब्रेरी के साथ संभव है, जो अंतर्निहित बाइनरी प्रारूप की कई जटिलताओं को दूर करता है। .Xlsx को पार्स करने के लिए, हम RapidXML C ++ लाइब्रेरी का उपयोग करते हैं।
इसे इस तरह स्थापित किया जा सकता है:
install.packages("readxl")
या
devtools::install_github("hadley/readxl")
प्रयोग
library(readxl)
read_excel("my-old-spreadsheet.xls")
read_excel("my-new-spreadsheet.xlsx")
read_excel("my-spreadsheet.xls", sheet = "data")
read_excel("my-spreadsheet.xls", sheet = 2)
read_excel("my-spreadsheet.xls", na = "NA")
* कड़ाई से सच नहीं है, इसके लिए Rcpp
पैकेज की आवश्यकता होती है , जिसके लिए Rtools (Windows के लिए) या Xcode (OSX के लिए) की आवश्यकता होती है, जो R के लिए बाहरी निर्भरताएँ होती हैं। लेकिन उन्हें रास्तों के साथ किसी भी प्रकार की फ़िडलिंग की आवश्यकता नहीं होती है, इसलिए यह एक है जावा और पर्ल निर्भरता पर लाभ।
अद्यतन अब rexcel पैकेज है। यह Excel फ़ाइल और R में Excel स्वरूपण, फ़ंक्शंस और कई अन्य प्रकार की जानकारी प्राप्त करने का वादा करता है।
.csv
।