अपने दैनिक कार्यों में आपको कौन से आर पैकेज उपयोगी लगते हैं?


28

डुप्लिकेट थ्रेड: मैंने अभी आर का नवीनतम संस्करण स्थापित किया है। मुझे क्या पैकेज मिलना चाहिए?

डेटा के साथ अपने दैनिक कार्य की कल्पना नहीं कर सकने वाले R पैकेज क्या हैं ? कृपया सामान्य और विशिष्ट दोनों प्रकार के उपकरणों को सूचीबद्ध करें।

अद्यतन: 24.10.10 के लिए ggplot27 वोटों के साथ विजेता लगता है।

एक से अधिक उल्लेखित अन्य पैकेज हैं:

  • plyr - 4
  • RODBC; RMySQL- 4
  • sqldf - 3
  • lattice - २
  • zoo - २
  • Hmisc/rms - २
  • Rcurl - २
  • XML - २

आपके उत्तर के लिए धन्यवाद!


1
बहुत व्यक्तिपरक प्रश्न: इस प्रश्न का उत्तर नहीं दिया जा सकता है, और क्यूए साइट के लिए उपयुक्त नहीं है।
एगॉन विलीघेन

3
शायद सामुदायिक विकि होना चाहिए; यहाँ उपयोगी सवाल है, लेकिन निश्चित जवाब नहीं है।
शेन

2
@ शने: अच्छी बात है। ले जाया गया। @ एगॉन: व्यक्तिपरक वास्तव में। लेकिन अगर जवाब ज्ञानी लोगों से आता है, तो मुझे विषयवस्तु की खुराक नहीं मिलती। मैंने आर को काफी हाल ही में सीखना शुरू कर दिया है और दर्जनों का पता लगाने के लिए स्थापित किया है, हालांकि मैंने देखा कि ऐसे उपकरण हैं जो मैं हाथ में लिए कार्य के बावजूद बहुत अधिक बार उपयोग करता हूं।
राडेक

यह दिलचस्प होगा कि अगर StackExchange साइटों पर सामुदायिक विकि पोस्ट को जोड़ने की कुछ विधि का समर्थन कर सकता है। क्योंकि मैं शर्त लगाऊंगा कि यह सवाल स्टैकवॉटरफ्लो पर पूछा गया है और मुझे भी लगता है कि सांख्यिकीय विश्लेषण कुछ लोगों को आकर्षित कर सकता है जो आमतौर पर एसओ नहीं आते हैं।
शार्पे

@Sharpie: वहाँ की तरह कई दिलचस्प अतः पदों किया गया है stackoverflow.com/questions/1295955/... या stackoverflow.com/questions/1535021/... लेकिन वे संकुल पर ध्यान केंद्रित नहीं कर रहे हैं। और मैं मानता हूं, सामुदायिक विकि का जुड़ाव वास्तव में उपयोगी हो सकता है।
राडेक

जवाबों:




8

मैं xtable पैकेज का उपयोग करता हूं । Xtable पैकेज आर (विशेष रूप से, एनोवा परिणामों को प्रदर्शित करने वाली तालिका) को लाटेक्स तालिकाओं में तालिका में बदल देता है, जिसे एक लेख में शामिल किया जाना है।


8

मल्टीकोर तेजी से स्क्रिप्ट बनाने के लिए टूल के लिए काफी अच्छा है। उपयोग करते समय
cacheSweave बहुत समय बचाता है Sweave


8

ggplot2 - आर के लिए सबसे अच्छा दृश्य नीचे हाथ।

RMySQL / RSQLite / RODBC - एक डेटाबेस से कनेक्ट करने के लिए

sqldf - SQL प्रश्नों के साथ data.frames में हेरफेर

Hmisc / rms - फ्रैंक हरेल के पैकेज जिसमें सुविधाजनक विविध कार्य हैं और प्रतिगमन विश्लेषण के लिए अच्छे कार्य हैं।

GenABEL - जीनोम-वाइड एसोसिएशन अध्ययन के लिए अच्छा पैकेज

Rcmdr - R के लिए एक सभ्य GUI यदि आपको एक की आवश्यकता है।

CRANtastic को भी देखें - इस लिंक में सबसे लोकप्रिय आर संकुल की सूची है। सूची में शीर्ष पर मौजूद कई लोग पहले से ही मानसिक हो चुके हैं


8

data.table अब मेरा पसंदीदा है! बहुत अधिक इच्छा सूची के साथ नए संस्करण के लिए तत्पर हैं।



6

मेरे लिए व्यक्तिगत रूप से, मैं निम्नलिखित तीन पैकेजों का सबसे अधिक उपयोग करता हूं, सभी सांख्यिकीय कंप्यूटिंग के लिए भयानक ओमेगा प्रोजेक्ट से उपलब्ध हैं (मैं एक विशेषज्ञ होने का दावा नहीं करता हूं, लेकिन मेरे उद्देश्यों के लिए उनका उपयोग करना बहुत आसान है):

  • RCurl : इसमें बहुत सारे विकल्प हैं जो वेबसाइटों तक पहुंच की अनुमति देता है कि आधार आर में डिफ़ॉल्ट कार्यों से कठिनाई होगी मुझे लगता है कि यह कहना उचित है। यह libcurl लाइब्रेरी के लिए एक आर-इंटरफ़ेस है, जो इसे विकसित करने वाले आर के बाहर एक पूरे समुदाय का अतिरिक्त लाभ है। CRAN पर भी उपलब्ध है ।

  • XML : यह विकृत XML / HTML को पार्स करने की बहुत क्षमा है। यह libxml2 लाइब्रेरी के लिए एक आर-इंटरफ़ेस है और फिर से R के बाहर एक पूरे समुदाय का अतिरिक्त लाभ है जो इसे CRAN के लिए भी उपलब्ध है ।

  • RJSONIO : यह एक को जोंस कॉल से लौटाए गए पाठ को पार्स करने और इसे आगे के विश्लेषण के लिए एक सूची संरचना में व्यवस्थित करने की अनुमति देता है। इस पैकेज के प्रतियोगी rjson है, लेकिन यह एक के रूप में लाभान्वित होने का लाभ है, आसानी से R3 / S4 के माध्यम से एक्स्टेंसिबल और बड़े डेटा के लिए स्केलेबल।

6

Sweave आपको LaTeX दस्तावेज़ में R कोड एम्बेड करने देता है। कोड को निष्पादित करने के परिणाम, और वैकल्पिक रूप से स्रोत कोड, अंतिम दस्तावेज़ का हिस्सा बन जाते हैं।

इसलिए इसके बजाय, उदाहरण के लिए, एक LaTeX फ़ाइल में R द्वारा निर्मित छवि को चिपकाते हुए, आप R कोड को फ़ाइल में पेस्ट कर सकते हैं और सब कुछ एक जगह पर रख सकते हैं।


4
बस उन सभी के लिए एक संकेत जो आर के साथ प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान पर शुरू करना चाहते हैं। मैं आपको सलाह knitrदूंगा कि आप स्वेव के बजाय नए पैकेज पर एक नज़र डालें। यह मूल रूप से स्टेरॉयड पर स्वाइव है। यह आसान है, अगर आसान नहीं है, तो सीखना आसान है और कहीं अधिक लचीला है।
क्रिस्टोफ़_ज


4

मुझे लगता है जाली ": आर के साथ बहुभिन्नरूपी डेटा विज़ुअलाइज़ेशन जाली" Deepayan सरकार अमूल्य द्वारा साथी पुस्तक के साथ।


4

यदि आप किसी भी प्रकार की भविष्य कहनेवाला मॉडलिंग कर रहे हैं, तो कैरेट एक गॉडसेंड है। विशेष रूप से मल्टीकोर पैकेज के साथ संयुक्त , कुछ बहुत आश्चर्यजनक चीजें संभव हैं।


4

दिन-प्रतिदिन सबसे उपयोगी पैकेज "विदेशी" होना चाहिए, जिसमें अन्य सांख्यिकीय पैकेज जैसे स्टाटा, एसपीएसएस, मिनिटैब, एसएएस, आदि के डेटा को पढ़ने और लिखने के लिए कार्य करना है, जहां उस क्षेत्र में कार्य करना जहां आर का अर्थ यह नहीं है कि इसका मतलब है कि यह एक बहुत ही महत्वपूर्ण पैकेज है।


3

मैं उपयोग करता हूं

कार, ​​doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplots, gtools), Hmisc, plyr, RCurl, RDCOMClient, respe, RODBC, TeachingDemos, XML।

बहुत।


3

मैं इसके बिना नहीं रह सकता:

  • ग्राफिक्स के लिए जाली
  • एक्सेल फ़ाइलों को पढ़ने के लिए xlsx या XLConnect
  • rtf को rtf प्रारूप में रिपोर्ट बनाने के लिए (मैं तलवार या R2wd को प्राथमिकता दूंगा लेकिन मैं काम पर स्टेटकॉन को स्थापित नहीं कर सकता; मैं निश्चित रूप से जल्द ही odfWeave की कोशिश करूंगा ।)
  • मिश्रित मॉडल के लिए nlme और lme4
  • बड़े सरणियों के साथ काम करने के लिए एफएफ

2

डेटाबेस से डेटा तक पहुँचने के लिए RODBC , डेटाफ्रेम पर सरल SQL क्वेरी करने के लिए sqldf (हालाँकि मैं देशी आर कमांड्स का उपयोग करने के लिए खुद को मजबूर कर रहा हूँ), और ggplot2 और plyr



2

हम ज्यादातर उपयोग करते हैं:


तुम भी kernlab बाहर की जाँच करें और SVMs के लिए देखभाल करना चाहते हो सकता है। वे दिलचस्प हैं (जरूरी नहीं कि बेहतर समझें) विकल्प।
जाच


2

मेरे लिए मैं उपयोग कर रहा हूँ kernlab कर्नेल आधारित मशीन लर्निंग लैब के लिए और e1071 SVM के लिए और ggplot2 ग्राफिक्स के लिए


2

मैं ggplot2, शाकाहारी और रिशेप का उपयोग अक्सर करता हूं।



2

RColorBrewer का उल्लेख यहां नहीं किया गया है, अगर रंग योजनाओं की जरूरत है तो मैं इसका इस्तेमाल अक्सर साजिश रचने के लिए करता हूं


2

मैं आरसीपीपी का एक बड़ा प्रशंसक हूं, जब मुझे लूप के लिए तेजी से या गैर आर आर अनुरूप उपचार करने की आवश्यकता होती है। यह आर इको सिस्टम में बहुत अच्छी तरह से लागू किया गया है, एक समारोह में तर्कों के रूप में रूपांतरण के बिना मैट्रिक्स / विरल मैट्रिक्स प्राप्त कर सकता है।

सी ++ सिंटैक्स आसान है जब आप साधारण सामान कर रहे हैं (जो अक्सर मेरा मामला है)।

वास्तव में, आपको इस भयानक परिश्रम की आवश्यकता के लिए पैकेज निर्माता होने की आवश्यकता नहीं है।

क्या मैंने कहा कि C ++ बहुत तेज है?


2

DoParallel और foreach संकुल मुझे मेरे कोड parallelize और पर एक गणना अनुकूलित उदाहरण पर इसे चलाने के लिए अनुमति देकर इतना आसान मेरे जीवन बना दिया है अमेज़न EC2 ! मैं उनका बहुत बार उपयोग करता हूं। लेकिन लुई एस्लेट द्वारा जारी RStudio AMI के बिना यह संभव नहीं होगा । अंत में, मुझे स्ट्रिंग पैकेज का उल्लेख करना होगा जो वास्तव में पार्क में टहलने के साथ काम करता है। हर टेक्स्ट माइनिंग एप्लिकेशन में इसका इस्तेमाल करें। और मैं अपने काम की उच्च गुणवत्ता की रिपोर्ट तैयार करने के लिए नाइट्र का भी अक्सर उपयोग करता हूं। इस अद्भुत पैकेज Yihui Xie के लिए बहुत धन्यवाद!


1

मैं ggplot2, reshape, lattice, knitr का अधिक बार उपयोग करता हूं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.