रूबी एक सांख्यिकी कार्यक्षेत्र के रूप में


13

यह एक प्रश्न भी है जो एक कार्यस्थल के रूप में पायथन से बहुत अधिक संबंधित है और एक सांख्यिकी कार्यक्षेत्र के रूप में उत्कृष्टता प्राप्त करता है । मुझे पता है कि रूबी बनाम पायथन के बारे में बहुत बड़ी चर्चा है लेकिन इस सवाल पर बात नहीं बनती। मैंने सोचा था कि रूबी पायथन की तुलना में तेज़ है और एक बहुत ही प्राकृतिक वाक्य-विन्यास होने से मुझे आँकड़ों को समझने में फायदा हो सकता है और यह R का एक अच्छा विकल्प भी हो सकता है (जो मेरी रुचि का भी है और यहाँ R पर मेरे अन्य प्रश्न का हवाला दिया गया था))। उदाहरण के लिए, मैंने जो Google टेक व्याख्यान देखे हैं, उनमें से एक पर (यहां जुड़े हुए प्रश्न का हवाला देते हुए, प्रशिक्षक ने शिकायत की है कि आर लूप के लिए धीमी है)। रूबी के साथ रेल भी है, इसलिए शायद दोनों को एक साथ लाने की संभावना होगी (पायथन के पास Django है, लेकिन फिर से मैं उस में नहीं जा रहा हूं)।

तो, सवाल वही है, लेकिन रूबी में मेरी रुचि के लिए:

  • यदि आप रूबी को "सांख्यिकी कार्यक्षेत्र" के रूप में उपयोग करना चाहते हैं, तो आप आर, एसपीएसएस, पायथन, एक्सेल आदि को बदलने के लिए क्या सलाह दे सकते हैं ?

  • आपके अनुभव के आधार पर मुझे क्या लाभ और हानि होगी?

कृपया ध्यान दें कि मैं पिछले पायथन और एक्सेल प्रश्न पर आधारित इस प्रश्न पर विचार कर रहा हूं। यदि आप मानते हैं कि रूबी और पायथन (या एक्सेल) का उपयोग करने का एक ही प्रभाव होगा, तो कृपया ऐसा कहें और किसी भी पिछले प्रश्न के तर्कों को इंगित करें, इस प्रश्न का उद्देश्य समान उत्तरों के लिए पिछले प्रश्नों को दोहराने के लिए नहीं है। हालांकि, मेरा मानना ​​है कि मतभेद हैं (जैसे भाषा की गति और वाक्य रचना), लेकिन मैं रूबी के लिए सिफारिशें जानना चाहूंगा या अगर वहाँ है, उदाहरण के लिए इसके लिए कहने की तुलना में बहुत कम उपलब्ध है पायथन या एक्सेल। तो कृपया इन समान प्रश्नों के लिए पिछले उत्तरों पर विचार करें लेकिन अन्य भाषा / कार्यक्रम के लिए।

संपादित करें: जब से उत्तर दूसरे रास्ते पर जा रहा है, तब तक हाइलाइट करने के लिए, जिस उत्तर की मुझे तलाश थी, वह एक ऐसा है जैसे कि पायथन प्रश्न पर चुना गया उत्तर जिसे मैंने लिंक किया है। यह रूबी के साथ मिलकर सीखने के आंकड़ों के बारे में नहीं है । मैंने R के साथ सांख्यिकी सीखने के प्रश्न की ओर इशारा किया । यदि यह बहुत संभव है, लेकिन मैं एक ही समय में रूबी के साथ आंकड़े सीखने की उम्मीद नहीं कर रहा हूं। आप इस प्रश्न के लिए सांख्यिकी पृष्ठभूमि मान सकते हैं।


संपादित करने के लिए धन्यवाद! मुझे लगता है कि मेरा धन्यवाद मिटा दिया गया था। क्या सवालों पर धन्यवाद कहना गलत है? (बस पुष्टि करना चाहूंगा, मेरी तरफ से कोई समस्या नहीं है - प्रश्न के थोड़ा बंद विषय पर टिप्पणी करें, लेकिन मैं सिर्फ इसके लिए मेटा पर एक सवाल शुरू नहीं करना चाहता था)।
Oeufcoque Penteano

1
राय थोड़ी अलग है। एक सवाल के अंत में एक संक्षिप्त "धन्यवाद" आम है, लेकिन इससे अधिक आमतौर पर एक अनावश्यक व्याकुलता माना जाता है। आप साइट के विस्तृत मेटा साइट पर मार्गदर्शन प्राप्त कर सकते हैं, जैसे SE FAQ पृष्ठ
whuber

जवाबों:


9

मैं रूबी + आर का उपयोग कर रहा हूं।

आप कागज को पढ़ सकते हैं: रिनरबी: शुद्ध रूबी से आर इंटरप्रेटर तक पहुंचना

http://www.jstatsoft.org/v29/i04/paper

और यह ब्लॉग:

http://rubyforscientificresearch.blogspot.com

http://sciruby.com/

(sciruby के लेखक भी आर उपयोगकर्ता हैं।)


धन्यवाद, आपका जवाब उस दिशा पर जाता है जो मैं देख रहा हूं। मैंने देखा कि 2009 और 2011 से संदर्भ तारीखें हैं, मुझे आश्चर्य है कि क्या इस दिए गए रूबी के बारे में अधिक हाल का साहित्य एक काफी नई भाषा है और हमेशा बढ़ रहा है? फिर भी, मुझे लगता है कि यह एक अच्छा प्रारंभिक बिंदु है। अच्छा लगा कि ब्लॉग वैज्ञानिक अनुसंधान के लिए माणिक मानते हैं, जो वास्तव में मेरा मामला है।
1857 में Oeufcoque Penteano

नमस्ते, मुझे माणिक और रेल्स पसंद हैं। मुझे भी आर से प्यार है। आप पा सकते हैं माणिक्य अधिक से अधिक बढ़ाएं। rubygems.org/stats R भी। 2003, आर क्रैन 200 है, अब 3600+ है !!! 2011 में, रूबी रत्न 28000, अब 36874 रत्न है! आप
ओउआंग

रूबी रत्नों पर महान बिंदु, मैं उन के बारे में भूल गया। शायद अन्य लोग रूबी को कार्यक्षेत्र के रूप में उपयोग करने की बात पर कुछ रूबी रत्न सुझा सकते हैं जो काम करने के लिए जाने जाते हैं और मजबूत हैं? मैं फिर से क्या देख रहा हूँ पर एक उत्तर जोड़ने के लिए धन्यवाद।
ओउफ़्कोके पेंटेनो

4

पुराने (पूर्व संस्करण) उत्तर:

अगर आपको लगता है कि आप स्वयं सब कुछ प्रोग्रामिंग करके आंकड़े सीखेंगे, तो मैं कहूंगा कि आप डीबगिंग से भरे लंबे स्लोग के लिए हैं, न कि सांख्यिकीय सीखने के लिए। साथ ही, आपको किसी भी तरह अपने उत्तरों की जांच करने के लिए R जैसी भाषा की आवश्यकता होगी।

मुझे लगता है कि उपयोगकर्ता 765195 के पास आर के संदर्भ में कई अन्य भाषाओं की तुलना में डिबग करना कठिन है, जो महत्वपूर्ण है, लेकिन "सबसे खराब" है? मुझे ऐसा नहीं लगता।

संपादित करें:

इसलिए यदि मैं आपके EDIT को संक्षेप में प्रस्तुत कर सकता हूं: यह देखते हुए कि आप पहले से ही आँकड़े करते हैं, और यह देखते हुए कि आप वास्तव में रूबी का उपयोग वास्तविक सांख्यिकीय कार्यक्रम (आर, ग्रेट, एसएएस, आदि) के बजाय करना चाहते हैं, तो आप अपने जीवन को कैसे आसान बना सकते हैं। । क्या वह सही है?

मैं रूबी का जवाब नहीं दे सकता, लेकिन मुझे लगता है कि सामान्य प्रश्न को भी संबोधित किया जाना चाहिए। खासकर जब से आप एक ही सवाल के अन्य तात्कालिकता की ओर इशारा कर रहे हैं: "मैं पायथन / पर्ल / जावा / क्लोजर / सी / जो भी आंकड़े करना चाहता हूं" का उपयोग करना चाहता हूं।

मुझे लगता है कि उत्तर हमेशा होगा: "एक नौकरी करने के लिए एक सामान्यीकृत, आदिम (आँकड़े-वार) उपकरण का उपयोग क्यों करें जो एक विशेष उपकरण बहुत बेहतर करता है?" और मैं छह मूल उत्तर देख सकता हूं:

  1. मैं बस एक और भाषा नहीं सीखना चाहता हूं, और जब से मैं पायथन / रूबी / एक्सेल / जावा में अच्छी तरह से वाकिफ हूं, मैं उस भाषा का उपयोग करने पर जोर देता हूं।

  2. मेरे द्वारा किए जाने वाले आँकड़े एक बड़े प्रोजेक्ट (जैसे कि वेब-आधारित टूल) में फिट होने चाहिए और इस प्रोजेक्ट द्वारा उपयोग किए गए उपकरण बाहरी उपकरणों के साथ अच्छा नहीं खेलते हैं, इसलिए मुझे पायथन / रूबी / जावा का उपयोग करना होगा। (या यह एक आवेदन को तैनात करने का मामला हो सकता है और मनमाने ढंग से निष्पादन योग्य लोगों को तैनात करने की कोशिश करना संभव नहीं है।)

  3. मैं एक विशेष उपकरण का उपयोग करूंगा, लेकिन जिन लोगों तक मेरी पहुंच है (जैसे कि आर, जो मुफ़्त है) बहुत धीमी हैं या अपने प्रोजेक्ट के लिए विशाल डेटासेट / रीयल-टाइम आवश्यकताओं को संभाल नहीं सकते हैं।

  4. मेरे नियोक्ता / ग्राहक का कहना है कि मैं सामान्य प्रयोजन की भाषा पायथन / रूबी / एक्सेल / जावा का उपयोग करता हूं। मेरे पास कोई विकल्प नहीं है, और मैं इस आवश्यकता का पालन करने के लिए कम से कम दर्दनाक तरीके की तलाश कर रहा हूं।

  5. "आँकड़ों" से मेरा मतलब बहुत सरल सामान है जैसे कि खोजने के साधन / मंझले, भिन्न, आदि। एक विशेष पैकेज में क्यों खींचें जो MCMC के माध्यम से मिश्रित-प्रभाव वाले मॉडल की गणना कर सकते हैं जब मैं करना चाहता हूं तो गणना करें कि 1-सिग्मा के बाहर कौन से बिंदु हैं। मतलब से दूर?

  6. मैं कुछ बहुत विशेषज्ञ कर रहा हूं, और जिसके लिए आर जैसे सांख्यिकीय पैकेजों में कोई पैकेज / लाइब्रेरी / फ़ंक्शन नहीं है। यह न केवल अत्याधुनिक है, बल्कि सुपर-उच्च प्रदर्शन की आवश्यकता है, और मुझे इसे खरोंच से करने की आवश्यकता है। (या शायद मैं पहले से ही भाषा एक्स में विकसित पुस्तकालयों का उपयोग करें।)

मेरी राय में, उत्तर 1 एक अच्छा नहीं है, उत्तर 2 वैध हो सकता है, लेकिन हो सकता है कि आपके पास काम करने वाले घावों के बारे में पता न हो, उत्तर 3 के वैध होने की अधिक संभावना है, लेकिन वर्कअराउंड भी हो सकता है, और अन्य तीन उत्तरों के लिए , उम्मीद है कि आपको मेरी तुलना में बेहतर उत्तर मिलेगा।


इस प्रश्न में लक्ष्य रूबी के साथ आंकड़ों को सीखना नहीं है, कृपया संपादन देखें, लेकिन अपने विचारों के लिए धन्यवाद और क्षमा करें यदि प्रश्न भ्रामक है तो मुझे उम्मीद है कि यह अब संपादन पर स्पष्ट है।
Oeufcoque Penteano

धन्यवाद, आपने सही पाया । आँकड़ों के ज्ञान पर अनुमान ठीक है, और अब मैं पुस्तकालयों को देख रहा हूँ कि रूबी में ऐसा कैसे करें, जैसे कि यह पायथन के लिए सुझाया गया था। मैं आपके साथ सहमत हूं, कई प्रेरणाएं संभव हैं, लेकिन फिर से (बस इस पृष्ठ पर आने वाले अगले पाठकों के लिए), अपेक्षित जवाब एक है जो पुस्तकालयों का सुझाव देता है और जैसे कि पायथन प्रश्न पर इसका उल्लेख किया गया था। मेरा मानना ​​है कि यदि कई अलग-अलग राय के लिए जगह है, जिसके बारे में आँकड़े उपकरण का उपयोग करते हैं, तो इस समुदाय पर उनके बारे में ज्ञान उपलब्ध कराने के लिए भी है। धन्यवाद!
Oeufcoque Penteano

+1। सबसे अधिक संभावना है, हम अलग-अलग शब्दों के बारे में बात कर रहे हैं जो "सांख्यिकी" हैं। वेबसाइट उपयोग के आँकड़े जिन्हें पायथन या रूबी का उपयोग करके आसानी से लॉग से खींचा जा सकता है, कॉक्स मॉडल या रूबी का उपयोग करके दो-चरण स्तरीकृत सर्वेक्षण के आधार पर कुल के अनुपात अनुमानक के विचरण को कहने की तुलना में एक अलग जानवर है। (किसी को आपके जवाबों की भाषा के रूप में रूबी के बारे में सोचने के लिए आपके उत्तरों 2, 3 और 4 की तर्ज पर पूरी तरह से हताश होना होगा।) जो भी सबसे आसान भाषा में सिमुलेशन के साथ अपने सीखने के आंकड़ों को पूरक कर सकता है, और फिर 1 एक वैध उत्तर है।
StasK

@OecocoquePenteano: अंत में, मुझे लगता है कि मेरा मुद्दा "कार्यक्षेत्र" पर उबलता है। पायथन धागे में जीत का जवाब वास्तव में बहुत संयमी है। सभी सूचीबद्ध संसाधन संयुक्त आर बेस से मेल नहीं खाते हैं, आर पैकेज के बारे में बहुत कम सोच। यदि आपको पायथन में कुछ आँकड़े करने हैं, तो आपके पास कुछ सीमित विकल्प हैं, लेकिन किसी को भ्रमित नहीं होना चाहिए और यह सोचना चाहिए कि पायथन एक अच्छा सांख्यिकीय "कार्यक्षेत्र" बनाता है। मुझे आशा है कि आपको कुछ उत्तर मिलेंगे, लेकिन रूबी अजगर से भी बदतर है।
वेन

@Wayne, यह ठीक है। मैं रूबी, पायथन या एक्सेल के लिए R का आदान-प्रदान करने की योजना नहीं बना रहा हूं। लेकिन मैं यह जानने के लिए उत्सुक हूं कि रूबी को क्या पेशकश करनी है। हो सकता है कि रूबी के कुछ रत्न कुछ अंडों से बेहतर हों (क्या वह अंडा जिसे वे पायथन कहते हैं? निश्चित नहीं), और इसके विपरीत। शायद एक्सेल कुछ चीजों के लिए बेहतर है। उदाहरण के लिए, मुझे लगता है कि एक्सेल कुछ बहुत ही सतही विश्लेषण करने और फिर आर या अन्य उपकरण में गंभीर गोता लगाने में मदद कर सकता है। तो, यह 'एक को चुनने' की बात नहीं है, लेकिन यह जान लें कि प्रत्येक दुनिया में सबसे अच्छा क्या है और उन्हें जानते हुए भी, उस समस्या के लिए अधिक उपयुक्त चुनें। आपके सुझाव के लिए धन्यवाद।
Oeufcoque Penteano

-1

कुछ यादृच्छिक विचार:

  • आप उल्लेख करते हैं कि आप सांख्यिकी सीखने के लिए कार्यक्षेत्र की तलाश कर रहे हैं। IMHO, आपके द्वारा उल्लिखित कोई भी प्लेटफ़ॉर्म आँकड़े सीखने के लिए अच्छा नहीं होगा। विशिष्ट भाषा के वाक्य-विन्यास और शब्दार्थ को सीखने में बहुत अधिक व्याकुलता होगी। यदि आप आंकड़े सीखना चाहते हैं, तो बस एक किताब (मैं तुकी के ईडीए की सिफारिश करता हूं), और शायद एक कैलकुलेटर उठाता हूं। सांख्यिकीय अवधारणाओं के शीर्ष पर एक भाषा सीखना एक अत्यधिक अनावश्यक व्याकुलता है।
  • वह व्यक्ति जो R में धीमे छोरों के बारे में शिकायत करता है वह अपनी अज्ञानता को धोखा दे रहा है: लूप हर भाषा में एक स्वाभाविक निर्माण नहीं है। वे अधिकांश कार्यात्मक प्रोग्रामिंग भाषाओं में धीमी हैं। विकल्प फ़ंक्शन अनुप्रयोग है, और यह आमतौर पर तेज़ है।
  • जब प्रोग्रामिंग भाषाओं की बात आती है, तो गति आपकी अंतिम चिंता होनी चाहिए। एक बहुत, बहुत अधिक महत्वपूर्ण मुद्दा कोड डिबग करने में आसानी है।
  • जब डिबगिंग की बात आती है, तो आर शायद सबसे खराब प्रोग्रामिंग भाषा है जिसे मैं जानता हूं। कभी-कभी कोड को डीबग करना असंभव है। उसके शीर्ष पर, मौजूदा पैकेज के लिए प्रलेखन आमतौर पर बहुत खराब लिखा जाता है। कुल मिलाकर, मेरी सलाह है, यदि आप आर से बच सकते हैं, तो करें।
  • मैं केवल पायथन की सांख्यिकीय सामग्री से परिचित हूं। मेरी समझ यह है कि NumPy वास्तव में पेशेवर रूप से नहीं लिखा गया है और संख्यात्मक मुद्दों को ध्यान में नहीं रखता है।
  • क्या आपने हास्केल पर विचार किया है? यह निश्चित रूप से सर्वश्रेष्ठ प्रोग्रामिंग भाषा है।

नमस्कार! आपकी राय के लिए आपका धन्यवाद। मैं आर। के खिलाफ एक अलग राय देखकर खुश हूं। मैं इस बात पर भी ध्यान दूंगा कि आप क्या कह रहे हैं, क्योंकि मैं यहां वर्णित अन्य साधनों पर भी ध्यान दे रहा हूं। शायद मेरा सवाल भ्रामक था। मैं अभी भी आंकड़े सीख रहा हूं, और वास्तव में आर के बारे में मेरा सवाल इस बारे में था, लेकिन रूबी के लिए यह कुछ अलग है। मैं यह देखने के लिए उत्सुक हूं कि कार्यक्षेत्र के रूप में माणिक के लिए क्या उपलब्ध है जैसे कि यह अजगर और एक्सेल के लिए उपलब्ध है। मैं हास्केल को देखने पर भी विचार करूंगा, लेकिन अगर आपके पास रूबी के बारे में कोई सुझाव है, तो मैं भी सराहना करूंगा! धन्यवाद!
Oeufcoque Penteano

आंकड़ों के लिए हास्केल? एक अनावश्यक व्याकुलता के बारे में बात करें ...
फिलिप क्लाउड

-1, r में डिबग कोड के लिए अभेद्य?
मिपिकटस

मुझे ध्यान देना चाहिए, कि आर में डिबगिंग के बारे में केवल पैराग्राफ इस उत्तर में सही नहीं है। बाकी सब कुछ एक उत्थान के योग्य है। हास्केल को छोड़कर, जिसका मुझे कोई अनुभव नहीं है। लेकिन डिबगिंग के बारे में नोट हाजिर है।
20

1
@cpcloud: गणित और सांख्यिकी की भाषा लंबोदर-कैलकुलस है। हास्केल और कुछ नहीं, लैम्ब्डा-कैलकुलस है। गणितीय निर्माण हास्केल में ठीक उसी तरह व्यक्त किए जाते हैं जिस तरह वे गणित की किताब में लिखे होते हैं। उसके कारण, भाषा से उपरि लगभग शून्य है। वास्तव में, पुस्तक "द हास्केल रोड टू लॉजिक" हास्केल का उपयोग करके गणित सिखाती है। मेरा सुझाव है कि आप उस पुस्तक पर एक नज़र डालें।
user765195
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.