पेरोइल जैव सूचना विज्ञान में इतना भारी क्यों इस्तेमाल किया जाता है? [बन्द है]


14

यह पर्ल के बारे में क्या है जो इसे जैव सूचना विज्ञान में इतना उपयोगी बनाता है? C ++ या Matlab या Python बड़ी भाषा क्यों नहीं है?

जवाबों:


13

बायोइंफॉर्मेटिक्स के लिए पर्ल इतना उपयोगी है कि 1) सीखने के लिए एक अपेक्षाकृत आसान भाषा है, 2) बायोप्लेर और 3 सहित उपयोग करने के लिए पूर्व-विद्यमान स्क्रिप्ट के बहुत सारे हैं) संभावना है कि आपके द्वारा सैकड़ों स्क्रिप्ट और मॉड्यूल में काम करने वाली लैब हैं पहले से ही पर्ल में लिखा है।

प्रोग्रामर का स्तर भाषा की पसंद से कम होता है, फिर उससे पूछे जाने वाले कार्य। किसी भी उन्नत या कम्प्यूटेशनल रूप से महंगी नौकरियों को आमतौर पर जावा, या सी में लिखा जाता है, और एक क्लस्टर पर चलाया जाता है।

जैव सूचना विज्ञान के बारे में समझने वाली एक बात यह है कि यह एक विविध क्षेत्र है, जिसमें अभ्यास करने वालों से विविध कार्य पूछे जाते हैं। यह मेरे लिए एक दिन में पर्ल, आर और जावा का उपयोग करने के लिए असामान्य नहीं है। सामान की स्क्रिप्टिंग के लिए पर्ल, चलती हुई चीजें, डाउनलोड करने की चीजें, कुछ बुनियादी डेटा विश्लेषण आदि, डेटा विज़ुअलाइज़ेशन के लिए आर, और एल्गोरिथ्म कम्प्यूटेशन / अनुप्रयोगों के साथ जावा और अनुप्रयोगों को संशोधित करने के लिए। कहा जा रहा है कि, अधिकांश कार्यों के लिए मुझे पर्ल के उपयोग की आवश्यकता होती है, हालांकि, मैं रूबी पर स्विच करना चाहूंगा, क्योंकि इसमें अधिक उन्नत फ़ंक्शन, लैम्ब्डा और प्रोक्स हैं, जो अधिक रसीला कोड का नेतृत्व कर सकते हैं और पूरी तरह से ऑब्जेक्ट ओरिएंटेड हैं।


1
आपका स्वागत है। यदि आपके कोई और प्रश्न हैं, या क्षेत्र में जाने के बारे में सोच रहे हैं, तो यहां एक और प्रतिक्रिया है जो आपकी मदद कर सकती है।
वेस्पिसरा


24

पेरल के निहित गुणों के अलावा, इसका हिस्सा केवल इतिहास है। मानव जीनोम परियोजना के कारण सदी के मोड़ पर जैव सूचना विज्ञान का एक बड़ा विस्तार हुआ। उस समय तक पर्ल सामान्य उपयोग की सबसे लोकप्रिय स्क्रिप्टिंग भाषा थी । रूबी और पायथन निश्चित रूप से आसपास थे, लेकिन आज उनके पास लगभग समर्थन / दिमाग का हिस्सा नहीं था। इससे पर्ल को मैदान में काफी गति मिली।

मुझे लगता है कि जैव सूचना विज्ञान में पर्ल का उपयोग घट रहा है, और आर तेजी से लोकप्रियता में वृद्धि कर रहा है। लेकिन किसी भी भाषा के लिए जिसका आप नाम रखते हैं, आप संभवतः इसका उपयोग करके जैव सूचना विज्ञान प्रयोगशाला पा सकते हैं।


2
माना। मुझे एक लेख याद है, मैं 90 के दशक के मध्य में डॉ। डॉब्स या उस चीज़ पर विश्वास करता हूं, जिसका शीर्षक था "हाउ पर्ल ने ह्यूमन जीनोम प्रोजेक्ट को कैसे बचाया" या इसके काफी करीब। मैंने अब लगभग 10 वर्षों के लिए जैव सूचना विज्ञान अंतरिक्ष में काम किया है, और अभी तक वास्तव में पर्ल का उपयोग करते हुए किसी से मुठभेड़ करना है। यह ज्यादातर मतलाब और अजगर की कम राशि के साथ आर है।
जियोफिजेंट्री

6
इसकी तरह R, पर्ल की जगह लेने वाला नहीं है। खोज डेटा के लिए डेटा विश्लेषण / विज़ुअलाइज़ेशन के लिए R का उपयोग किया जाता है। सामान्य स्क्रिप्टिंग कार्य अभी भी पर्ल के साथ किए जाएंगे।
वेस्पिसर

+1: इसके अलावा, ऐसा लगता है कि जापानी अभी भी पायथन या रूबी की तुलना में बहुत अधिक पर्ल का उपयोग करते हैं (एक जापानी रंगरूट के साथ मैं चैट करता हूं), इसलिए शायद इसका एक बड़ा प्रभाव पड़ता है, जिस पर जापानी अनुसंधान के साथ प्रौद्योगिकियां शामिल थीं, जैसे जैव सूचना विज्ञान में, जहां वे अमेरिका के साथ नेता हैं?
शाम

@geoffjentry: मैंने पर्ल में काफी प्रोसेसिंग की है, हालाँकि मेरे पास 10 साल नहीं हैं (2, अब तक, कुछ साल पहले कुछ छोटे अनुभव हैं)। आर, हालांकि, राजा है जब गणितीय संगणना अपेक्षित होती है (बड़े डेटासेट पर सांख्यिकीय विश्लेषण दिमाग में आता है) और अच्छी विज़ुअलाइज़ेशन उत्पन्न करने के लिए (वास्तव में बहुत सारे समाधान आर इंजन के साथ एकीकृत करने के बजाय अपने स्वयं के रोल करने के लिए पसंद करते हैं)।
हेलेम

8 महीने में जब से मैंने लिखा कि मुझे अपने बयान को याद करना है, मैंने अब देखा है पर्ल का इस्तेमाल किया :)। उन मामलों में हालांकि यह अभी भी एक ऐतिहासिक प्रकृति का लगता है - या तो पुराने कोड या कोई है जो पर्ल का उपयोग करके अपने दांत काटते हैं और बस इसके साथ अटक जाते हैं। मेरी नई नौकरी के अधिकांश कम्प्यूटेशनल जीवविज्ञानी अजगर और आर के कुछ मिश्रण (व्यक्ति के आधार पर) का उपयोग करते हैं, जिसमें कुछ मैटलैब और उपरिलिखित पर्ल होते हैं।
जियोफॉजेंट्री

10

मैं यहाँ एक उत्तर जोड़ने जा रहा हूँ क्योंकि मुझे लगता है कि उनमें से बहुत से एक महत्वपूर्ण बिंदु छूट गया है ...

पर्ल जैव-सूचना विज्ञान में लोकप्रिय है क्योंकि यह मूल रूप से एक टेक्स्ट-प्रोसेसिंग भाषा है

पाठ राजा है

पर्ल इसे आसान बनाता है:

  • एनएलपी और जैव-सूचना विज्ञान एल्गोरिदम लागू करें,
  • पाठ डेटा निकालें,
  • पाठ डेटा उत्पन्न करते हैं।

भाषा (आधा) बुरा नहीं है

यह होने के भी लाभ हैं:

  • एक सभ्य अभिव्यक्ति ,
  • अपेक्षाकृत कम सीखने की अवस्था (जब तक कि आपके सभी ट्रिक्स और हैक्स की खोज नहीं हो जाती) ,
  • लेकिन एक अच्छा प्रदर्शन भी ।

हालांकि, यह सी के बराबर के रूप में तेजी से चल रहे प्रसंस्करण कार्यक्रमों को बनाने की अनुमति नहीं देगा, विकास का समय बहुत हीन है और यह बैटरी प्रसंस्करण के साथ आता है जब यह पाठ प्रसंस्करण ( शक्तिशाली नियमित अभिव्यक्ति , किसी को?) की बात आती है , इस प्रकार यह आसान बना देता है? इन कार्यों को हल करने के लिए एक प्रयोगशाला संदर्भ में लेने और उपयोग करने के लिए।

पोर्टेबिलिटी और एक्स्टेंसिबिलिटी मेड ईज़ी

इसके अलावा, यह भी स्पष्ट रूप से:

  • कई प्लेटफार्मों में पोर्टेबल है ,
  • एक्सटेंशन की एक बहुत बड़ी लाइब्रेरी के साथ आता है ।

लेकिन पहली जगह में पर्ल के लिए इतने सारे जैव सूचना विज्ञान (और सामान्य रूप से वैज्ञानिक) विस्तार और मॉड्यूल क्यों हैं, इसका कारण ऊपर दिए गए कारण हैं। एक महान कई मामलों में, भाषा की डिज़ाइन और क्षमताएं इसे नौकरी के लिए लगभग सही फिट बनाती हैं (कई संभावित grudges के बावजूद इसे पकड़ सकती हैं)।


यह सब पर्ल को वैज्ञानिक अनुसंधान के लिए एक अच्छा दावेदार बनाता है, खासकर उन क्षेत्रों में जहां प्रक्रिया करने के लिए डेटा ज्यादातर पाठ प्रारूप में होता है।

बेशक, अन्य भाषाएं उभरी हैं और अलग-अलग कारणों से बाजार हिस्सेदारी का दावा करती हैं (बढ़ी हुई अभिव्यक्ति, बेहतर पठनीयता, स्पष्ट रूप से अस्पष्ट हैक और गुरु-एक-लाइनर ...) से बचें, लेकिन वे अभी भी कुछ पहलुओं (रूबी) पर पर्ल के साथ प्रतिस्पर्धा करते हैं उदाहरण के लिए, डेटा को प्रोसेस करने की गति जितनी धीमी है, सीखने के लिए उतनी ही तेजी से)। तो, जैव सूचना विज्ञान (या एनएलपी) के क्षेत्र में जहां आप पाठ प्रारूपों, त्वरित अनुसंधान चक्रों और अधिक से अधिक बड़े डेटा से निपटते हैं जो बड़ा होता रहता है (धन्यवाद, जीनोमिक्स और एनजीएस), पर्ल अभी भी बहुत प्रासंगिक है।


वास्तव में, बस मेपल_शाफ्ट , चार्ल्स और जियोफिजेंट्री की टिप्पणियों पर ध्यान दिया गया, जिसमें नियमित रूप से अभिव्यक्ति के महत्व का उल्लेख किया गया था, इसलिए हर किसी ने इस पर ध्यान नहीं दिया। :)


6

जैव सूचना विज्ञान में पर्ल की लोकप्रियता के पीछे एक बड़ा कारण बायोप्रेरल है , जो प्रासंगिक डेटा के साथ काम करने के लिए मॉड्यूल का एक व्यापक सेट है।

ऐसा लगता है कि अधिकांश मॉड्यूल वास्तव में अन्य कार्यक्रमों द्वारा उत्पन्न डेटा के साथ काम करने के लिए डिज़ाइन किए गए हैं। पर्ल उत्कृष्ट रिपोर्टिंग डक्ट टेप के लिए बनाता है , आखिरकार।


5

ऑपरेटरों के कौशल स्तर और गोद लेने में आसानी द्वारा उपकरण का चयन किया जाता है - एक सरल व्याख्या की गई भाषा से आगे निकलने के लिए संकलित कार्यक्रम या आईडीई के लिए कुछ समय लगता है।

पर्ल में कुछ गंभीर चॉप्स, गंभीर डॉक्यूमेंटेशन, गंभीर लाइब्रेरियां और व्यापक मुफ्त उपलब्धता है। उस के बारे में क्या पसंद नहीं है?


2

पर्ल में सभी समान क्षमताएँ, डेटा निर्माण और अन्य भाषाओं की विधियाँ हैं, और फिर इसे सीखना आसान है। यह शोधकर्ताओं और वैज्ञानिकों के लिए प्रोग्रामिंग के साथ बहुत अनुभवी नहीं है, क्योंकि वे आसानी से पर्ल उठा सकते हैं और अपना इच्छित कार्य प्राप्त कर सकते हैं।

इसके अतिरिक्त:

ऑनलाइन समर्थन और मुफ्त लिपियों के बहुत सारे उपलब्ध हैं जो स्पष्ट रूप से लाभप्रद हैं! =)

संक्षेप में, अधिकांश वैज्ञानिक और शोधकर्ता बस काम को पूरा करना चाहते हैं, और जितनी जल्दी हो सके और पर्ल उसके लिए एकदम सही है

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.