किसी भी छोटे डेटाबेस प्रसंस्करण को पायथन / पर्ल / ... लिपियों द्वारा आसानी से निपटा जा सकता है, जो भाषा से ही पुस्तकालयों और / या उपयोगिताओं का उपयोग करता है। हालाँकि, जब प्रदर्शन की बात आती है, तो लोग C / C ++ / निम्न-स्तरीय भाषाओं के लिए पहुँचते हैं। कोड को जरूरतों के अनुरूप बनाने की संभावना प्रतीत होती है कि ये भाषाएं बिगडाटा के लिए कितनी आकर्षक हैं - क्या यह स्मृति प्रबंधन, समानता, डिस्क एक्सेस या यहां तक कि निम्न-स्तरीय अनुकूलन (सी / सी ++ स्तर पर विधानसभा निर्माण के माध्यम से) से संबंधित है।
बेशक इस तरह के लाभ का एक सेट बिना लागत के नहीं आएगा: कोड लिखना, और कभी-कभी पहिया को फिर से मजबूत करना भी काफी महंगा या थकाऊ हो सकता है। हालाँकि बहुत सारी लाइब्रेरियाँ उपलब्ध हैं, फिर भी जब भी उन्हें प्रदर्शन प्रदान करने की आवश्यकता होती है, लोग स्वयं ही कोड लिखने के लिए इच्छुक होते हैं । बड़े डेटाबेस को संसाधित करते समय पुस्तकालयों का उपयोग करने से प्रदर्शन पर क्या असर पड़ता है?
उदाहरण के लिए, एक आक्षेप पर विचार करें जो लगातार वेबपेजों को क्रॉल करता है और एकत्र किए गए डेटा को पार्स करता है। प्रत्येक स्लाइडिंग-विंडो के लिए, निकाले गए डेटा पर अलग-अलग डेटा माइनिंग एल्गोरिदम चलाए जाते हैं। क्यों उपलब्ध पुस्तकालयों / चौखटों का उपयोग करके डेवलपर्स इसे बंद कर देंगे (यह क्रॉलिंग, टेक्स्ट प्रोसेसिंग और डेटा माइनिंग के लिए हो सकता है)? पहले से लागू सामान का उपयोग करने से न केवल पूरी प्रक्रिया को कोड करने का बोझ कम हो जाएगा, बल्कि बहुत समय भी बचेगा।
एक ही शॉट में :
- क्या प्रदर्शन की गारंटी के द्वारा कोड लिखने से क्या होता है ?
- जब आपको उच्च प्रदर्शन का आश्वासन देना हो तो चौखटे / पुस्तकालयों पर निर्भर रहना क्यों जोखिम भरा है ?