पंडों और NumPy + SciPy के बीच पायथन में क्या अंतर हैं? [बन्द है]


195

वे दोनों समान रूप से समान लगते हैं और मैं उत्सुक हूं कि वित्तीय डेटा विश्लेषण के लिए कौन सा पैकेज अधिक फायदेमंद होगा।

जवाबों:


313

पंडों को न्यूमपी के शीर्ष पर निर्मित उच्च स्तरीय डेटा हेरफेर उपकरण प्रदान करता है। MATPAB के समान ही NumPy अपने आप में एक निम्न स्तर का उपकरण है। दूसरी ओर पांडा समृद्ध समय श्रृंखला कार्यक्षमता, डेटा संरेखण, एनए-अनुकूल आंकड़े, समूह, विलय और विधियों में शामिल होने, और बहुत सारी अन्य सुविधाएं प्रदान करते हैं। यह हाल के वर्षों में वित्तीय अनुप्रयोगों में बहुत लोकप्रिय हो गया है। मेरे पास मेरी आगामी पुस्तक में पांडा के उपयोग से वित्तीय डेटा विश्लेषण के लिए एक अध्याय होगा।


216
आपने उल्लेख किया है कि आप पांडा के प्राथमिक लेखक हैं। :) विचाराधीन पुस्तक: shop.oreilly.com/product/0636920023784.do
यत्कुला

3
क्या यह कहना उचित होगा कि सुन्न मुख्य रूप से कुशल सरणियाँ प्रदान करते हैं, जबकि पांडा कुशल शब्दकोश प्रदान करते हैं? (दोनों ही मामलों में, मुफ्त फॉर्म के बजाय लगातार डेटा टाइप तक सीमित है।) मेरे लिए (मैं अभी इस पर गौर करना शुरू कर रहा हूं), यह मुझे अंतर्निहित अंतर के रूप में हमला करता है: लेबल-युग्मित डेटा को हैंडल करना (1 डी उर्फ ​​डाइक में) 2d उर्फ ​​टेबल)। डेटा संरेखण, शामिल होना, आदि सभी इसके कारण संभव हो जाते हैं , लेकिन उन लोगों के लिए जो उस अंतर को नहीं खोते हैं, यह भी स्पष्ट नहीं है कि उन लोगों का क्या मतलब है (जैसे, दो संख्यात्मक सरणियों का "डेटा संरेखण"?)।
ब्रैंडिन

6
एक नासमझ सवाल हो सकता है लेकिन आप क्या मतलब है NA-friendly statistics, अपने जवाब में उल्लेख किया है।
आदिल अब्बासी

6
मुझे लगता है, वह लापता डेटा (NA, "उपलब्ध नहीं है") को ध्यान में रखते हुए आँकड़े को संदर्भित करता है
user1319128

4
ठंडा धागा, लेकिन प्रदर्शन के बारे में क्या अंतर है, उदाहरण के लिए, खांसी में एक जटिल ऑपरेशन को बीडब्ल्यू, लेकिन सरल रूप से पंडों में सरल बना दिया? क्या उच्च-स्तरीय, आसान सिंटैक्स पथ पर जाने के लिए प्रदर्शन लागत है?
3pitt

59

नंदी की आवश्यकता पंडों द्वारा होती है (और पायथन के लिए लगभग सभी संख्यात्मक उपकरण)। पांडा के लिए पपड़ी की सख्त आवश्यकता नहीं है, लेकिन इसे "वैकल्पिक निर्भरता" के रूप में सूचीबद्ध किया गया है। मैं यह नहीं कहूंगा कि पांडा Numpy और / या Scipy के लिए एक विकल्प है। बल्कि, यह एक अतिरिक्त उपकरण है जो पायथन में संख्यात्मक और सारणीबद्ध डेटा के साथ काम करने का अधिक सुव्यवस्थित तरीका प्रदान करता है। आप पंडों की डेटा संरचनाओं का उपयोग कर सकते हैं, लेकिन उन्हें हेरफेर करने के लिए स्वतंत्र रूप से Numpy और Scipy फ़ंक्शन पर आकर्षित करते हैं।


4

पंडों ने तालिकाओं में हेरफेर करने का एक शानदार तरीका पेश किया, क्योंकि आप बिनिंग को आसान बना सकते हैं ( पायथन में पंडों में एक डेटाफ्रेम को कम करना ) और आंकड़ों की गणना करना। पंडों में एक और चीज जो महान है वह है पैनल क्लास जिसे आप विभिन्न गुणों के साथ परतों की श्रृंखला में शामिल कर सकते हैं और ग्रुपबी फ़ंक्शन का उपयोग करके इसे जोड़ सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.