पायथन मशीन लर्निंग / डाटा साइंस प्रोजेक्ट स्ट्रक्चर


10

मुझे जानकारी मिल रही है कि पायथन मशीन लर्निंग प्रोजेक्ट को कैसे व्यवस्थित किया जाना चाहिए। पाइथन की सामान्य परियोजनाओं के लिए कुकिसेटर है और आर प्रोजेक्टटेम्पलेट के लिए

यह मेरी वर्तमान फ़ोल्डर संरचना है, लेकिन मैं ज्यूपिटर नोटबुक को वास्तविक पायथन कोड के साथ मिला रहा हूं और यह बहुत स्पष्ट नहीं लगता है।

.
├── cache
├── data
├── my_module
├── logs
├── notebooks
├── scripts
├── snippets
└── tools

मैं स्क्रिप्ट फ़ोल्डर में काम करता हूं और वर्तमान में my_module के तहत फ़ाइलों में सभी फ़ंक्शन जोड़ रहा हूं, लेकिन इससे डेटा लोड करने में त्रुटि होती है (सापेक्ष / निरपेक्ष पथ) और अन्य समस्याएं।

मुझे इस विषय पर कुछ कागज़ प्रतियोगिता समाधानों और कुछ नोटबुक के अलावा उचित सर्वोत्तम अभ्यास या अच्छे उदाहरण नहीं मिल पाए हैं , जिनमें ऐसे नोटबुक की शुरुआत में सभी कार्य सम्मिलित हैं।


देखें कि क्या यह मदद करता है (कोई व्यक्तिगत अनुभव नहीं)।
एमरे १

जवाबों:


4

मुझे नहीं लगता कि इस विकासशील क्षेत्र में अभी तक सर्वोत्तम प्रथाएं हैं, लेकिन कुकिसेटर के अलावा, SciPy 2016 सम्मेलन में एक ट्यूटोरियल में दिखाए गए कुछ दिलचस्प विचार थे: http://isaacslavitt.com/2016/07/20/ डेटा-विज्ञान है-सॉफ्टवेयर बात /

व्यक्तिगत रूप से, मैं एक परियोजना में उप-फ़ोल्डरों की संख्या को कम करने की कोशिश करता हूं जब तक कि मेरे पास उन्हें अलग करने के लिए वास्तव में अच्छा तरीका न हो और उन्हें अलग रखने का अच्छा कारण हो। बुरा संगठन लगभग उतना ही बुरा है जितना कोई संगठन। मुझे लगता है कि सबसे अच्छा अभ्यास उपयोग के मामले पर निर्भर हो सकता है - प्रत्येक परियोजना को बॉयलरप्लेट की समान मात्रा की आवश्यकता नहीं होती है।


3

वाशिंगटन विश्वविद्यालय ने छोटे वैज्ञानिक अजगर परियोजनाओं (डेटा विज्ञान परियोजनाओं सहित) के लिए एक परियोजना टेम्पलेट जारी किया है shablona। क्या वह कमोबेश वही है जिसकी आपको तलाश है?

https://github.com/uwescience/shablona

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.