पर्यावरणीय आंकड़ों के आधार पर फसल की पैदावार की भविष्यवाणी करने के लिए मशीन लर्निंग मॉडल का निर्माण


10

मेरे पास एक डेटासेट है जिसमें 10 साल (2005 - 2014) के लिए एक खेत के तापमान, वर्षा और सोयाबीन की पैदावार के आंकड़े हैं। मैं इस डेटा के आधार पर 2015 के लिए पैदावार की भविष्यवाणी करना चाहता हूं।

कृपया ध्यान दें कि डेटासेट में तापमान और वर्षा के लिए दैनिक मूल्य हैं, लेकिन उपज के लिए प्रति वर्ष केवल 1 मूल्य है, क्योंकि फसल की कटाई फसल के बढ़ते मौसम के अंत में होती है।

मैं पिछले वर्षों में पैदावार और तापमान और वर्षा के बीच के संबंध का अध्ययन करके प्राप्त प्रतिगमन / कुछ अन्य मॉडल के आधार पर, 2015 की पैदावार के लिए एक प्रतिगमन या कुछ अन्य मशीन लर्निंग आधारित मॉडल का निर्माण करना चाहता हूं।

मैं scikit-learn का उपयोग करके मशीन लर्निंग के प्रदर्शन से परिचित हूं। हालांकि, यह निश्चित नहीं है कि इस समस्या का प्रतिनिधित्व कैसे करें। यहाँ मुश्किल हिस्सा यह है कि तापमान और वर्षा दैनिक होती है, लेकिन उपज प्रति वर्ष सिर्फ 1 मूल्य है।

मैं यह कैसे संपर्क करूं?


यहां तक ​​कि मैं फसल की उपज की भविष्यवाणी करने के लिए एक मॉडल बनाने की कोशिश कर रहा हूं। क्या आप कृपया उस दृष्टिकोण के बारे में विवरण साझा कर सकते हैं जिसका आप अनुसरण कर रहे हैं?
Nitz

क्या आप एक पूर्ण उत्तर प्राप्त करने में सक्षम थे। यदि नहीं, तो कृपया मुझे बताएं और मुझे इस बारे में विस्तृत जवाब लिखने में खुशी होगी कि इसके बारे में जाने के लिए मैं एक ही डोमेन में काम करता हूं
89_Simple

@ Crop89, यह बहुत अच्छा होगा! आपके उत्तर की प्रतीक्षा कर रहा हूँ
user308827

क्या आपने इसका पता लगाया है? मैं उसी समस्या का सामना कर रहा हूं। यदि आपने इसे काम किया है तो क्या आप विवरण साझा कर सकते हैं? बहुत धन्यवाद
eric huang

जवाबों:


3

शुरुआत के लिए, आप पिछले वर्ष के दैनिक आंकड़ों के आधार पर आगामी वर्ष के लिए उपज का अनुमान लगा सकते हैं। आप प्रत्येक वर्ष के डेटा को "बिंदु" के रूप में मानकर मॉडल मापदंडों का अनुमान लगा सकते हैं, फिर क्रॉस-सत्यापन का उपयोग करके मॉडल को मान्य कर सकते हैं। आप पिछले वर्ष की तुलना में अधिक विचार करके इस मॉडल का विस्तार कर सकते हैं, लेकिन बहुत पीछे देखें और आपको अपने मॉडल और ओवरफिट को मान्य करने में परेशानी होगी।


धन्यवाद @ मेरी, मेरी उलझन यह है कि मैं पूरे 1 वर्ष के डेटा को 1 अंक के रूप में कैसे मानूं? क्या डेटा की प्रत्येक पंक्ति (एक दिन का प्रतिनिधित्व करते हुए) scikit-learn नामकरण में एक नमूना नहीं है? मैं 365 के बजाय एक पूरे साल को एक नमूना कैसे मानूं?
user308827

1
मैं sklearn की बारीकियों को संबोधित नहीं कर रहा था, लेकिन जब से आपने पूछा था, आप sklearn.cross_validationनाम में "लेबल" के साथ तरीकों का उपयोग करना चाहते हैं , जैसे कि sklearn.cross_validation.LabelKFold
एमरे

धन्यवाद @Emre, इसलिए विचार है कि हर साल एक ही लेबल असाइन किया जाए, है ना?
user308827

हां, @ user308827
Emre

धन्यवाद फिर से @Emre, कृपया अनुवर्ती प्रश्न पर एक नज़र डालें: datascience.stackexchange.com/questions/9612/…
user308827


1

आपके पास प्रत्येक डेटा बिंदु के साथ 10 डेटा बिंदु हैं, जिसमें 365 (प्रत्येक दिन का तापमान) + 365 (प्रत्येक दिन के लिए वर्षा) आयाम हैं। आदर्श रूप में, मैं पहले मशीन सीखने के तरीकों, जैसे पीसीए के माध्यम से आयामों को कम करूंगा। फिर एक भविष्यवाणी मॉडल बनाने के लिए मशीन सीखने के तरीकों का उपयोग करें। हालाँकि, छोटे डेटासेट के कारण, मुझे नहीं लगता कि मशीन सीखने की तकनीक आपकी समस्या के लिए उपयुक्त है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.