पैनल डेटा के लिए मशीन लर्निंग एल्गोरिदम


12

इस सवाल में - क्या निर्णय पेड़ों के निर्माण के लिए एक विधि है जो संरचित / पदानुक्रमित / बहुस्तरीय भविष्यवक्ताओं का ध्यान रखती है? - वे पेड़ों के लिए एक पैनल डेटा विधि का उल्लेख करते हैं।

क्या वेक्टर मशीनों और तंत्रिका नेटवर्क के समर्थन के लिए विशिष्ट पैनल डेटा विधियां हैं? यदि हां, तो क्या आप एल्गोरिदम के लिए कुछ कागजात का हवाला दे सकते हैं और (यदि उपलब्ध हो) आर पैकेज इसे लागू कर रहे हैं?


1
मैं सोच रहा था कि आपने इसके लिए क्या उपयोग करने का फैसला किया है? इसी तरह की समस्या को हल करने की कोशिश की जा रही है।
user0

जवाबों:


1

LSTM (लॉन्ग शॉर्ट टर्म मेमोरी) आपके लिए प्रासंगिक हो सकता है। इस प्रकार का मॉडल समय में कई बिंदुओं में कई विशेषताओं को संभाल सकता है, जो पैनल डेटा को फिट करना चाहिए। यहाँ एलएसटीएम की अवधारणा पर एक बहुत अच्छी व्याख्या है, और यहां एक पैकेज है जो एलएसटीएम के आर संस्करण को लागू करता है।


1

जब आपके पास पैनल डेटा होता है, तो एक अलग कार्य होता है जिसे आप हल करने का प्रयास कर सकते हैं, जैसे समय श्रृंखला वर्गीकरण / प्रतिगमन या पैनल पूर्वानुमान। और प्रत्येक कार्य के लिए, इसे हल करने के लिए कई दृष्टिकोण हैं।

जब आप पैनल पूर्वानुमान को हल करने के लिए मशीन सीखने के तरीकों का उपयोग करना चाहते हैं, तो कई दृष्टिकोण हैं:

अपने इनपुट डेटा (एक्स) के बारे में, ईद के नमूनों के रूप में इकाइयों (जैसे देशों, व्यक्तियों, आदि) का इलाज करके आप कर सकते हैं

  • बिन समय श्रृंखला और प्रत्येक बिन को एक अलग स्तंभ के रूप में मानते हैं, सभी इकाइयों के लिए समान डिब्बे के साथ किसी भी अस्थायी आदेश की अनदेखी करते हुए, बिन आकार निश्चित रूप से मनाया गया समय श्रृंखला माप हो सकता है, या आप बड़े डिब्बे में उतार-चढ़ाव कर सकते हैं, फिर सारणीबद्ध डेटा के लिए मानक मशीन लर्निंग एल्गोरिदम का उपयोग करें,
  • या प्रत्येक इकाई के लिए समय श्रृंखला से विशेषताएं निकालें, और प्रत्येक निकाले गए फीचर को एक अलग कॉलम के रूप में उपयोग करें, फिर से मानक सारणीबद्ध एल्गोरिदम के साथ संयुक्त करें,
  • या विशेष समय श्रृंखला प्रतिगमन / वर्गीकरण एल्गोरिदम का उपयोग करें, इस पर निर्भर करते हुए कि आप निरंतर या श्रेणीबद्ध समय श्रृंखला डेटा का निरीक्षण करते हैं, इसमें विशेष कर्नेल के साथ समर्थन वेक्टर मशीनें शामिल हैं जो समय श्रृंखला के साथ समय श्रृंखला की तुलना करती हैं।

अपने आउटपुट डेटा (y) के बारे में, यदि आप भविष्य में कई समय बिंदुओं का पूर्वानुमान लगाना चाहते हैं, तो आप कर सकते हैं

  • प्रत्येक कदम के लिए एक अनुमानक को फिट करें जिसे आप पूर्वानुमान करना चाहते हैं, हमेशा एक ही इनपुट डेटा का उपयोग करते हुए,
  • या पहले कदम के लिए और अनुमान में एक एकल अनुमानक फिट, समय में इनपुट डेटा रोल, दूसरे कदम की भविष्यवाणी करने के लिए मनाया इनपुट डेटा के लिए संलग्न करने के लिए पहला कदम भविष्यवाणियों का उपयोग कर और इतने पर।

उपरोक्त सभी दृष्टिकोण मूल रूप से एक समय श्रृंखला प्रतिगमन या सारणीबद्ध प्रतिगमन समस्या के लिए पैनल पूर्वानुमान समस्या को कम करते हैं। एक बार जब आपका डेटा समय श्रृंखला या सारणीबद्ध प्रतिगमन प्रारूप में होता है, तो आप उपयोगकर्ताओं के लिए किसी भी समय-अपरिवर्तनीय सुविधाओं को भी जोड़ सकते हैं।

निश्चित रूप से पैनल पूर्वानुमान समस्या को हल करने के लिए अन्य विकल्प हैं, उदाहरण के लिए शास्त्रीय पूर्वानुमान विधियों का उपयोग करना जैसे ARIMA पैनल डेटा या गहरी सीखने के तरीकों के लिए अनुकूलित है जो आपको सीधे पूर्वानुमान की अनुक्रम बनाने की अनुमति देता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.