मशीन अनुदैर्ध्य डेटा के लिए सीखने की तकनीक


11

मैं सोच रहा था कि क्या अनुदैर्ध्य डेटा मॉडलिंग के लिए कोई मशीन सीखने की तकनीक (अनसुना) थी? मैंने हमेशा मिश्रित प्रभाव वाले मॉडल (ज्यादातर गैर-रैखिक) का उपयोग किया है, लेकिन मैं सोच रहा था कि क्या ऐसा करने के अन्य तरीके हैं (मशीन सीखने का उपयोग करके)।

मशीन लर्निंग से मेरा मतलब है रैंडम फॉरेस्ट, क्लासिफिकेशन / क्लस्टरिंग, डिसीजन ट्रीज और डीप लर्निंग आदि।


क्या आप कृपया "मशीन लर्निंग" से क्या मतलब निकाल सकते हैं? आप उपयुक्त स्तरीकरण के बाद एलएमई को बढ़ावा दे सकते हैं। यह वास्तव में सुंदर उपन्यास होगा!
us --r11852

@ us @r11852, मैंने प्रश्न के लिए थोड़ा और स्पष्टीकरण जोड़ दिया है-उम्मीद है कि यह इसे थोड़ा और स्पष्ट करता है।
जॉन_डेक्स

आह ... तो अपनी परिभाषा के अनुसार बूस्टिंग एमएल नहीं है। स्पष्टीकरण के लिए कूल थैंक्स उम्मीद है कि इसे जल्द ही कुछ ध्यान मिलेगा।
us --r11852

... और बढ़ावा भी।
John_dydx

3
यह प्रश्न काफी अस्पष्ट प्रतीत होता है। "मशीन लर्निंग" एक व्यापक शब्द है, और यहां तक ​​कि "यादृच्छिक वन, वर्गीकरण / क्लस्टरिंग, निर्णय वृक्ष और यहां तक ​​कि गहरे पेड़, आदि" की श्रेणियां भी हैं। काफी व्यापक हैं। क्या कोई स्पष्ट अनुप्रयोग है जिसमें आप रुचि रखते हैं? यदि, उदाहरण के लिए, आपको डाइकोटोमस आउटपुट को वर्गीकृत करने की आवश्यकता है, तो आप लॉजिस्टिक मिश्रित प्रभाव मॉडल या लॉजिस्टिक जीईई का उपयोग कर सकते हैं। मशीन सीखना और सांख्यिकीय मॉडल अलग-अलग चीजों के लिए जरूरी नहीं हैं।
जॉन

जवाबों:


7

मामले में जहां एक विषय से कई अवलोकन होते हैं (जैसे, एक ही रोगी से कई दौरे), तो 'रोगी आईडी' एक 'समूहीकरण' चर है। मॉडल मूल्यांकन के दौरान ध्यान रखा जाना चाहिए ताकि एक ही रोगी से मिलने वाले प्रशिक्षण और परीक्षण दोनों डेटा में दिखाई न दें, क्योंकि ये सहसंबद्ध हैं और वर्गीकरण सटीकता की मुद्रास्फीति का कारण बनेंगे

पार सत्यापन sklearn प्रलेखन समूहीकृत आंकड़ों के लिए पार सत्यापन iterators है। देखें GroupKFold , LeaveOneGroupOut , और LeavePGroupsOut

और भी बेहतर, आवर्तक तंत्रिका नेटवर्क या छिपे हुए मार्कोव मॉडल का प्रयास करें


4

आप अपने अनुदैर्ध्य को मानक मशीन लर्निंग के तरीकों से जोड़ सकते हैं, केवल सुविधाओं को जोड़कर, जो अनुदैर्ध्यता का प्रतिनिधित्व करते हैं, जैसे कि समय का प्रतिनिधित्व करने वाली विशेषता को जोड़कर। या एक विशेषता जो किसी समूह, व्यक्ति आदि की सदस्यता को इंगित करती है (पैनल डेटा मामले में)।

यदि आप फीचर निर्माण / निष्कर्षण के साथ रचनात्मक हैं, तो आप एमएल-एल्गोरिदम के साथ कुछ भी मॉडल कर सकते हैं।


1
@PhlippePro, मैं इस उत्तर के बारे में थोड़ा भ्रमित हूं। (१) यदि आप किसी ऐसे व्यक्ति के लिए भविष्यवाणी करना चाहते हैं जो आपके प्रशिक्षण सेट में नहीं है? आपके पास प्रशिक्षण प्रशिक्षण सेट में केवल उन लोगों के लिए गुणांक है, है ना? (२) एक सुविधा जोड़ना जो व्यक्ति से मेल खाती हो, १,००,००० से अधिक नए डमी वैरिएबल्स के अतिरिक्त हो सकता है, यह मानते हुए कि आपके डेटासेट में १००,००० लोग हैं। ये नई सुविधाएँ मूल लोगों के साथ ही सही होंगी?
user0

(1) यदि आपके पास ऐसे व्यक्ति नहीं हैं जिन्हें आप अपने प्रशिक्षण डेटासेट में भविष्यवाणी करना चाहते हैं, तो आप "व्यक्ति सुविधा" का उपयोग नहीं कर सकते, यह सही है। (2) डमी फीचर बनाने के बजाय, आप एक "श्रेणीबद्ध" सुविधा बना सकते हैं (उदाहरण के लिए आप उन्हें आर में as.factor के साथ श्रेणीबद्ध के रूप में निर्दिष्ट करते हैं)। कुछ एल्गोरिदम इतने सारे श्रेणियों को संभाल नहीं सकते हैं (जैसे यादृच्छिक संख्या केवल लगभग 50 को संभाल सकते हैं), तो आपको वास्तव में उन्हें डमी चर के रूप में निर्दिष्ट करना होगा और आप (बहुत) कई सुविधाएँ प्राप्त कर सकते हैं, जैसा आपने बताया।
फिलिपप्रो २४'१

ML अनुदैर्ध्य डेटा में इतनी आसानी से अनुवाद नहीं करता है
Aksakal
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.