डेटा सम्मिश्रण क्या है?


15

यह शब्द अक्सर विधि-संबंधित थ्रेड्स में प्रकट होता है ।

है सम्मिश्रण डाटा माइनिंग और सांख्यिकीय सीखने में एक विशिष्ट विधि? मुझे Google से प्रासंगिक परिणाम नहीं मिल सकता है।

ऐसा लगता है कि सम्मिश्रण कई मॉडलों के परिणामों को मिला रहा है और परिणामस्वरूप बेहतर परिणाम मिल रहा है। क्या कोई संसाधन है जो मुझे इसके बारे में अधिक जानने में मदद करता है?

जवाबों:


10

http://www.cs.cornell.edu/~caruana/ctp/ct.papers/caruana.icml04.icdm06long.pdf कुछ पेपर आपको आगे समझने में मदद करने के लिए कि सम्मिश्रण क्या है। मुझे लगता है कि आप एसेम्बल सिलेक्शन / लर्निंग, और स्टैकिंग के लिए भी गूगल कर सकते हैं।

आपकी 'कई मॉडलों से नतीजे मिलाने और बेहतर नतीजे के परिणाम' की सामान्य समझ हालांकि सही है।


उस लिंक को कग्गल फोरम में भी कहीं से लिया गया था। मैंने केवल पीडीएफ के लिंक को सहेजा है, लेकिन चर्चा नहीं की ...
राजा

12

बूस्टिंग (जैसा कि संबंधित चर्चा में उल्लेख किया गया है) एक विधि है जो एल्गोरिदम के एक सेट को जोड़ती है एक परिणाम प्राप्त करने के लिए जो आप किसी भी एकल एल्गोरिथ्म से प्राप्त कर सकते हैं उससे बेहतर है। उदाहरण के लिए यादृच्छिक वन एक वर्गीकरण एल्गोरिथ्म के लिए विभिन्न वर्गीकरण पेड़ों के संयोजन के लिए एक विधि है। इस दृष्टिकोण को औपचारिक रूप से पहनावा औसत कहा जाता है (हालांकि आम तौर पर बहुमत बहुमत नियम लागू होता है)। सम्मिश्रण एक ऐसा शब्द है जो कुछ लोग वर्गीकरण के लिए एक उत्साहजनक दृष्टिकोण का वर्णन करने के लिए उपयोग करते हैं।


तो क्या इसे सम्मिश्रण कहा जा सकता है, अगर मैं वर्गीकरण के पेड़ों को एक सामान्य एडबाओस्ट मॉडल में एल्गोरिदम के अन्य सेट के साथ बदल दूं?
टॉमहॉल

नमस्ते, माइकल। आपका जवाब वास्तव में उपयोगी है, लेकिन मुझे शर्म आती है, मैं आँकड़ों के लिए नया हूं और मुझे अभी तक अपना जवाब देने के लिए पर्याप्त प्रतिष्ठा नहीं मिली है।
टॉमहॉल

1
अच्छी तरह से याद है कि आप इसे करने के बाद कुछ प्रतिनिधि अंक प्राप्त करते हैं।
माइकल आर। चेरिक जूल 19'12

0

उद्योग में डेटा सम्मिश्रण मॉडल के बारे में नहीं है, बल्कि प्रीप्रोसेसिंग के बारे में है : यह तब होता है जब डेटा को मर्ज किया जाता है जो विभिन्न स्रोतों से आता है, जैसे एक डेटाबेस से और दूसरा सीएसवी फ़ाइलों से डेटा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.