एन्सेम्बल सैद्धांतिक और व्यावहारिक कारणों से भविष्यवाणी पर जीतता है।
यदि हम पिछली घटनाओं के ज्ञान के आधार पर किसी अनुक्रम में अगली घटना की भविष्यवाणी करते हैं, तो इसका मतलब है कि हम पूर्वानुमान लगाने का एक मूल सिद्धांत है। सोलोमनॉफ़ भविष्यवाणी (सोलोमनॉफ़ 1964) कई इंद्रियों में उल्लेखनीय रूप से इष्टतम है, जिसमें यह "केवल पूर्ण न्यूनतम डेटा के साथ किसी भी कम्प्यूटेशनल अनुक्रम का सही अनुमान लगाना सीखेगा।" (हटर, लेग एंड विटैनी 2007) एक सोलोमनॉफ़ प्रेडिक्टर प्रोग्राम के कोलमोगोरोव जटिलता और प्रोग्राम द्वारा अब तक डेटा को असाइन किए जाने वाले प्रायिकता ("सभी सिद्धांत रखें") के अनुसार मौजूदा डेटा के साथ संगत सभी कार्यक्रमों को वेट करता है। ओखम ("सरल सिद्धांतों को प्राथमिकता दें") एक बायेसियन ढांचे में दर्शन।
सोलोमोनॉफ़ भविष्यवाणी की इष्टतमता गुण आपके द्वारा संदर्भित मजबूत खोज को समझाते हैं: औसत से अधिक मॉडल, स्रोत, या विशेषज्ञ भविष्यवाणियों में सुधार करते हैं, और औसत पूर्वानुमान भी सर्वश्रेष्ठ एकल भविष्यवक्ता से बेहतर प्रदर्शन करते हैं। व्यवहार में देखे गए विभिन्न पहनावे तरीकों को सोलोमनॉफ भविष्यवाणी के लिए गणना योग्य अनुमानों के रूप में देखा जा सकता है - और एमएमएल (वालेस 2005) जैसे कुछ स्पष्ट रूप से संबंधों का पता लगाते हैं, हालांकि अधिकांश ऐसा नहीं करते हैं।
वालेस (2005) नोट करता है कि एक सोलोमनॉफ़ भविष्यवक्ता पार्सिमोनियस नहीं है - यह मॉडल का एक अनंत पूल रखता है - लेकिन अधिकांश पूर्वानुमानात्मक शक्ति मॉडल के अपेक्षाकृत छोटे सेट के लिए अनिवार्य रूप से आती है। कुछ डोमेन में एकल सर्वश्रेष्ठ मॉडल (या लगभग अविभाज्य मॉडल का परिवार) भविष्य कहनेवाला शक्ति और बेहतर प्रदर्शन के सामान्य हिस्से के बड़े हिस्से के लिए जिम्मेदार हो सकता है, लेकिन छोटे सिद्धांत वाले जटिल डोमेन में सबसे अधिक संभावना है कि कोई भी एकल परिवार पश्चगामी संभावना के बहुमत को नहीं पकड़ता है, और इसलिए प्रशंसनीय उम्मीदवारों पर औसत भविष्यवाणियों में सुधार करना चाहिए। नेटफ्लिक्स पुरस्कार जीतने के लिए, बेल्कोर टीम ने 450 से अधिक मॉडलों (कोरन 2009) को मिश्रित किया।
मनुष्य आमतौर पर एक अच्छी व्याख्या चाहता है: "उच्च-सिद्धांत" जैसे कि भौतिकी में, ये अच्छी तरह से काम करते हैं। वास्तव में यदि वे अंतर्निहित कारण गतिशीलता को पकड़ते हैं, तो उन्हें लगभग अपराजेय होना चाहिए। लेकिन जहां उपलब्ध सिद्धांत घटना (जैसे, फिल्म की सिफारिश या भू-राजनीति) को बारीकी से फिट नहीं करते हैं, एकल मॉडल कमजोर पड़ जाएंगे: सभी अधूरे हैं, इसलिए किसी को भी हावी नहीं होना चाहिए। इस प्रकार ensembles (मशीन लर्निंग के लिए) और विजडम ऑफ द क्राउड्स (विशेषज्ञों के लिए), और IARPA ACE और विशेष रूप से गुड जजमेंट प्रोजेक्ट (टेटलॉक एंड गार्डिनर 2015) जैसे कार्यक्रमों की सफलता पर जोर दिया गया है।
संदर्भ
- एम। हटर, एस। लेग, और पी। विटाणी, "एल्गोरिथम संभावना," स्कॉलरपीडिया, वॉल्यूम। 2, 2007, पी। 2572।
- वाई। कोरेन, "द बेल्कोर सॉल्यूशन टू द नेटफ्लिक्स ग्रैंड प्राइज़," 2009।
- सोलोमनॉफ, रे (मार्च 1964)। "इंडेक्टिव इन्वेंशन पार्ट I का एक औपचारिक सिद्धांत" (पीडीएफ)। सूचना और नियंत्रण 7 (1): 1-22। doi: 10.1016 / S0019-9958 (64) 90,223-2।
- सोलोमोनॉफ़, रे (जून 1964)। "इंडेक्टिव इन्वेंशन पार्ट II का एक औपचारिक सिद्धांत" (पीडीएफ)। सूचना और नियंत्रण 7 (2): 224-254। doi: 10.1016 / S0019-9958 (64) 90,131-7।
- पीई टेटलॉक, विशेषज्ञ राजनीतिक निर्णय: यह कितना अच्छा है? हम कैसे जान सकते हैं?, प्रिंसटन यूनिवर्सिटी प्रेस, 2005।
- टेटलॉक, पीई और गार्डनर, डी। (2015)। सुपरफ़ॉस्टिंग: द आर्ट एंड साइंस ऑफ़ प्रेडिक्शन। न्यूयॉर्क: क्राउन।
- सीएस वालेस, न्यूनतम संदेश लंबाई, सांख्यिकीय और प्रेरक आविष्कार, स्प्रिंगर-वर्लग, 2005।