2005 के आसपास जब "डेटा माइनिंग" सांख्यिकीय पेशे के लिए नवीनतम खतरा था, मुझे याद है कि "डेटा माइनिंग प्रिंसिपल्स" के साथ एक पोस्टर देखकर, जिसमें से एक "डेटा को बोलने दें" (खुद के लिए "याद नहीं कर सकता है") शामिल किया गया था)। यदि आप एल्गोरिदम के बारे में सोचते हैं जिसे "डेटा माइनिंग" माना जा सकता है, तो एप्रीओरी और रिकर्सिव विभाजन दिमाग में आते हैं, दो एल्गोरिदम जो सांख्यिकीय मान्यताओं के बिना प्रेरित हो सकते हैं और परिणामस्वरूप अंतर्निहित डेटा सेट के सुंदर मूल सारांश में हो सकते हैं।
@ फिर वाक्यांश के इतिहास को और अधिक समझता है तो मैं करता हूं, लेकिन कागज में उद्धृत उद्धरण के बारे में सोच रहा हूं:
एमसीए को स्पष्ट डेटा के लिए पीसीए के समकक्ष के रूप में देखा जा सकता है और इसमें एक उप-स्थान प्रदान करने के लिए डेटा की गतिशीलता को कम करना शामिल है जो अनुमानित अंकों की परिवर्तनशीलता को अधिकतम करने के अर्थ में डेटा का प्रतिनिधित्व करता है। जैसा कि उल्लेख किया गया है, यह प्रायः बिना किसी संभावित मॉडल के संदर्भ में प्रस्तुत किया जाता है, जो बेंज़चेरी [1973] के विचार से "डेटा को स्वयं के लिए बोलने देता है।"
यह मुझे प्रतीत होता है कि एमसीए की प्रक्रिया एपोरी या पुनरावर्ती विभाजन (या नरक, उस मामले के लिए अंकगणितीय माध्य) से मिलती-जुलती है, जिसमें यह बिना किसी मॉडलिंग के प्रेरित किया जा सकता है और एक डेटा पर एक यांत्रिक संचालन है जो समझदारी पर आधारित है कुछ पहले सिद्धांतों पर।
डेटा को बोलने देने का एक स्पेक्ट्रम है। पूरी तरह से मजबूत पुजारियों के साथ बायेसियन मॉडल एक छोर पर होंगे। बार-बार अप्राप्य मॉडल दूसरे छोर के करीब होंगे।