अव्यक्त वर्ग विश्लेषण बनाम क्लस्टर विश्लेषण - संदर्भ में अंतर?


30

अव्यक्त वर्ग विश्लेषण (LCA) बनाम क्लस्टर विश्लेषण से किए जा सकने वाले इनफ़ॉर्मेशन के अंतर क्या हैं? क्या यह सही है कि एक एलसीए एक अंतर्निहित अव्यक्त चर को मानता है जो कक्षाओं को जन्म देता है, जबकि क्लस्टर विश्लेषण एक क्लस्टरिंग एल्गोरिथ्म से सहसंबद्ध विशेषताओं का एक अनुभवजन्य विवरण है? ऐसा लगता है कि सामाजिक विज्ञान में, एलसीए ने लोकप्रियता हासिल की है और इसे पद्धतिगत रूप से श्रेष्ठ माना जाता है, क्योंकि इसका एक औपचारिक ची-स्क्वायर महत्व परीक्षण है, जो क्लस्टर विश्लेषण नहीं करता है।

यह बहुत अच्छा होगा यदि उदाहरणों के रूप में पेश किया जा सकता है, "एलसीए इसके लिए उपयुक्त होगा (लेकिन क्लस्टर विश्लेषण नहीं), और क्लस्टर विश्लेषण इसके लिए उपयुक्त होगा (लेकिन अव्यक्त वर्ग विश्लेषण नहीं)।

धन्यवाद! ब्रायन


1
आप inferencesइस संदर्भ में क्या कहते हैं और केवल आप के हित में मतभेद क्यों हैं?
ttnphns

1
@ttnphns इनफॉर्म्स से मेरा मतलब है नतीजों की ठोस व्याख्या। मुझे आपकी रुचि के बारे में अपने प्रश्न के उत्तरार्द्ध के बारे में यकीन नहीं है "केवल अंतर में अंतर?" मुझे उनके संबंधित एल्गोरिदम या अंतर्निहित गणित के निष्पादन में कोई दिलचस्पी नहीं है। मुझे दिलचस्पी है कि परिणामों की व्याख्या कैसे की जाएगी।
ब्रायन पी

जवाबों:


27

अव्यक्त वर्ग विश्लेषण वास्तव में एक परिमित मिश्रण मॉडल ( यहाँ देखें ) है। एफएमएम और अन्य क्लस्टरिंग एल्गोरिदम के बीच मुख्य अंतर यह है कि एफएमएम आपको एक "मॉडल-आधारित क्लस्टरिंग" दृष्टिकोण प्रदान करता है जो कि एक संभावित मॉडल का उपयोग करते हुए समूहों को प्राप्त करता है जो आपके डेटा के वितरण का वर्णन करता है। इसलिए कुछ मनमाने ढंग से चुने गए दूरी माप के साथ क्लस्टर खोजने के बजाय, आप एक मॉडल का उपयोग करते हैं जो आपके डेटा के वितरण का वर्णन करता है और इस मॉडल के आधार पर आप संभावनाओं का आकलन करते हैं कि कुछ मामले कुछ अव्यक्त वर्गों के सदस्य हैं। तो आप कह सकते हैं कि यह एक टॉप-डाउन दृष्टिकोण है (आप अपने डेटा के वितरण का वर्णन करने के साथ शुरू करते हैं) जबकि अन्य क्लस्टरिंग एल्गोरिदम बल्कि नीचे-अप दृष्टिकोण हैं (आप मामलों के बीच समानता पाते हैं)।

क्योंकि आप अपने डेटा मॉडल के चयन के लिए एक सांख्यिकीय मॉडल का उपयोग करते हैं और फिट की अच्छाई का आकलन संभव है - क्लस्टरिंग के विपरीत। इसके अलावा, यदि आप मानते हैं कि कुछ प्रक्रिया या "अव्यक्त संरचना" है जो आपके डेटा की संरचना को रेखांकित करती है तो FMM एक उपयुक्त विकल्प प्रतीत होता है क्योंकि वे आपको अपने डेटा के पीछे अव्यक्त संरचना को मॉडल करने में सक्षम करते हैं (बल्कि तब समानता की तलाश में)।

अन्य अंतर यह है कि FMM क्लस्टरिंग की तुलना में अधिक लचीले होते हैं। क्लस्टरिंग एल्गोरिदम सिर्फ क्लस्टरिंग करते हैं, जबकि FMM- और LCA- आधारित मॉडल हैं

  • आपको पुष्टिकरण, समूहों के बीच विश्लेषण करने में सक्षम बनाता है,
  • एलसीए के साथ आइटम रिस्पांस थ्योरी (और अन्य) मॉडल को मिलाएं,
  • व्यक्तियों की अव्यक्त वर्ग सदस्यता की भविष्यवाणी करने के लिए सहसंयोजक शामिल करें,
  • और / या भी अव्यक्त वर्ग प्रतिगमन में क्लस्टर प्रतिगमन मॉडल ,
  • आपको अपने डेटा आदि की संरचना में समय के साथ बदलाव के लिए सक्षम बनाता है।

अधिक उदाहरणों के लिए देखें:

हैगनारस जेए और मैककॉचॉन, एएल (2009)। एप्लाइड लेटेंट क्लास एनालिसिस। कैम्ब्रिज यूनिवर्सिटी प्रेस।

और आर में फ्लेक्समिक्स और पीओएलसीए पैकेज का प्रलेखन , जिसमें निम्नलिखित कागजात शामिल हैं:

लाइनर, डीए, और लुईस, जेबी (2011)। poLCA: पॉलीटोमस वैरिएबल लेटेंट क्लास एनालिसिस के लिए एक आर पैकेज। जर्नल ऑफ स्टैटिस्टिकल सॉफ्टवेयर, 42 (10), 1-29।

लेइस्क, एफ। (2004)। फ्लेक्समिक्स: आर। जर्नल ऑफ़ स्टैटिस्टिकल सॉफ्टवेयर में परिमित मिश्रण मॉडल और अव्यक्त ग्लास रिग्रेशन के लिए एक सामान्य ढांचा , 11 (8), 1-18।

ग्रुन, बी।, और लेइस्क, एफ। (2008)। FlexMix संस्करण 2: सहवर्ती चर और अलग-अलग और निरंतर मापदंडों के साथ परिमित मिश्रण । जर्नल ऑफ़ स्टैटिस्टिकल सॉफ्टवेयर, 28 (4), 1-35।


3

एक अव्यक्त वर्ग मॉडल (या अव्यक्त प्रोफ़ाइल, या अधिक आम तौर पर, एक परिमित मिश्रण मॉडल) को क्लस्टरिंग (या असुरक्षित वर्गीकरण) के लिए एक संभाव्य मॉडल के रूप में सोचा जा सकता है। लक्ष्य आम तौर पर एक ही है - एक बड़ी आबादी के भीतर समरूप समूहों की पहचान करना। मुझे लगता है कि अव्यक्त वर्ग मॉडल और क्लस्टरिंग के लिए एल्गोरिथम दृष्टिकोण के बीच मुख्य अंतर यह है कि पूर्व स्पष्ट रूप से क्लस्टरिंग की प्रकृति के बारे में अधिक सैद्धांतिक अटकलों को उधार देता है; और क्योंकि अव्यक्त वर्ग मॉडल संभाव्य है, यह संभावना आँकड़ों के माध्यम से मॉडल फिट का आकलन करने के लिए अतिरिक्त विकल्प देता है, और बेहतर कैप्चर / वर्गीकरण में अनिश्चितता को बरकरार रखता है।

आप इस धागे में कुछ उपयोगी tidbits पा सकते हैं , साथ ही इस पोस्ट पर chl द्वारा संबंधित उत्तर दे सकते हैं

पीसीए बनाम कारक विश्लेषण के बारे में इस सवाल के साथ समानताएं (एक वैचारिक स्तर पर) भी हैं , और यह एक भी है।


2

अंतर यह है कि लेटेंट क्लास एनालिसिस क्लास में सुविधाओं की संभावनाओं को निर्धारित करने के लिए छिपे हुए डेटा (जो आमतौर पर फीचर्स में एसोसिएशन ऑफ पैटर्न है) का उपयोग करेगा। तब आइटमों को उनकी विशेषताओं के आधार पर कक्षाओं में अलग-अलग करने के लिए अधिकतम संभावना का उपयोग करके अंतर्ग्रहण किया जा सकता है।

क्लस्टर विश्लेषण सुविधाओं को प्लॉट करता है और एल्गोरिदम जैसे निकटतम पड़ोसियों, घनत्व, या पदानुक्रम का उपयोग करके यह निर्धारित करता है कि कोई आइटम किस वर्ग से संबंधित है।

मूल रूप से एलसीए निष्कर्ष के रूप में सोचा जा सकता है "संभावना का उपयोग करने के लिए सबसे समान पैटर्न क्या है" और क्लस्टर विश्लेषण "दूरी का उपयोग करके निकटतम चीज क्या है" होगी।


क्या आप स्पष्ट कर सकते हैं कि क्लस्टर विश्लेषण के बारे में बयान में "बात" क्या है? दूरी की माप के आधार पर क्या यह निकटतम 'विशेषता' है?
ब्रायन पी

बात एक वस्तु या वस्तु होगी जो भी डेटा आप सुविधा मापदंडों के साथ इनपुट करते हैं।
ccsv
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.