क्लस्टर विश्लेषण परिणामों को मान्य करने के लिए सांख्यिकीय महत्व परीक्षण का उपयोग करना


13

मैं क्लस्टर विश्लेषण के परिणामों को मान्य करने के लिए सांख्यिकीय महत्व परीक्षण (एसएसटी) के उपयोग का सर्वेक्षण कर रहा हूं। मुझे इस विषय के आसपास कई पेपर मिले हैं, जैसे कि

लेकिन मुझे लगता है कि SST क्लस्टर विश्लेषण के परिणामों को मान्य करने के लिए उपयुक्त नहीं है। एकमात्र स्रोत जो मैंने दावा किया है कि यह एक सॉफ्टवेयर विक्रेता का वेब पेज है

स्पष्टीकरण देना:

मुझे परीक्षण में दिलचस्पी है कि क्या क्लस्टर विश्लेषण के परिणामस्वरूप एक महत्वपूर्ण क्लस्टर संरचना पाई गई है, इसलिए, मैं खोजपूर्ण डेटा के परिणामों के पोस्ट-हॉक परीक्षण की संभावना के बारे में "चिंता का समर्थन या खंडन" करने वाले पत्रों के बारे में जानना चाहूंगा। विश्लेषण समूहों को खोजने के लिए उपयोग किया जाता है ”।

मैंने अभी हाल ही में 2003 से मिलिगन और हर्टल द्वारा " क्लस्टरिंग एंड क्लासिफिकेशन मेथड्स " नामक एक पेपर पाया है , उदाहरण के लिए, कि एनोवा का उपयोग करना एक अवैध विश्लेषण होगा क्योंकि डेटा में समूहों के लिए यादृच्छिक असाइनमेंट नहीं हैं।


यह एक अच्छा सवाल है, लेकिन यह इंगित करने के लायक हो सकता है कि यह इस तरह से बना है कि ऐसा लगता है कि ऐसा लगता है कि वहाँ एक द्वंद्वयुद्ध है: या तो आप क्लस्टरिंग के महत्व के लिए परीक्षण कर सकते हैं या आप नहीं कर सकते। हालांकि, स्थिति अलग है, क्योंकि "क्लस्टर विश्लेषण" का अर्थ है विभिन्न चीजें। संदर्भित कागजात में फोकस परीक्षण पर है कि क्या क्लस्टरिंग के लिए सबूत है। सॉफ्टवेयर मैनुअल में, क्लस्टर खोजने के लिए उपयोग किए जाने वाले खोज डेटा विश्लेषण के परिणामों के पोस्ट-हॉक परीक्षण की संभावना के बारे में चिंता व्यक्त की जाती है । यहां कोई विरोधाभास नहीं है।
whuber

जवाब के लिए धन्यवाद। जिस तरह से मैंने सवाल उठाया है, आप उसके बारे में सही हैं। मुझे परीक्षण में दिलचस्पी है कि क्या क्लस्टर विश्लेषण के परिणामस्वरूप एक महत्वपूर्ण क्लस्टर संरचना पाई गई है, इसलिए, मैं खोजपूर्ण डेटा के परिणामों के पोस्ट-हॉक परीक्षण की संभावना के बारे में "चिंता का समर्थन या खंडन" करने वाले पत्रों के बारे में जानना चाहूंगा। विश्लेषण समूहों को खोजने के लिए उपयोग किया जाता है ”। मुझे मिलिगन और हर्टल ने 2003 में "क्लस्टरिंग एंड क्लासिफिकेशन मेथड्स" से सिर्फ एक पेपर कहा है, उदाहरण के लिए, कि एनोवा का उपयोग करना एक अवैध विश्लेषण होगा क्योंकि डेटा में समूहों के लिए यादृच्छिक असाइनमेंट नहीं हैं।
DPS

मदद कर सकता है: विज्ञान में अंधा: अपर्याप्त मान्य क्लस्टर विश्लेषण समाधान के प्रबंधकीय परिणाम, mrs.org.uk/ijmr_article/article/78841
rolando2

जवाबों:


3

यह स्पष्ट है कि आप समूहों के लिए वितरण में अंतर के लिए (भोले रूप से) परीक्षण नहीं कर सकते हैं जो समान डेटा का उपयोग करके परिभाषित किए गए थे। इसे "सेलेक्टिव टेस्टिंग", "डबल डिपिंग", "सर्कुलर इनविज़न", आदि के रूप में जाना जाता है।

एक उदाहरण आपके डेटा में "लंबा" और "कम" लोगों की ऊंचाइयों पर एक टी-टेस्ट कर रहा होगा। अशक्त (लगभग) हमेशा खारिज कर दिया जाएगा।

कहा जा रहा है कि - परीक्षण के स्तर पर क्लस्टरिंग स्टेज के लिए वास्तव में कोई भी जिम्मेदार हो सकता है। मैं अपरिचित हूं, हालांकि, एक विशेष संदर्भ के साथ जो ऐसा करता है, लेकिन मुझे संदेह है कि यह किया जाना चाहिए था।


मैं इस बात पर सहमत हूं कि विभिन्न क्लस्टर समूहों पर महत्व परीक्षण लागू करते समय नल लगभग हमेशा खारिज कर दिया जाएगा। हालाँकि - यह केवल तभी होना चाहिए जब क्लस्टरिंग वास्तव में CA में समझे जाने वाले सभी चर के लिए अलग-अलग समूहों में कामयाब रहे? क्या यह निर्धारित करने के लिए कोई महत्व परीक्षण का उपयोग नहीं कर सकता है कि क्या चर हैं जो समूहों के बीच अच्छी तरह से अलग नहीं हैं (मतलब प्रत्येक चर के लिए एक परीक्षण लागू करें)? क्या आप सांख्यिकीय कारण के बारे में विस्तार से बता सकते हैं कि इसकी सिफारिश / समझदारी क्यों नहीं है?
ल्यूक

औपचारिक तर्क यह है कि प्रत्येक माप की त्रुटि अवधि शून्य के बारे में केंद्रित नहीं है। मेरे लम्बे / छोटे उदाहरण के बारे में सोचें: सभी लोगों को एक ही वितरण से तैयार किया गया है, लेकिन "लंबा" समूह में सकारात्मक अर्थ के साथ त्रुटियां हैं, और "छोटा" नकारात्मक अर्थ है।
जॉनरोस जूल

0

दिए गए परीक्षण के साथ परिकल्पना परीक्षण के बजाय, मैं क्लस्टर के बीच बूटस्ट्रैपिंग साधनों या अन्य सारांश अनुमानों की सिफारिश करूंगा। उदाहरण के लिए, आप कम से कम 1000 नमूनों के साथ प्रतिशतक बूटस्ट्रैप पर भरोसा कर सकते हैं। मुख्य बिंदु प्रत्येक बूटस्ट्रैप नमूने के लिए स्वतंत्र रूप से क्लस्टरिंग लागू करना है।

यह दृष्टिकोण काफी मजबूत होगा, मतभेदों के लिए सबूत प्रदान करेगा, और महत्वपूर्ण अंतर-क्लस्टर अंतर के आपके दावे का समर्थन करेगा। इसके अलावा, आप एक और वैरिएबल (कह सकते हैं कि क्लस्टर अंतर) और इस तरह के अंतर के बूटस्ट्रैप अनुमान परिकल्पना की औपचारिक परीक्षा के समान होंगे।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.