संरचनात्मक समीकरण मॉडल में एक बहुत छोटा नमूना होने की जटिलताओं


13

मैं अमोस 18 में एक संरचनात्मक समीकरण मॉडल (SEM) चला रहा हूं। मैं अपने प्रयोग के लिए 100 प्रतिभागियों की तलाश कर रहा था (शिथिल इस्तेमाल किया गया), जिसे माना जाता था कि सफल एसईएम का संचालन करने के लिए पर्याप्त नहीं है। मुझे बार-बार बताया गया है कि SEM (EFA, CFA के साथ) एक "बड़ा नमूना" सांख्यिकीय प्रक्रिया है। लंबी कहानी छोटी, मैंने इसे 100 प्रतिभागियों के लिए नहीं बनाया (क्या आश्चर्य है!), और दो समस्याग्रस्त डेटा बिंदुओं को छोड़कर केवल 42 हैं। रुचि से बाहर, मैंने वैसे भी मॉडल की कोशिश की, और मेरे आश्चर्य के लिए, यह बहुत अच्छी तरह से फिट लग रहा था! सीएफआई> .95, आरएमएसईए <.09, एसआरएमआर <.08।

मॉडल सरल नहीं है, वास्तव में, मैं कहूंगा कि यह अपेक्षाकृत जटिल है। मेरे पास दो अव्यक्त चर हैं, एक दो के साथ और दूसरा 5 चरों के साथ मनाया गया। मेरे पास मॉडल में चार अतिरिक्त देखे गए चर भी हैं। चर, अप्रत्यक्ष और प्रत्यक्ष के बीच कई रिश्ते हैं, कुछ चर चार दूसरों के लिए अंतर्जात हैं, उदाहरण के रूप में।

मैं SEM के लिए कुछ नया हूँ; हालांकि, दो व्यक्ति जो मुझे पता है कि जो SEM से काफी परिचित हैं, वे मुझे बताते हैं कि जब तक फिट संकेत अच्छे हैं, तब तक प्रभाव व्याख्या योग्य हैं (जब तक वे महत्वपूर्ण हैं) और मॉडल के साथ काफी "गलत" कुछ भी नहीं है। मुझे पता है कि कुछ फिट संकेत अच्छे फिट का सुझाव देने के मामले में छोटे नमूनों के लिए या उनके खिलाफ पक्षपाती हैं, लेकिन मैंने जो तीन उल्लेख किया है वह ठीक लगता है, और मेरा मानना ​​है कि इसी तरह पक्षपाती नहीं है। अप्रत्यक्ष प्रभावों के लिए परीक्षण करने के लिए मैं बूटस्ट्रैपिंग (2000 नमूने या तो) का उपयोग कर रहा हूं, 90 प्रतिशत पूर्वाग्रह ने आत्मविश्वास, मोंटे कार्लो को सही किया। एक अतिरिक्त नोट यह है कि मैं तीन अलग-अलग परिस्थितियों के लिए तीन अलग-अलग SEM चला रहा हूं।

मेरे पास दो प्रश्न हैं, जिनमें से कुछ पर आप विचार करना चाहते हैं और कृपया उत्तर दें कि क्या आपके पास योगदान करने के लिए कुछ है:

  1. क्या मेरे मॉडल में कोई महत्वपूर्ण कमजोरियां हैं जो फिट सूचकांकों द्वारा प्रदर्शित नहीं की जाती हैं? छोटे नमूने को अध्ययन की कमजोरी के रूप में उजागर किया जाएगा, लेकिन मुझे लगता है कि कुछ बड़ी सांख्यिकीय समस्या है जिससे मैं पूरी तरह से बेखबर हूं। मैं भविष्य में अन्य 10-20 प्रतिभागियों को प्राप्त करने की योजना बना रहा हूं, लेकिन यह अभी भी मुझे इस तरह के विश्लेषण के लिए अपेक्षाकृत छोटे नमूने के साथ छोड़ देगा।

  2. क्या मेरे छोटे नमूने को दिए गए बूटस्ट्रैपिंग के उपयोग के साथ कोई समस्या है, या जिस संदर्भ में मैं इसका उपयोग कर रहा हूं?

मुझे उम्मीद है कि ये सवाल इस मंच के लिए बहुत "बुनियादी" नहीं हैं। मैंने SEM और संबंधित मामलों पर कई अध्याय पढ़े हैं, लेकिन मुझे लगता है कि लोग इस क्षेत्र में राय के मामले में बहुत बिखरे हुए हैं!

चियर्स


1
@ बेचार - अच्छी तरह से समझाया समस्या। आप बहुत ही विरल डेटा का उपयोग करके बहुत सारे मापदंडों की एक ऊँचाई का अनुमान लगा रहे हैं। इसलिए अनुमान भयानक रूप से अस्थिर हो जाएगा। लेकिन मैं पीछे हटना और पूछना चाहता हूं - क्या आप इन 42 का उपयोग बड़ी आबादी के बीच संबंधों का पता लगाने के लिए कर रहे हैं? यदि ऐसा है, तो क्या 42 एक यादृच्छिक नमूना है, या कम से कम एक प्रदर्शनकारी प्रतिनिधि है?
rolando2

आपकी टिप्पणी rolando2 के लिए धन्यवाद! नमूने में 42 विश्वविद्यालय के छात्र शामिल हैं, और मैं कई कारकों और चिंता के बीच संबंधों को देख रहा हूं। जिन संबंधों को मैं देख रहा हूँ वे सामान्य आबादी के बीच होंगे। मेरे अनुमान सीमित हैं क्योंकि प्रतिभागी सभी अपेक्षाकृत युवा छात्र हैं, लेकिन मैं किसी विशिष्ट आबादी (जैसे, चिंता विकार से पीड़ित व्यक्ति) की तलाश में नहीं हूं। मुझे मोटे तौर पर उदाहरण के लिए बताते हुए दिलचस्पी है कि एक्स अप्रत्यक्ष रूप से वाई के साथ गैर-नैदानिक ​​नमूने में जुड़ा हुआ है। क्या यह आपके सवालों का जवाब देता है?
बेहकाड

1
@Behacad - यह मानते हुए कि आप अपने संभावित आलोचकों को अपने नमूने की प्रतिनिधित्व क्षमता का बचाव कर सकते हैं, मैं असमान रूप से कहूंगा कि 12 चर के बीच संबंधों का अनुमान लगाने की कोशिश आपके 42 मामलों में से बहुत अधिक पूछ रही है। देखें कि क्या आप अपने मॉडल को सिर्फ 3 सबसे दिलचस्प भविष्यवक्ताओं को शामिल करने के लिए सरल बना सकते हैं। हालांकि मुझे लगता है कि यह डेटा के साथ भाग के लिए दर्दनाक है जिसे आपने इकट्ठा करने के लिए कड़ी मेहनत की होगी!
rolando2

जवाब देने के लिए धन्यवाद। मेरे पास एक "भावना" है जो इन सभी चर के बीच संबंधों का आकलन 42 डेटा बिंदुओं के साथ करना मुश्किल है, और मैं देखता हूं कि आप कहां से आ रहे हैं। यह कहा जा रहा है, इस समस्या के लिए एक सांख्यिकीय कारण (अधिमानतः उद्धृत) क्या होगा? यह विभिन्न आश्रित चर पर कई प्रतिगमन / सहसंबंध चलाने से कैसे अलग है? फिट अच्छा है (और मैं वास्तव में विभिन्न प्रयोगात्मक कार्यों के लिए तीन अलग-अलग मॉडल चला रहा हूं) और परिणाम पूरे मॉडल में और सिद्धांत के अनुरूप हैं। क्षमा करें, अगर मैं रक्षात्मक के रूप में आ रहा हूँ!
बेहकाड

(रक्षात्मक नहीं - कोई चिंता नहीं!) 42 मामलों का होना आपको कम से कम त्रुटि का नमूना देने के लिए उजागर करता है, यहां तक ​​कि अविभाज्य आंकड़ों का आकलन करते समय भी। अब, SEM में, प्रत्येक चर का कई बार उपयोग किया जाता है, क्योंकि आप C, D, आदि के लिए नियंत्रण करते समय A से B के संबंध का अनुमान लगा रहे हैं, इसलिए नमूना त्रुटि के प्रभाव को प्रचारित किया जाएगा, जो मेरी समझ में है, इसीलिए आम तौर पर बड़े नमूने चाहिए। आपके मामले में, आपको नमूना त्रुटि की तुलना में संभावित रूप से अधिक त्रुटि मिली है क्योंकि आपके पास यादृच्छिक नमूना नहीं है। इसलिए आपको प्राप्त होने वाले किसी भी परिणाम के आसपास एक बहुत बड़े विश्वसनीय अंतराल को आकर्षित करने की आवश्यकता है।
रोलैंडो 2

जवाबों:


4

एक बिंदु: "मूल प्रश्न" जैसी कोई चीज नहीं है, आप केवल वही जानते हैं जो आप जानते हैं, और जो आप नहीं जानते हैं। एक सवाल पूछना अक्सर पता लगाने का एकमात्र तरीका है।

जब भी आप छोटे नमूने देखते हैं, तो आपको पता चलता है कि वास्तव में उनके मॉडलों में "विश्वास" कौन है और कौन नहीं करता है। मैं यह कहता हूं क्योंकि छोटे नमूने आमतौर पर जहां मॉडल का सबसे बड़ा प्रभाव होता है।

अपने आप को उत्सुक (साइको!) मॉडेलर होने के नाते, मैं कहता हूं कि इसके लिए जाओ! आप एक सतर्क दृष्टिकोण अपनाते हैं, और आपने छोटे नमूने के कारण संभावित पूर्वाग्रह आदि को स्वीकार किया है। फिटिंग मॉडल के साथ छोटे डेटा को ध्यान में रखना एक बात यह है कि आपके पास 12 चर हैं। अब आपको सोचना चाहिए - 42 प्रेक्षणों से 12 चर वाले किसी भी मॉडल को कितनी अच्छी तरह से निर्धारित किया जा सकता है? यदि आपके पास 42 चर थे, तो कोई भी मॉडल उन 42 अवलोकनों (शिथिल बोलना) के लिए पूरी तरह से फिट हो सकता है, इसलिए आपका मामला बहुत अधिक लचीला होने से बहुत दूर नहीं है। क्या होता है जब आपका मॉडल बहुत लचीला होता है? यह शोर को फिट करने के लिए जाता है - अर्थात, ऐसे रिश्ते जो आपके द्वारा परिकल्पना के अलावा अन्य चीजों से निर्धारित होते हैं।

आपके पास अपने अहंकार को रखने का अवसर भी है जहां आपका मॉडल भविष्यवाणी करता है कि आपके मॉडल से भविष्य के 10-20 नमूने क्या होंगे। मुझे आश्चर्य है कि आपके आलोचक एक तथाकथित "डॉगी" मॉडल पर कैसे प्रतिक्रिया देंगे जो सही भविष्यवाणियां देता है। ध्यान दें कि यदि आपके मॉडल ने अच्छी तरह से डेटा की भविष्यवाणी नहीं की है तो आपको एक समान "मैंने आपको ऐसा बताया" होगा।

एक और तरीका है कि आप अपने आप को आश्वस्त कर सकते हैं कि आपके परिणाम विश्वसनीय हैं, कोशिश करना और उन्हें तोड़ना है। अपने मूल डेटा को बरकरार रखते हुए, एक नया डेटा सेट बनाएं, और देखें कि आपके SEM परिणामों को हास्यास्पद बनाने के लिए आपको इस नए डेटा सेट में क्या करना है। फिर देखें कि आपको क्या करना था, और विचार करें: क्या यह एक उचित परिदृश्य है? क्या मेरा "हास्यास्पद" डेटा वास्तविक संभावना जैसा है? यदि आपको हास्यास्पद परिणामों का उत्पादन करने के लिए अपने डेटा को हास्यास्पद क्षेत्र में ले जाना है, तो यह कुछ आश्वासन (हेयुरिस्टिक, औपचारिक नहीं) प्रदान करता है कि आपकी विधि ध्वनि है।


1

इसके साथ जो मुख्य समस्या मुझे दिख रही है वह है शक्ति की कमी। पुष्ट कारक और SEM परीक्षण अशक्त को स्वीकार करने के लिए देखो - आप एक गैर-महत्वपूर्ण पी-मूल्य देखना चाहते हैं - इसलिए बिजली की कमी एक समस्या हो सकती है। परीक्षण की शक्ति नमूना आकार (42) और स्वतंत्रता की डिग्री पर निर्भर करती है। AMOS आपको स्वतंत्रता की डिग्री प्रदान करता है। आपने इसे उद्धृत नहीं किया है, लेकिन यह इस मामले में बड़ा नहीं होगा। 12 चर के साथ, आप 66 DF के साथ शुरू करते हैं, और प्रत्येक पैरामीटर के लिए 1 घटाते हैं जिसका आप अनुमान लगाते हैं। मुझे नहीं पता कि कितने होंगे, लेकिन आप कहते हैं कि आपके पास विभिन्न निर्माणों के बीच कई कारक और सहसंबंध हैं।

मैं रोलांडो 2 से पूरी तरह सहमत नहीं हूं। SEM में, आपके पास बहुत सारे चर हैं, यह मानते हुए कि वे अंतर्निहित निर्माण के विश्वसनीय संकेतक हैं। इसलिए चर की संख्या कम न करें। उसी कारण से, मैं पूरी तरह से @probabilityislogic से सहमत नहीं हूं। SEM में, आप 42 टिप्पणियों के साथ 12 चर मॉडल करने की कोशिश नहीं कर रहे हैं। आप 12 संकेतकों के माध्यम से निर्माणों को मॉडल करने की कोशिश कर रहे हैं, 42 प्रतिकृति द्वारा मजबूत किया गया है। एक बहुत ही सरल कारक मॉडल - 12 संकेतकों के साथ 1 कारक - संभवतः 42 लोगों के साथ परीक्षण किया जा सकता है।

मॉडल की संतृप्ति के पास आरएमएसईए और फिट उपायों की अन्य अच्छाई में सुधार होगा, इसलिए फिर से, आप एक भ्रामक परिणाम के जोखिम को चलाते हैं।

कहा जा रहा है कि, मैंने एक कारक मॉडल को अस्वीकार करते हुए छोटे डेटा सेट देखे हैं। यह शायद कुछ का मतलब है कि फिट अच्छा प्रतीत होता है।

नोट: आप एक SEM मॉडल के अवशेषों की भी जांच कर सकते हैं। ये अनुमान सहसंयोजक मैट्रिक्स और मॉडल सहसंयोजक मैट्रिक्स के बीच अंतर हैं। यदि आप उनसे अनुरोध करते हैं तो एएमओएस उन्हें आपको दे देगा। अवशिष्टों की जांच से संकेत मिल सकता है कि क्या वे समान रूप से वितरित किए गए हैं, या यदि कुछ कोविरियन बहुत बुरी तरह से फिट हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.