1. मनोविज्ञान और भाषाविज्ञान में एक प्रसिद्ध उदाहरण हर्ब क्लार्क (1973; कोलमैन, 1964 के बाद) द्वारा वर्णित है: "भाषा-जैसा-निश्चित-प्रभाव गिरावट: मनोवैज्ञानिक अनुसंधान में भाषा के आँकड़ों की एक आलोचना।"
क्लार्क मनोवैज्ञानिक प्रयोगों पर चर्चा करने वाले एक मनोचिकित्सक हैं जिसमें अनुसंधान विषयों का एक नमूना उत्तेजना सामग्री के एक सेट पर प्रतिक्रिया करता है, आमतौर पर कुछ कॉर्पस से तैयार किए गए विभिन्न शब्द। वह बताते हैं कि इन मामलों में इस्तेमाल की जाने वाली मानक सांख्यिकीय प्रक्रिया, बार-बार किए गए उपायों एनोवा पर आधारित है, और क्लार्क द्वारा रूप में संदर्भित किया जाता है , प्रतिभागियों को एक यादृच्छिक कारक के रूप में मानता है लेकिन (शायद निहित) उत्तेजना सामग्री (या भाषा) का इलाज करता है जैसा तय हो। यह प्रायोगिक स्थिति कारक पर परिकल्पना परीक्षणों के परिणामों की व्याख्या करने में समस्याओं की ओर जाता है: स्वाभाविक रूप से हम यह मानना चाहते हैं कि एक सकारात्मक परिणाम हमें दोनों आबादी के बारे में कुछ बताता है जिसमें से हमने अपने प्रतिभागी नमूने के साथ-साथ सैद्धांतिक आबादी को भी आकर्षित किया है जिससे हम समझ गए हैं भाषा सामग्री। लेकिन एफएफ1 , प्रतिभागियों को यादृच्छिक और उत्तेजनाओं के रूप में तय करके, केवल अन्य समान प्रतिभागियोंको सटीक समान उत्तेजनाओं काजवाब देनेवालेस्थिति कारक के प्रभाव के बारे में बताता है। एफ 1 विश्लेषण काआयोजनजब प्रतिभागियों और उत्तेजनाओं दोनों को अधिक उचित रूप से देखा जाता है, तो यादृच्छिक के रूप में देखा जा सकता है टाइप 1 त्रुटि दर जो नाममात्र α स्तरसे अधिक हो सकतीहै - आमतौर पर .05 - इस तरह की संख्या और परिवर्तनशीलता जैसे कारकों के आधार पर हद तक। उत्तेजना और प्रयोग का डिज़ाइन। इन मामलों में, अधिक उपयुक्त विश्लेषण, कम से कम शास्त्रीय एनोवा फ्रेमवर्क के तहत, क्या उपयोग किया जाता है जिसे अर्ध कहा जाता है-रैखिकआँकड़ों के अनुपात के आधार पर एफ आँकड़ेएफ1एफ1αएफ चौकों का मतलब है।
क्लार्क के पेपर ने उस समय मनोवैज्ञानिक विज्ञान में एक अलग छलांग लगाई, लेकिन व्यापक मनोवैज्ञानिक साहित्य में एक बड़ा सेंध लगाने में असफल रहे। (और मनोचिकित्सा विज्ञान के भीतर भी क्लार्क की सलाह कुछ वर्षों में विकृत हो गई, जैसा कि रायजमेकरों, स्क्रीज़नेकर्स, और ग्रेमेन, 1999 द्वारा प्रलेखित है।) लेकिन हाल के वर्षों में इस मुद्दे पर कुछ सुधार हुआ है, जो कि सांख्यिकीय प्रगति के लिए बड़े हिस्से के कारण है। मिश्रित-प्रभाव वाले मॉडल में, जिनमें से शास्त्रीय मिश्रित मॉडल एनोवा को एक विशेष मामले के रूप में देखा जा सकता है। इन हालिया पत्रों में से कुछ में बेयेन, डेविडसन, और बेट्स (2008), मुरायामा, सकाकी, यान और स्मिथ (2014) और ( अहम ) जुड, वेस्टफॉल और केनी (2012) शामिल हैं। मुझे यकीन है कि कुछ ऐसे हैं जो मैं भूल रहा हूँ।
2. बिल्कुल नहीं। यह देखने केतरीके हैं कि क्या कोई कारक एक यादृच्छिक प्रभाव के रूप में बेहतर रूप से शामिल है या मॉडल में बिल्कुल भी नहीं है (उदाहरण के लिए, पिनहेइरो और बेट्स, 2000, पीपी 83-87; हालांकि बर्र, लेवी,स्केपर्स और टिली,देखें) 2013)। और निश्चित रूप से यह निर्धारित करने के लिए शास्त्रीय मॉडल तुलना तकनीकें हैं कि क्या कोई कारक निश्चित प्रभाव के रूप में बेहतर रूप से शामिल है या नहीं (यानी, वेस्ट)। लेकिन मुझे लगता है कि यह निर्धारित करना कि किसी कारक को निश्चित माना जाता है या यादृच्छिक को आम तौर पर एक वैचारिक प्रश्न के रूप में सबसे अच्छा छोड़ दिया जाता है, जिसका उत्तर अध्ययन के डिजाइन और उससे निकाले जाने वाले निष्कर्षों की प्रकृति पर विचार करके दिया जाना है।एफ
मेरे स्नातक सांख्यिकी प्रशिक्षकों में से एक, गैरी मैकलेलैंड ने यह कहना पसंद किया कि शायद सांख्यिकीय अनुमान का मौलिक प्रश्न है: "किसकी तुलना में?" गैरी के बाद, मुझे लगता है कि हम उस वैचारिक प्रश्न को फ्रेम कर सकते हैं जिसका मैंने ऊपर उल्लेख किया है: काल्पनिक प्रयोगात्मक परिणामों का संदर्भ वर्ग क्या है जो मैं अपने वास्तविक देखे गए परिणामों की तुलना करना चाहता हूं? मनोचिकित्सा के संदर्भ में रहना, और एक प्रयोगात्मक डिजाइन पर विचार करना, जिसमें हमारे पास दो शब्दों में से एक में वर्गीकृत किए गए शब्दों का एक नमूना है, जो दो स्थितियों में वर्गीकृत हैं (क्लार्क, 1973 की लंबाई पर चर्चा की गई विशेष डिजाइन), मैं इस पर ध्यान केंद्रित करूंगा। दो संभावनाएँ:
- प्रयोगों का सेट, जिसमें प्रत्येक प्रयोग के लिए, हम सब्जेक्ट्स का एक नया नमूना, शब्दों का एक नया नमूना और जेनेरेटिव मॉडल से त्रुटियों का एक नया नमूना तैयार करते हैं। इस मॉडल के तहत, विषय और शब्द दोनों यादृच्छिक प्रभाव हैं।
- प्रयोगों का सेट, जिसमें प्रत्येक प्रयोग के लिए, हम विषयों का एक नया नमूना और त्रुटियों का एक नया नमूना बनाते हैं, लेकिन हम हमेशा शब्दों के एक ही सेट का उपयोग करते हैं । इस मॉडल के तहत, विषय यादृच्छिक प्रभाव हैं लेकिन शब्द निश्चित प्रभाव हैं।
इसे पूरी तरह से ठोस बनाने के लिए, नीचे दिए गए कुछ प्लॉट हैं (ऊपर) मॉडल 1 के तहत 4 सिम्युलेटेड प्रयोगों से काल्पनिक परिणामों के 4 सेट; (नीचे) मॉडल 2 के तहत 4 सिम्युलेटेड प्रयोगों से काल्पनिक परिणामों के 4 सेट। प्रत्येक प्रयोग दो तरीकों से परिणामों को देखता है: (बाएं पैनल) विषय द्वारा वर्गीकृत, विषय-दर-शर्त के साथ प्रत्येक विषय के लिए एक साथ साजिश रची और बांधा गया; (दाएं पैनल) शब्दों द्वारा समूहीकृत, बॉक्स प्लॉट प्रत्येक शब्द के लिए प्रतिक्रियाओं के वितरण को सारांशित करने के साथ। सभी प्रयोगों में 10 शब्दों का जवाब देने वाले 10 विषय शामिल हैं, और सभी प्रयोगों में प्रासंगिक स्थिति में बिना किसी अंतर के "शून्य परिकल्पना" सच है।
विषय और शब्द दोनों यादृच्छिक: 4 नकली प्रयोग
यहां ध्यान दें कि प्रत्येक प्रयोग में, विषय और शब्दों के लिए प्रतिक्रिया प्रोफ़ाइल पूरी तरह से अलग हैं। विषयों के लिए, हमें कभी-कभी कम समग्र उत्तरदाता, कभी-कभी उच्च उत्तरदाता, कभी-कभी ऐसे विषय मिलते हैं, जो बड़े शर्त अंतर दिखाते हैं, और कभी-कभी ऐसे विषय जो छोटे स्थिति अंतर दिखाते हैं। इसी तरह, शब्दों के लिए, हमें कभी-कभी ऐसे शब्द मिलते हैं जो कम प्रतिक्रियाओं को प्राप्त करते हैं, और कभी-कभी ऐसे शब्द मिलते हैं जो उच्च प्रतिक्रियाओं को प्राप्त करते हैं।
विषय यादृच्छिक, शब्द तय: 4 नकली प्रयोग
यहाँ ध्यान दें कि 4 सिम्युलेटेड प्रयोगों में, विषय हर बार अलग दिखते हैं, लेकिन शब्दों के लिए प्रतिक्रिया प्रोफ़ाइल मूल रूप से एक जैसी दिखती है, इस धारणा के अनुरूप कि हम इस मॉडल के तहत हर प्रयोग के लिए शब्दों के एक ही सेट का पुनः उपयोग कर रहे हैं।
हमारी पसंद है कि क्या हम सोचते हैं कि मॉडल 1 (विषय और शब्द दोनों यादृच्छिक) या मॉडल 2 (विषय यादृच्छिक, शब्द निर्धारित) प्रायोगिक परिणामों के लिए उपयुक्त संदर्भ वर्ग प्रदान करता है जिसे हमने वास्तव में देखा है कि क्या हालत में हेरफेर के हमारे आकलन से बड़ा फर्क पड़ सकता है। "काम किया।" हम मॉडल 2 के तहत मॉडल 1 के तहत डेटा में अधिक संभावना भिन्नता की उम्मीद करते हैं, क्योंकि अधिक "चलती भागों" हैं। इसलिए यदि हम जो निष्कर्ष निकालना चाहते हैं वह मॉडल 1 की मान्यताओं के साथ अधिक सुसंगत है, जहां मौका परिवर्तनशीलता अपेक्षाकृत अधिक है, लेकिन हम मॉडल 2 की मान्यताओं के तहत अपने डेटा का विश्लेषण करते हैं, जहां मौका परिवर्तनशीलता अपेक्षाकृत कम है, तो हमारी टाइप 1 त्रुटि है हालत अंतर के परीक्षण के लिए दर कुछ (संभवतः काफी बड़ी) सीमा तक भड़काने वाली है। अधिक जानकारी के लिए, नीचे संदर्भ देखें।
संदर्भ
बेयेन, आरएच, डेविडसन, डीजे, और बेट्स, डीएम (2008)। विषयों और वस्तुओं के लिए यादृच्छिक प्रभावों के साथ मिश्रित-प्रभाव मॉडलिंग। स्मृति और भाषा का जर्नल, 59 (4), 390-412। पीडीएफ
बर्र, डीजे, लेवी, आर।, शेपर्स, सी।, और टिली, एचजे (2013)। पुष्टित्मक परिकल्पना परीक्षण के लिए यादृच्छिक प्रभाव संरचना: इसे अधिकतम रखें। जर्नल ऑफ़ मेमोरी एंड लैंग्वेज, 68 (3), 255-278। पीडीएफ
क्लार्क, एचएच (1973)। भाषा के रूप में निश्चित-प्रभाव की गिरावट: मनोवैज्ञानिक अनुसंधान में भाषा के आँकड़ों की आलोचना। मौखिक सीखने और मौखिक व्यवहार के जर्नल, 12 (4), 335-359। पीडीएफ
कोलमैन, ईबी (1964)। भाषा की आबादी के लिए सामान्यीकरण। मनोवैज्ञानिक रिपोर्ट, 14 (1), 219-226।
जुड, सीएम, वेस्टफॉल, जे।, और केनी, डीए (2012)। सामाजिक मनोविज्ञान में एक यादृच्छिक कारक के रूप में उत्तेजनाओं का इलाज: एक व्यापक और बड़े पैमाने पर अनदेखी समस्या का एक नया और व्यापक समाधान। व्यक्तित्व और सामाजिक मनोविज्ञान की पत्रिका, 103 (1), 54. पीडीएफ
मुरायामा, के।, साकची, एम।, यान, वीएक्स और स्मिथ, जीएम (2014)। टाइप टू एरर इन्फ्लेशन इनफ्लेशन बाई ट्रेडिशनल बाई-पार्टिसिपेंट एनालिसिस टू मेटेमोरी एक्यूरेसी: ए जनरलाइज्ड मिक्स्ड-इफेक्ट्स मॉडल पर्सपेक्टिव। प्रायोगिक मनोविज्ञान जर्नल: सीखना, स्मृति और अनुभूति। पीडीएफ
पिनहेइरो, जेसी, और बेट्स, डीएम (2000)। एस और एस-प्लस में मिश्रित-प्रभाव मॉडल। स्प्रिंगर।
राएजमेकर्स, जेजी, स्क्रीज़नेमेकर्स, जे।, और ग्रेमेन, एफ। (1999)। कैसे "भाषा-के रूप में तय-प्रभाव गिरावट" से निपटने के लिए: आम गलतफहमी और वैकल्पिक समाधान। जर्नल ऑफ़ मेमोरी एंड लैंग्वेज, 41 (3), 416-426। पीडीएफ