क्या "नो फ्री लंच प्रमेय" सामान्य सांख्यिकीय परीक्षणों पर लागू होता है?


12

मैं जिस महिला के लिए काम कर रही थी, उसने मुझे कुछ आंकड़ों पर एक तरफ़ा एनोवा करने के लिए कहा। मैंने जवाब दिया कि डेटा दोहराए गए उपाय (समय श्रृंखला) डेटा थे, और मुझे लगा कि स्वतंत्रता की धारणा का उल्लंघन किया गया था। उसने उत्तर दिया कि मुझे मान्यताओं की चिंता नहीं करनी चाहिए, बस परीक्षण करना चाहिए और वह इस बात को ध्यान में रखेगी कि मान्यताओं को पूरा नहीं किया गया है।

जो मुझे ठीक नहीं लगा। मैंने कुछ शोध किया, और डेविड रॉबिन्सन के इस अद्भुत ब्लॉग पोस्ट को पाया, K- मतलब क्लस्टरिंग एक मुफ्त दोपहर का भोजन नहीं है , जिसने मुझे नो फ्री लंच प्रमेय के लिए उजागर किया। मैंने मूल कागज पर देखा है और कुछ सामान पर अनुसरण करते हैं, और स्पष्ट रूप से गणित मेरे सिर पर थोड़ा सा है।

इसका सार - डेविड रॉबिन्सन के अनुसार - ऐसा प्रतीत होता है कि एक सांख्यिकीय परीक्षण की शक्ति इसकी मान्यताओं से आती है। और वह दो महान उदाहरण देता है। जैसा कि मैंने इसके बारे में अन्य लेखों और ब्लॉग पोस्टों के माध्यम से उतारा, यह हमेशा पर्यवेक्षित सीखने या खोज के संदर्भ में संदर्भित होता है।

तो मेरा सवाल यह है कि क्या यह प्रमेय सांख्यिकीय परीक्षणों पर सामान्य रूप से लागू होता है? दूसरे शब्दों में, क्या कोई कह सकता है कि टी-टेस्ट या एनोवा की शक्ति इसके पालन से लेकर धारणाओं तक आती है और नो फ्री लंच प्रमेय का हवाला देती है?

मैंने अपने पूर्व बॉस को मेरे द्वारा किए गए काम के बारे में एक अंतिम दस्तावेज दिया है, और मैं यह जानना चाहूंगा कि क्या मैं यह बताने में नो फ्री लंच प्रमेय का संदर्भ दे सकता हूं कि आप केवल एक सांख्यिकीय परीक्षण की मान्यताओं को अनदेखा नहीं कर सकते हैं और कहेंगे कि आप इसे ले लेंगे परिणामों का मूल्यांकन करते समय ध्यान दें।


4
आप बार-बार एनोवा को बार-बार "गुप्त रूप से" क्यों नहीं करते हैं?
होर्स्ट ग्रुनबश

1
@ HorstGrünbusch वास्तव में, डेटा और परीक्षण से पहले मंच पर चर्चा की गई है, बार-बार उपायों एनोवा के बारे में विशिष्ट प्रश्नों के साथ, और यह पता चलता है कि एक रैखिक मिश्रित प्रभाव मॉडल शायद सबसे अच्छा विकल्प है।
rwjones

2
यह पहले से ही अच्छी तरह से उत्तर दिया गया है, इसलिए एक अधिक फ़्लिपेंट प्रतिक्रिया को जोड़ा जा सकता है। आप अपने बॉस से पूछ सकते हैं कि वह मान्यताओं के उल्लंघन के परिणामों को कैसे ध्यान में रखेगा ("सतर्क रहना" कुछ नहीं से बेहतर होगा!)। संक्षेप में, यह जानने के लिए पर्याप्त समझ और अनुभव प्राप्त करना एक लंबा और कठिन मार्ग है जब आप मान्यताओं के बारे में लापरवाह हो सकते हैं। रूपर्ट जी। मिलर के परे एनोवा (न्यूयॉर्क: विली, 1986 और बाद में पुनर्मुद्रण) परिणामों पर एक अच्छा स्रोत है और इसमें एक प्रमुख विषय यह है कि स्वतंत्रता की धारणा को अनदेखा करना सबसे खतरनाक चीजों में से एक है जो आप कर सकते हैं।
निक कॉक्स

1
@NickCox खैर, वह अब मेरे मालिक नहीं हैं, और यह विशेष स्थिति मुख्य कारण है। यह मूल रूप से एक अन्यथा सभ्य अनुसंधान वातावरण में उसकी ओर से बहुत मैला सोच और सुस्त परियोजना प्रबंधन की परिणति थी। एक तरफ, किताब की सिफारिश के लिए धन्यवाद। इसकी ध्वनि से, यह उन चीजों में से एक है जिसे मैं अपनी अंतिम रिपोर्ट में उद्धृत करना चाहता हूं।
rwjones

जवाबों:


11

मैं एक सबूत के बारे में नहीं जानता, लेकिन मैं शर्त लगाता हूं कि यह आम तौर पर लागू होता है। एक उदाहरण 2 उपचार समूहों में से प्रत्येक में 2 विषयों के साथ एक प्रयोग है। विल्कोक्सन परीक्षण संभवतः 0.05 स्तर पर महत्वपूर्ण नहीं हो सकता है, लेकिन टी-परीक्षण कर सकता है। आप कह सकते हैं कि इसकी शक्ति इसकी मान्यताओं से आधे से अधिक है, न कि केवल डेटा से। आपकी मूल समस्या के लिए, यह आगे बढ़ना उचित नहीं है जैसे कि विषय प्रति अवलोकन स्वतंत्र हैं। तथ्य के बाद चीजों को ध्यान में रखना निश्चित रूप से बहुत विशेष परिस्थितियों (जैसे, क्लस्टर सैंडविच अनुमानक) को छोड़कर अच्छा सांख्यिकीय अभ्यास नहीं है।


2

आप चाहें तो नो फ्री लंच प्रमेय का हवाला दे सकते हैं, लेकिन आप सिर्फ मोडस पोंन्स (जिसे डिटैचमेंट के नियम के रूप में भी जाना जाता है, कटौती का तर्क दे सकते हैं) का हवाला दे सकते हैं , जो नो लंच प्रमेय का मूल है

नो फ्री लंच प्रमेय तथ्य कोई एल्गोरिथ्म है कि सभी प्रयोजनों के फिट कर सकते हैं बनाया जा सकता है: एक अधिक विशिष्ट विचार धरना। दूसरे शब्दों में, नो फ्री लंच प्रमेय मूल रूप से कह रहा है कि कोई एल्गोरिथम जादू की गोली नहीं है । मोडस पोंन्स पर यह जड़ है, क्योंकि सही परिणाम देने के लिए एक एल्गोरिथ्म या एक सांख्यिकीय परीक्षण के लिए, आपको प्रीमियर को संतुष्ट करना होगा।

सभी गणितीय प्रमेयों की तरह, यदि आप प्रीमियर का उल्लंघन करते हैं, तो सांख्यिकीय परीक्षा सिर्फ समझदारी से खाली होती है, और आप इससे कोई सच्चाई नहीं निकाल सकते। इसलिए यदि आप अपने परीक्षण का उपयोग करके अपने डेटा की व्याख्या करना चाहते हैं, तो आपको यह मान लेना चाहिए कि आवश्यक प्रीमियर मिलते हैं, यदि वे नहीं हैं (और आप जानते हैं कि), तो आपका परीक्षण गलत है।

ऐसा इसलिए है क्योंकि वैज्ञानिक तर्क में कटौती पर आधारित है: मूल रूप से, आपका परीक्षण / कानून / प्रमेय एक निहितार्थ नियम है , जो कहता है कि यदि आपके पास प्रीमियर है Aतो आप निष्कर्ष निकाल सकते हैं B: A=>Bलेकिन अगर आपके पास नहीं है A, तो आप या तो हो सकते हैं Bया नहीं B, और दोनों ही मामले सही हैं , यह तार्किक अनुमान / कटौती के मूल सिद्धांतों (मोडस पोंन्स नियम) में से एक है। दूसरे शब्दों में, यदि आप प्रीमियर का उल्लंघन करते हैं, तो परिणाम कोई फर्क नहीं पड़ता है, और आप कुछ भी नहीं घटा सकते हैं

निहितार्थ की बाइनरी तालिका याद रखें:

A   B   A=>B
F   F    T
F   T    T
T   F    F
T   T    T

तो आपके मामले में, सरल करने के लिए, आपके पास है Dependent_Variables => ANOVA_correct। अब, यदि आप स्वतंत्र चर का उपयोग करते हैं, इस प्रकार Dependent_Variablesहै False, तो निहितार्थ सही होगा, क्योंकि Dependent_Variablesधारणा का उल्लंघन किया गया है।

बेशक यह सरल है, और व्यवहार में आपका एनोवा परीक्षण अभी भी उपयोगी परिणाम दे सकता है क्योंकि आश्रित चर के बीच लगभग हमेशा कुछ हद तक स्वतंत्रता है, लेकिन यह आपको यह विचार देता है कि आप मान्यताओं को पूरा किए बिना सिर्फ परीक्षण पर भरोसा क्यों नहीं कर सकते। ।

हालाँकि, आप उन परीक्षणों का भी उपयोग कर सकते हैं, जो आपकी समस्या को कम करके मूल द्वारा संतुष्ट नहीं होते हैं : स्वतंत्र रूप से बाधा को आराम से, आपका परिणाम अभी भी सार्थक हो सकता है, परग्रही गारंटी नहीं दी जाती (क्योंकि तब आपके परिणाम कम समस्या पर लागू होते हैं, नहीं पूर्ण समस्या, इसलिए आप हर परिणाम का अनुवाद नहीं कर सकते हैं सिवाय इसके कि अगर आप यह साबित कर सकें कि नई समस्या की अतिरिक्त बाधाएं आपके परीक्षण और इस प्रकार आपके परिणामों को प्रभावित नहीं करती हैं)।

व्यवहार में, यह अक्सर व्यावहारिक डेटा को मॉडल करने के लिए उपयोग किया जाता है, उदाहरण के लिए नाइव बेस का उपयोग करके, मॉडलिंग पर निर्भर (स्वतंत्र के बजाय) चर का उपयोग करके एक मॉडल जो स्वतंत्र चर ग्रहण करता है, और आश्चर्यजनक रूप से यह अक्सर बहुत अच्छा काम करता है, और कभी-कभी मॉडल लेखांकन से बेहतर होता है। निर्भरता के लिएजब डेटा बिल्कुल सभी अपेक्षाओं को पूरा नहीं करता है, तो आप एनोवा का उपयोग कैसे करें, इस सवाल से भी दिलचस्पी ले सकते हैं ।

सारांश में: यदि आप व्यावहारिक डेटा पर काम करने का इरादा रखते हैं और आपका लक्ष्य किसी वैज्ञानिक परिणाम को साबित करना नहीं है, बल्कि एक ऐसी प्रणाली बनाना है जो बस काम करती है (यानी, एक वेब सेवा या जो भी व्यावहारिक अनुप्रयोग), स्वतंत्रता धारणा (और शायद अन्य धारणाएं) आराम से किया जा सकता है, लेकिन यदि आप कुछ सामान्य सत्य को कम करने / साबित करने की कोशिश कर रहे हैं , तो आपको हमेशा उन परीक्षणों का उपयोग करना चाहिए जिन्हें आप गणितीय रूप से गारंटी दे सकते हैं (या कम से कम सुरक्षित और साबित मान लें) कि आप सभी प्रीमियर को पूरा करते हैं


2
अगर मैं आपके तर्क को सही ढंग से समझता हूं, तो आप यह कहकर शुरू करते हैं कि आँकड़ों का कोई भी अनुप्रयोग जिसके लिए मान्यताओं को पूरा नहीं किया गया है, वह मान्य है। अगर सच है, तो यह बहुत बुरी खबर है। अधिकांश अर्थमिति पुस्तकें (केवल एक उदाहरण देने के लिए) अपना समय यह समझाने में व्यतीत करती हैं कि यह गलत है (एक शब्द सारांश) और विस्तार से ठीक क्यों। हालाँकि, आप बीच-बीच में अपना व्यवहार बदलते रहते हैं और इसके बजाय जो आप वकालत करते हैं, वह फ़िज़ूल है। किसी तरह डेटा पर काम करना तब भी ध्वनि हो सकता है जब वह तार्किक रूप से अमान्य हो। मैं यहाँ सलाह की स्पष्ट रेखा नहीं देख सकता।
निक कॉक्स

मुद्दा यह है: यदि प्रीमियर का उल्लंघन किया जाता है, तो आप अनुमान के पक्षपाती होने के बाद से परीक्षण के परिणामों को अंकित मूल्य पर नहीं ले सकते। हालाँकि, आप अभी भी इसे आज़मा सकते हैं और यदि आप आश्वस्त और पर्याप्त अनुभवी हैं, तो आप अभी भी इससे कुछ प्राप्त कर सकते हैं, लेकिन अधिकतर व्यावहारिक कार्यान्वयन पर जहाँ आप वास्तव में वैज्ञानिक तर्क के बारे में परवाह नहीं करते हैं (आप सिर्फ मॉडल बनाने की कोशिश कर रहे हैं कुछ व्यावहारिक लक्ष्य के लिए डेटा, दुनिया के बारे में कुछ अच्छी तरह से जमी हुई सामान्य सच्चाई का अनुमान लगाने की कोशिश नहीं कर रहा है)। तो मेरा जवाब "एक-शब्द सारांश" नहीं है, यह सिर्फ सामान्य मामला (गलत) बनाम विशिष्ट मामला है (ठीक हो सकता है)।
23:23 बजे जौब

पुनश्च: मेरा कथन न केवल सांख्यिकी अनुप्रयोगों की चिंता करता है, बल्कि किसी भी तार्किक या गणितीय प्रमेय / नियम / परीक्षण के किसी भी आवेदन, यह अनुमान और प्रेरण का उपयोग करने वाले किसी भी तर्क का सच है। लेकिन मुझे आपकी अर्थमिति की किताबों के संदर्भों में दिलचस्पी है, ओपी के सवाल के बारे में टिप्पणी में आपके द्वारा दिया गया अन्य संदर्भ बहुत प्रासंगिक था।
23:23 बजे जौब

टिप्पणी जोड़ने के लिए धन्यवाद, लेकिन मेरा कहना है कि मुझे आपका कथन विशेष रूप से स्पष्ट या अच्छी तरह से स्थापित नहीं मिला। मैं यह नहीं देख सकता कि काम करने वाले वैज्ञानिक (मैं एक हूं) वैज्ञानिक तर्क और व्यावहारिक लक्ष्यों के लिए डेटा विश्लेषण के बीच आपके अंतर को समझूंगा। मैं इसे जेफ वोल्ड्रिज के रूप में पाठ्यपुस्तकों की सराहना करने के अलावा वहां छोड़ दूंगा, जैसा कि विस्तारित निबंध हैं, जिनमें धारणाएं महत्वपूर्ण हैं, जो नहीं हैं, और बीच में बड़े ग्रे क्षेत्र। amazon.com/Jeffrey-M.-Woldridge/e/B001IGLWNY
Nick Cox

संदर्भ के लिए धन्यवाद। मुझे सिर्फ एक और सवाल मिला है जहां उन्होंने एक पेपर का उल्लेख किया है जो बताता है कि भोले-भाले स्वतंत्रता की धारणा अभी भी आश्रित चर के साथ डेटा पर काम कर सकती है: "कागज यह साबित करने के लिए लगता है कि (भोले) बेज़ न केवल तब अच्छा होता है जब सुविधाएँ स्वतंत्र होती हैं, बल्कि निर्भरता भी होती हैं एक दूसरे से सुविधाओं के समान हैं / सुविधाओं के बीच विपरीत हैं " आंकड़े ।stackexchange.com
जाबर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.