मेरे पास हाल ही में एक क्लाइंट मेरे पास बूटस्ट्रैप विश्लेषण करने के लिए आया था क्योंकि एक एफडीए समीक्षक ने कहा कि उनकी त्रुटियों में परिवर्तनशील प्रतिगमन अमान्य था क्योंकि जब साइटों के डेटा को पूल करते हुए विश्लेषण में तीन साइटों से पूलिंग डेटा शामिल होते हैं, जहां दो साइटों में कुछ नमूने शामिल थे जो कि थे वही।
पृष्ठभूमि
ग्राहक के पास एक नई परख विधि थी जिसे वे दिखाना चाहते थे कि वह मौजूदा स्वीकृत पद्धति के "समकक्ष" है। उनका दृष्टिकोण समान नमूनों पर लागू दोनों तरीकों के परिणामों की तुलना करना था। परीक्षण करने के लिए तीन साइटों का उपयोग किया गया था। प्रत्येक साइट पर डेटा के लिए एरर्स-इन-वेरिएबल्स (डेमिंग रिग्रेशन) लागू किया गया था। विचार यह है कि यदि प्रतिगमन ढलान पैरामीटर को 1 के करीब और 0 के निकट अवरोधन दिखाता है, तो यह दर्शाता है कि दो परख तकनीकों ने लगभग समान परिणाम दिए हैं और इसलिए नई पद्धति को मंजूरी दी जानी चाहिए। साइट 1 पर उनके पास 45 नमूने थे जो उन्हें 45 युग्मित प्रेक्षण देते थे। साइट 2 में 40 नमूने और साइट 3, 43 नमूने थे। उन्होंने तीन अलग-अलग डेमिंग रिग्रेशन (दो विधियों के लिए माप त्रुटियों के लिए 1 का अनुपात मानते हुए) किया। इसलिए एल्गोरिथ्म ने लम्बवत लंबवत दूरी के योग को कम कर दिया।
अपने सबमिशन में क्लाइंट ने बताया कि साइटों 1 और 2 में इस्तेमाल किए गए कुछ नमूने समान थे। समीक्षा में एफडीए समीक्षक ने कहा कि डेमिंग प्रतिगमन अमान्य था क्योंकि सामान्य नमूनों का उपयोग किया गया था जो "हस्तक्षेप" का कारण बनता है जो मॉडल की मान्यताओं को अमान्य करता है। उन्होंने अनुरोध किया कि इस व्यवधान को ध्यान में रखते हुए बूटस्ट्रैप समायोजन को डेमिंग परिणामों पर लागू किया जाए।
उस समय से जब क्लाइंट को यह नहीं पता था कि बूटस्ट्रैप मुझे कैसे करना है, तो शब्द का व्यवधान अजीब था और मुझे बिल्कुल यकीन नहीं था कि समीक्षक को क्या मिल रहा था। मैंने माना कि वास्तव में यह था कि क्योंकि जमा किए गए डेटा में सामान्य नमूने थे, सामान्य नमूनों के लिए सहसंबंध होगा और इसलिए मॉडल त्रुटि की शर्तें सभी स्वतंत्र नहीं होंगी।
ग्राहकों का विश्लेषण
तीन अलग-अलग रजिस्ट्रियां बहुत समान थीं। प्रत्येक में ढलान पैरामीटर 1 के करीब होता है और 0. के पास होता है। 95% आत्मविश्वास अंतराल में ढलान और अवरोधन के लिए क्रमशः 1 और 0 होता है। मुख्य अंतर साइट 3 पर थोड़ा अधिक अवशिष्ट विचरण था। इसके अलावा उन्होंने इस परिणाम की तुलना ओएलएस करने से की और उन्हें बहुत समान पाया (केवल एक मामले में ओएलएस पर आधारित ढलान के लिए आत्मविश्वास अंतराल 1 नहीं था)। इस मामले में जहां ढलान के लिए ओएलएस सीआई में 1 नहीं था अंतराल का ऊपरी भाग 0.99 जैसा कुछ था।
परिणाम के साथ सभी तीन साइटों पर समान होने के कारण साइट डेटा उचित था। क्लाइंट ने एक पूलिंग डेमिंग रिग्रेशन किया, जिसके परिणामस्वरूप समान परिणाम प्राप्त हुए। इन परिणामों को देखते हुए मैंने क्लाइंट के लिए एक रिपोर्ट लिखी जिसमें दावा किया गया कि प्रतिगमन अमान्य थे। मेरा तर्क यह है कि चूँकि दोनों चर में समान माप त्रुटियां हैं, इसलिए ग्राहक समझौते / असहमति दिखाने के तरीके के रूप में डेमिंग प्रतिगमन का उपयोग करने के लिए सही था। व्यक्तिगत साइट प्रतिगमन में सहसंबद्ध त्रुटियों की कोई समस्या नहीं थी क्योंकि किसी भी साइट के भीतर कोई नमूने नहीं दोहराए गए थे। तंग आत्मविश्वास अंतराल प्राप्त करने के लिए पूलिंग डेटा।
यह कठिनाई साइट 1 से कहे गए आम नमूने के साथ डेटा को केवल पूल करके फिर से प्राप्त की जा सकती है। साथ ही तीन व्यक्तिगत साइट के मॉडल में समस्या नहीं है और वे वैध हैं। यह मुझे पूलिंग के बिना भी समझौते के मजबूत सबूत प्रदान करता है। इसके अलावा माप 1 और 2 साइटों पर स्वतंत्र रूप से आम साइटों के लिए लिया गया था। इसलिए मुझे लगता है कि सभी डेटा का उपयोग करते हुए भी पूल किए गए विश्लेषण मान्य हैं क्योंकि साइट 1 पर एक नमूना के लिए माप त्रुटियां साइट पर संबंधित नमूने में माप त्रुटियों के साथ सहसंबद्ध नहीं हैं। यह वास्तव में डिज़ाइन में एक बिंदु को दोहराने की मात्रा है अंतरिक्ष जो एक समस्या नहीं होनी चाहिए। यह सहसंबंध / "हस्तक्षेप" नहीं बनाता है।
अपनी रिपोर्ट में मैंने लिखा था कि बूटस्ट्रैप विश्लेषण अनावश्यक था क्योंकि इसमें समायोजित करने के लिए कोई सहसंबंध नहीं है। तीन साइट मॉडल वैध थे (साइटों के भीतर कोई संभावित "हस्तक्षेप") और पूलिंग करते समय साइट 1 पर आम नमूनों को हटाने के लिए एक पूलित विश्लेषण किया जा सकता था। इस तरह के पूलित विश्लेषण में हस्तक्षेप की समस्या नहीं हो सकती है। बूटस्ट्रैप समायोजन आवश्यक नहीं होगा क्योंकि इसमें समायोजित करने के लिए कोई पूर्वाग्रह नहीं है।
निष्कर्ष
ग्राहक मेरे विश्लेषण से सहमत थे लेकिन इसे एफडीए के पास ले जाने से डरते थे। वे मुझे वैसे भी बूटस्ट्रैप समायोजन करने के लिए चाहते हैं।
मेरे सवाल
ए) क्या आप सहमत हैं (1) क्लाइंट के परिणामों का मेरा विश्लेषण और (2) मेरा तर्क है कि बूटस्ट्रैप अनावश्यक है।
बी) यह देखते हुए कि मुझे डिमॉस्ट्रेशन को बूटस्ट्रैप करना है, क्या एसएएस या आर की कोई प्रक्रिया है जो मेरे लिए बूटस्ट्रैप के नमूनों पर डीमिंग रिग्रेशन करने के लिए उपलब्ध हैं?
EDIT: बिल ह्यूबर के सुझाव को देखते हुए, मैं y पर x और x दोनों पर प्रतिगमन द्वारा त्रुटियों-चर चर में सीमाओं को देखने की योजना बनाता हूं। हम पहले से ही जानते हैं कि ओएलएस के एक संस्करण के लिए उत्तर अनिवार्य रूप से त्रुटियों-में-चर के समान है, जब दो त्रुटि संस्करण समान माने जाते हैं। यदि यह अन्य प्रतिगमन के लिए सच है तो मुझे लगता है कि यह दिखाएगा कि डेमिंग प्रतिगमन एक उचित समाधान देता है। क्या आप सहमत हैं?
क्लाइंट के अनुरोध को पूरा करने के लिए मुझे अनुरोधित बूटस्ट्रैप विश्लेषण करने की आवश्यकता है जो अस्पष्ट रूप से परिभाषित किया गया था। नैतिक रूप से मुझे लगता है कि सिर्फ बूटस्ट्रैप प्रदान करना गलत होगा क्योंकि यह वास्तव में क्लाइंट की वास्तविक समस्या को हल नहीं करता है, जो कि उनकी परख मापने की प्रक्रिया को सही ठहराना है। इसलिए मैं उन्हें दोनों विश्लेषण और अनुरोध दूंगा, कम से कम वे एफडीए को बताएं कि बूटस्ट्रैप के अलावा मैंने उलटा प्रतिगमन किया और डेमिंग रजिस्टरों को बाध्य किया जो मुझे लगता है कि अधिक उपयुक्त है। इसके अलावा, मुझे लगता है कि विश्लेषण से पता चलेगा कि उनकी विधि संदर्भ के बराबर है और डेमिंग प्रतिगमन इसलिए भी पर्याप्त है।
मैं R प्रोग्राम का उपयोग करने की योजना बना रहा हूं जो @whuber ने अपने उत्तर में मुझे डेमिंग रिग्रेशन बूटस्ट्रैप करने के लिए सक्षम करने का सुझाव दिया। मैं R से बहुत परिचित नहीं हूं लेकिन मुझे लगता है कि मैं यह कर सकता हूं। मैंने आर स्टूडियो के साथ आर स्थापित किया है। क्या यह मेरे जैसे नौसिखिए के लिए काफी आसान बना देगा?
इसके अलावा, मेरे पास एसएएस है और एसएएस में अधिक आरामदायक प्रोग्रामिंग है। इसलिए अगर किसी को एसएएस में ऐसा करने का कोई तरीका पता है, तो मैं इसके बारे में जानना पसंद करूंगा।