दोनों परीक्षण उम्र-प्रतिक्रिया संबंध को स्पष्ट रूप से दर्शाते हैं, लेकिन वे अलग-अलग तरीकों से ऐसा करते हैं। कौन सा चयन करना है यह इस बात पर निर्भर करता है कि आप उस रिश्ते को कैसे चुनते हैं आपकी पसंद एक अंतर्निहित सिद्धांत पर निर्भर होना चाहिए, अगर वहाँ एक है; परिणामों से आप किस तरह की जानकारी निकालना चाहते हैं; और नमूना का चयन कैसे किया जाता है। यह उत्तर क्रम में इन तीन पहलुओं पर चर्चा करता है।
मैं उस भाषा का उपयोग करते हुए टी-टेस्ट और लॉजिस्टिक रिग्रेशन का वर्णन करूँगा जो मानती है कि आप लोगों की एक अच्छी तरह से परिभाषित आबादी का अध्ययन कर रहे हैं और इस जनसंख्या के लिए नमूने से निष्कर्ष निकालना चाहते हैं।
किसी भी प्रकार के सांख्यिकीय अनुमान का समर्थन करने के लिए हमें यह मान लेना चाहिए कि नमूना यादृच्छिक है।
एक टी-टेस्ट नमूना मानने वाले लोगों को मानता है "नहीं" आबादी में सभी उत्तरदाताओं का एक सरल यादृच्छिक नमूना है और नमूना "हां" में जवाब देने वाले लोग सभी हां-उत्तरदाताओं का एक सरल यादृच्छिक नमूना हैं आबादी।
एक टी-टेस्ट आबादी में दो समूहों में से प्रत्येक के भीतर उम्र के वितरण के बारे में अतिरिक्त तकनीकी धारणा बनाता है। टी-टेस्ट के विभिन्न संस्करण संभावित संभावनाओं को संभालने के लिए मौजूद हैं।
लॉजिस्टिक रिग्रेशन मान लेता है कि किसी भी उम्र के सभी लोग आबादी में उस उम्र के लोगों का एक सरल यादृच्छिक नमूना हैं। अलग-अलग आयु समूह "हां" प्रतिक्रियाओं की विभिन्न दरों का प्रदर्शन कर सकते हैं। ये दरें, जब लॉग ऑड्स (सीधे अनुपात के बजाय) के रूप में व्यक्त की जाती हैं, तो उन्हें उम्र के साथ (या उम्र के कुछ निर्धारित कार्यों के साथ) रैखिक रूप से संबंधित माना जाता है।
उम्र और प्रतिक्रिया के बीच गैर-रैखिक संबंधों को समायोजित करने के लिए लॉजिस्टिक प्रतिगमन को आसानी से बढ़ाया जाता है। इस तरह के विस्तार का उपयोग प्रारंभिक रैखिक धारणा की बहुलता का मूल्यांकन करने के लिए किया जा सकता है। यह बड़े डेटासेट के साथ व्यवहार्य है, जो गैर-रैखिकता प्रदर्शित करने के लिए पर्याप्त विवरण देता है, लेकिन अन्य डेटासेट के साथ अधिक उपयोग की संभावना नहीं है। अंगूठे का एक सामान्य नियम - कि प्रतिगमन मॉडल में मापदंडों के रूप में कई अवलोकनों का दस गुना होना चाहिए - सुझाव देता है कि गैर-शुद्धता का पता लगाने के लिए 20 से अधिक टिप्पणियों की आवश्यकता होती है (जो एक रैखिक फ़ंक्शन के अवरोधन और ढलान के अलावा तीसरे पैरामीटर की आवश्यकता होती है )।
एक टी-परीक्षण यह पता लगाता है कि क्या जनसंख्या में औसत आयुएं हां और ना के उत्तरदाताओं के बीच भिन्न हैं। एक लॉजिस्टिक रिग्रेशन का अनुमान है कि प्रतिक्रिया दर उम्र के अनुसार कैसे बदलती है। जैसे कि यह अधिक लचीला है और टी-टेस्ट की तुलना में अधिक विस्तृत जानकारी की आपूर्ति करने में सक्षम है। दूसरी ओर, यह समूहों में औसत आयु के बीच अंतर का पता लगाने के मूल उद्देश्य के लिए टी-टेस्ट की तुलना में कम शक्तिशाली है।
यह महत्वपूर्ण और गैर-महत्व के सभी चार संयोजनों को प्रदर्शित करने के लिए परीक्षणों की जोड़ी के लिए संभव है। इनमें से दो समस्याग्रस्त हैं:
टी-टेस्ट महत्वपूर्ण नहीं है, लेकिन लॉजिस्टिक रिग्रेशन है। जब दोनों परीक्षणों की धारणाएँ प्रशंसनीय हैं, तो ऐसा परिणाम व्यावहारिक रूप से असंभव है, क्योंकि टी-परीक्षण ऐसे विशिष्ट संबंध का पता लगाने की कोशिश नहीं कर रहा है जैसा कि लॉजिस्टिक प्रतिगमन द्वारा प्रस्तुत किया गया है। हालाँकि, जब वह संबंध सबसे पुराना और सबसे कम उम्र के विषयों को एक राय और मध्यम आयु वर्ग के विषयों को दूसरे के साथ साझा करने के लिए पर्याप्त रूप से अछूता है, तो गैर-संबंध संबंधों के लिए लॉजिस्टिक प्रतिगमन का विस्तार उस स्थिति का पता लगा सकता है और इसकी मात्रा बढ़ा सकता है, जिसे कोई भी टी-टेस्ट नहीं पहचान सकता है ।
टी-टेस्ट महत्वपूर्ण है, लेकिन लॉजिस्टिक रिग्रेशन प्रश्न में नहीं है। यह अक्सर होता है, खासकर जब युवा उत्तरदाताओं का एक समूह होता है, पुराने उत्तरदाताओं का एक समूह और बीच में कुछ लोग होते हैं। यह बिना और- हां-जवाब देने वालों की प्रतिक्रिया दरों के बीच एक महान अलगाव पैदा कर सकता है। यह टी-टेस्ट द्वारा आसानी से पता लगाया जाता है। हालाँकि, लॉजिस्टिक रिग्रेशन या तो अपेक्षाकृत कम विस्तृत जानकारी होगी कि प्रतिक्रिया दर वास्तव में उम्र के साथ कैसे बदलती है या फिर यह अनिर्णायक जानकारी होगी: "पूर्ण पृथक्करण" का मामला जहां सभी पुराने लोग एक तरह से प्रतिक्रिया करते हैं और सभी युवा लोग दूसरे तरीके से - लेकिन उस मामले में दोनों परीक्षणों में आमतौर पर बहुत कम पी-मान होंगे।
ध्यान दें कि प्रयोगात्मक डिजाइन कुछ परीक्षण मान्यताओं को अमान्य कर सकता है। उदाहरण के लिए, यदि आप एक स्तरीकृत डिजाइन में अपनी उम्र के अनुसार लोगों का चयन करते हैं, तो टी-टेस्ट की धारणा (प्रत्येक समूह उम्र के एक सरल यादृच्छिक नमूने को दर्शाता है) संदिग्ध हो जाता है। यह डिजाइन लॉजिस्टिक रिग्रेशन पर भरोसा करने का सुझाव देगा। यदि इसके बजाय आपके पास दो पूल हैं, एक नहीं-उत्तरदाता और एक हां-उत्तर देने वालों में से एक है, और अपनी उम्र का पता लगाने के लिए उन लोगों से यादृच्छिक रूप से चुना गया है, तो लॉजिस्टिक प्रतिगमन की नमूना धारणाएं संदिग्ध हैं जबकि टी-टेस्ट की पकड़ होगी। यह डिज़ाइन टी-टेस्ट के कुछ रूप का उपयोग करने का सुझाव देगा।
(दूसरा डिज़ाइन यहाँ मूर्खतापूर्ण लग सकता है, लेकिन ऐसी परिस्थितियों में जहां "उम्र" को कुछ विशेषता द्वारा प्रतिस्थापित किया जाता है, जो कि मुश्किल है, महंगा है, या इसे मापने के लिए समय लेने वाला आकर्षक हो सकता है।)