कुछ महीने पहले मैंने इस संगठन में इंटर्न किया; और, एक दूर के वर्तमान के रूप में, मैंने अपने अंतिम सप्ताह को बिताने का फैसला किया, जो भी समय मेरे पास था, उन कारकों की जांच करने के लिए जो शिक्षक वेतन को प्रभावित करते हैं। एक समस्या जो मुझे शिक्षक के वेतन के साथ मिली, वह यह थी कि दिए गए राज्य का वितरण तिरछा था। मेरे पास बहुत सारे अवलोकन थे जो वेतन स्पेक्ट्रम के निचले छोर से जुड़े थे। मैंने अपने आश्रित चर (शिक्षक वेतन) में एक तुलनात्मक वेतन सूचकांक को शामिल करके इसे हल करने की कोशिश की, लेकिन जो परिणाम मुझे मिले वे मेरी परियोजना के दायरे के लिए पूरी तरह से पुराने थे। मैंने इसके बजाय अपने आश्रित चर को लॉग इन करने का निर्णय लिया। यह अच्छा था क्योंकि अब मेरी मजदूरी का सामान्य वितरण हो गया था और यह हिस्टोग्राम में बिल्कुल सही लग रहा था। जब मैंने परीक्षण करना शुरू किया, तो मैं उस बिंदु पर पहुंच गया, जहां मुझे एक अंतिम स्वतंत्र चर, संपत्ति कर रिटर्न के साथ छोड़ दिया गया था। मेरी संपत्ति कर रिटर्न टिप्पणियों में मेरे प्रामाणिक वेतन के साथ समस्या भी स्पष्ट थी। मेरे पास स्पेक्ट्रम के निचले छोर की ओर संपत्ति कर रिटर्न संख्या का एक बड़ा तिरछा था। तो, मैं इस चर के रूप में अच्छी तरह से लॉग किया और यह अभी भी ठीक परिकल्पना परीक्षण पारित कर दिया।
मुझे यकीन नहीं है कि यह ठीक है, लेकिन एक लॉग वेरिएबल के परिवर्तन को दूसरे लॉग वेरिएबल से तुलना करने से मुझे लोच मिली। यह मानते हुए कि यह सही है, मेरा प्रतिगमन समीकरण (कुछ LogWages = B0 + B1 (LogPropertyTaxReturns)) दो चरों के बीच की लोच को दर्शाता है। हालांकि यह सार्थक है? यदि मेरा लक्ष्य यह देखना था कि मेरे राज्य के किसी भी काउंटी में कौन सा चर सबसे अधिक प्रभावित शिक्षक वेतन है, तो दो वैरिएबल के बीच की लोच सहायक है? हम अपने जीवन स्तर को बढ़ाने के लिए सबसे कम शिक्षक के वेतन के साथ काउंटियों को ऊपर उठाना चाहते हैं, लेकिन मुझे डर है कि मैंने वास्तविक टिप्पणियों से इतनी दूर की है कि मेरा निष्कर्ष प्रतिगमन समीकरण निरर्थक है।
संपादित करें: मेरा एक बड़ा डर यह है कि मुझे संबंध दिखाने के लिए एक गैर-रेखीय मॉडल का उपयोग करना चाहिए था। मुझे लगता है कि इस लीनियर रिग्रेशन में सहयोग करने के लिए आश्रित और स्वतंत्र वैरिएबल दोनों ही किसी न किसी तरह से भ्रामक हैं।