अमेरिकी जनगणना ब्यूरो की आय और कार्यक्रम की भागीदारी (एसआईपीपी) का सर्वेक्षण, अन्य लोगों के बीच, निम्नलिखित चर हैं:
epdtbhn
: संदर्भ अवधि के दौरान काम का भुगतान कियाersnowrk
: संदर्भ अवधि के दौरान नौकरी नहीं करने का मुख्य कारणtpmsum*
: इस महीने में मिली नौकरी से कमाईeeno*
: एक्रॉस-वेव एंप्लॉयर इंडेक्स / नंबर यूनीक जॉब नंबर जो लहर से लहर की तरह ही रहेगा।
अब, मैं 2008 की लहर से निम्नलिखित व्यक्ति को देख रहा हूँ:
br ssuid ersnowrk epdjbthn tpmsum* eeno* if ssuid == "019925011535"
- मई 2012 में है कि व्यक्ति, काम खोजने में असमर्थ के रूप में सूचना मिली थी
epdjbthn == No
। - अगले महीने में
epdtbhn == Yes
: उसे / उसके पास एक नौकरी थी (लगातारersnowrk == Not In Universe
)। हालांकि, सभी रोजगार चर (tpmsum*
,eeno*
) भी सभी हैंnot in Universe
।
यह स्पष्ट रूप से असंगत डेटा है। के लिए आवंटन ध्वज epdjbthn
कहता है कि डेटा लगाया नहीं गया था। रोजगार चर के लिए आवंटन ध्वज अर्थहीन है (जैसा कि वे ब्रह्मांड में नहीं हैं)। क्या इसका मतलब यह है कि मैं उस व्यक्ति पर भरोसा कर सकता हूं जिसने वास्तविक नौकरी पाई है, भले ही कोई अन्य रोजगार चर उसकी ओर क्यों न बोल रहा हो?
सर्वेक्षण डेटा में क्लासिक असंगति उदाहरण। ब्रिटेन के लिए बीएचपीएस का उपयोग करते समय इस तरह के कई थे। क्या यूनिवर्स इन यूनिवर्स भी गायब डेटा के लिए नहीं है? यदि आप मजदूरी से संबंधित मुद्दों का अध्ययन करने में रुचि रखते हैं, तो यह एक उपयोगी अवलोकन नहीं है, और यदि आप कुछ प्रकार के लापता-डेटा चयन कर रहे हैं, तो गैर-लापता विशेषताओं के आधार पर इसका मूल्यांकन कर सकते हैं। अन्य विकल्प नौकरी इतिहास को देखना है। जैसा कि आपका डेटा एक पैनल लगता है, हो सकता है कि वे इस तरह के चर शामिल हों। बीएचपीएस कम से कम उनमें से भरा हुआ है, और आपको इन मुद्दों का मूल्यांकन करने की अनुमति देता है।
—
ल्यूकोनाचो
मैंने इस प्रश्न को स्पष्ट करने के लिए संपादित किया है कि यह अमेरिका से संबंधित है क्योंकि SIPP के अन्य अर्थ कहीं और हो सकते हैं (यूके में यह स्व-निवेशित व्यक्तिगत पेंशन के लिए है)।
—
एडम बैली
@luchonacho मैं भर्ती और फर्मिंग को मापना चाहता हूं, और एक काम पर रखने और श्रम बल से बाहर निकलने के बीच अंतर करना चाहता हूं।
—
FooBar
मिमी, तो ये वास्तव में महत्वपूर्ण अवलोकन हो सकते हैं। क्या आपके पास नौकरी इतिहास है? अन्य चर जैसे फर्म का आकार, व्यवसाय, उद्योग, या कुछ और जो इंगित करता है कि क्या व्यक्ति वास्तव में कार्यरत है? आप अपने डेटा को गुणवत्ता द्वारा वर्गीकृत कर सकते हैं, जैसे: पूर्ण जानकारी, आंशिक जानकारी, कोई जानकारी नहीं, और अलग-अलग सबसेट के लिए अपना विश्लेषण चलाएं। यह एक ब्याज तुलना हो सकती है। किसी भी मामले में, मैं अभी भी कुछ बुनियादी चयन विश्लेषण प्रदान करूंगा जैसे कि हेक्मैन या तो, चयन पूर्वाग्रह की जांच करने के लिए।
—
ल्यूकोनाचो