माप उपकरण के कारण छत के प्रभाव से कैसे निपटें?


12

मैंने विषयों को मापने के लिए साइकोफिजियोलॉजिकल डेटा एकत्र किया है '(दो समूहों) कंपन को देखने की क्षमता। छोटे और छोटे विस्थापन पर त्वचा के खिलाफ एक कंपन जांच चलती है, और जब वे कंपन महसूस करते हैं तो विषय इंगित करता है। दुर्भाग्य से, उच्च आवृत्तियों पर, जांच केवल एक छोटी दूरी को स्थानांतरित कर सकती है, और कभी-कभी सबसे बड़ी दूरी जो जांच को स्थानांतरित कर सकती है वह अभी भी विषयों के लिए पर्याप्त बड़ी नहीं है। इस प्रकार, मेरे पास कुछ विषयों के लिए सटीक सीमा मूल्य हैं, लेकिन कुछ लोगों के लिए जो कंपन को कभी महसूस नहीं करते थे, मेरा बस एक मूल्य है कि मुझे पता है कि उनकी सीमा इससे अधिक है। क्या मेरे पास अभी भी इस डेटा को शामिल करने का कोई तरीका है? और इसका विश्लेषण करने का सबसे अच्छा तरीका क्या है?


5
इन्हें सेंसर किए गए अवलोकन कहा जाता है । इसे कैसे शामिल किया जाए यह इस बात पर निर्भर करता है कि आप किस तरह का सांख्यिकीय विश्लेषण कर रहे हैं।

मैं Procrastinator से सहमत हूँ सिवाय इसके कि मैं छंटनी की गई शब्द का उपयोग करूँगा। सही सेंसरिंग नामक एक सिलेर समस्या के लिए दृष्टिकोण अस्तित्व विश्लेषण में होता है, जहां आप काटे गए मूल्य को रखते हैं, लेकिन आपके पास यह बताने के लिए एक संकेतक चर है कि क्या मान पूर्ण मान या सेंसर वाला है। उत्तरजीविता विश्लेषण में इससे निपटने का एक सरल तरीका है लेकिन ऐसा इसलिए है क्योंकि आप उत्तरजीविता वक्र का अनुमान लगा रहे हैं। यहां आप औसत गणना करना चाहते हैं। यदि आप त्रासदी को अनदेखा करते हैं तो आप औसत को कम आंकते हैं। यदि आप काटे गए बिंदुओं को निकालते हैं तो आप औसत को कम आंकते हैं।
माइकल आर। चेरिक

काटे गए मानों को ठीक से शामिल करने के लिए आपको दी गई जांच दूरी के लिए प्रायिकता मॉडल की आवश्यकता होगी जो कि यह सीमा से अधिक है। फिर आप उस वितरण का अर्थ निकाल सकते हैं और उन मानों के लिए औसत का उपयोग करके एक भारित औसत की गणना कर सकते हैं जो कि काटे गए वितरण के लिए औसत के साथ कम नहीं थे जहां भारित मामलों के अनुपात के अनुसार भार होता है।
माइकल आर। चेरिक

4
यदि आप बिना डेटा हटाए गए हैं तो ट्रंकेशन क्या होगा। आप ऐसा नहीं करना चाहते हैं! आप सही हैं, काले, कि इन सेंसर किए गए मूल्यों में जानकारी है और संदेह है कि उनका विश्लेषण करने के लिए कुछ मानक तरीके हैं (और अनगढ़ के लिए नुकसान)। लेकिन एक अच्छा जवाब देने के लिए हमें यह जानना होगा कि आप किस तरह का विश्लेषण चाहते हैं। विशेष रूप से, इन आंकड़ों का उपचार मौलिक रूप से इस बात पर निर्भर करता है कि वे प्रतिगमन में आश्रित या स्वतंत्र चर के रूप में भिन्न हैं। शायद आप इस पर विस्तार से बता सकते हैं?
whuber

1
छोटे विवरण हाथ में सांख्यिकीय प्रश्न से असंबंधित हैं, लेकिन यह जानना उपयोगी हो सकता है: इस तरह के डेटा को आमतौर पर "साइकोफिजिकल" डेटा कहा जाता है, न कि "साइकोफिजियोलॉजिकल" (जिसमें हृदय गति या त्वचा चालन उपायों जैसी चीजें शामिल हैं लेकिन संवेदनाओं के बारे में व्यक्तिपरक निर्णय नहीं हैं। )। यह आपको साहित्य की तलाश करने में भी मदद कर सकता है कि लोग आमतौर पर इस प्रकार के डेटा का इलाज कैसे करते हैं।
गाला

जवाबों:


2

मैं मौलिक विभिन्न स्रोतों से संयुक्त प्रभावों का वर्णन करने के लिए विषम मिश्रण मॉडल का उपयोग करना पसंद करता हूं।

आप डायने लैम्बर्ट की शैली में "ज़ीरो इन्फ्लेस्ड पॉइज़न" मॉडल की तरह कुछ देख सकते हैं। " जीरो-इन्फ्लेशन पोइसन रिग्रेशन, मैन्युफैक्चरिंग में दोषों के लिए एक आवेदन के साथ ", डायने लैम्बर्ट, टेक्नोमेट्रिक्स, वॉल्यूम। 34, इस्। 1, 1992

मुझे यह विचार विशेष रूप से आनंदमय लगता है क्योंकि यह इस धारणा के विपरीत प्रतीत होता है कि चिकित्सा के लिए प्रयोगों के सांख्यिकीय डिजाइन का आवेदन पूरी तरह से बीमारी का इलाज नहीं कर सकता है। धारणा के पीछे यह विचार है कि चिकित्सा में वैज्ञानिक विधि अपना उद्देश्य पूरा नहीं कर सकती है, इस विचार से आता है कि "पूर्ण रूप से" स्वस्थ व्यक्ति से कोई बीमारी का डेटा नहीं है और इसलिए डेटा बीमारी के उपाय की सूचना नहीं दे सकता है। माप के बिना सुधार करने के लिए कोई जगह नहीं है।

शून्य-फुलाया मॉडल की तरह कुछ का उपयोग करने से किसी को डेटा से उपयोगी जानकारी निकालने की अनुमति मिलती है जो आंशिक रूप से "त्रुटि मुक्त" है। यह उस जानकारी को लेने के लिए प्रक्रिया में अंतर्दृष्टि का उपयोग कर रहा है जिसे "चुप" के रूप में सोचा जा सकता है और इसे बोल सकता है। मेरे लिए यह एक ऐसी चीज है जिसे आप करने की कोशिश कर रहे हैं।

अब मैं मॉडल के संयोजन का उपयोग करना शुरू नहीं कर सकता। मुझे संदेह है कि आप शुरुआत के लिए एक शून्य-फुलाए हुए गाऊसी मिश्रण मॉडल (जीएमएम) का उपयोग कर सकते हैं। GMM निरंतर पीडीएफ के लिए एक अनुभवजन्य सार्वभौमिक सन्निकटन का एक सा है - फूरियर श्रृंखला सन्निकटन के पीडीएफ चचेरे भाई की तरह, लेकिन वैश्विक प्रयोज्यता में सुधार के लिए केंद्रीय सीमा प्रमेय के समर्थन के साथ और आमतौर पर कई कम घटकों को "बनाने के लिए अनुमति देता है" अच्छा "सन्निकटन।

शुभकामनाएँ।

संपादित करें:

शून्य-फुलाए गए मॉडल पर अधिक:


0

परिणामों को क्लस्टर करना और पैमाने को परिभाषित करना एक समाधान हो सकता है।

ऐसा (या अलग तरह से) एक श्रेणी चर बनाएं:

  1. उच्च संवेदनशील
  2. सामान्य संवेदनशीलता
  3. कम संवेदनशीलता
  4. असंवेदनशील (जो आपके मामले में पैमाने से दूर हैं)

आप विश्लेषण करने के लिए इस चर का उपयोग कर सकते हैं, लेकिन क्या परिणाम सार्थक हैं यह इस बात पर निर्भर करता है कि आप श्रेणियों को कितनी अच्छी तरह परिभाषित करते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.