मॉडलिंग अनुदैर्ध्य डेटा जहां समय का प्रभाव व्यक्तियों के बीच कार्यात्मक रूप में भिन्न होता है


32

प्रसंग :

कल्पना कीजिए कि आपके पास एक अनुदैर्ध्य अध्ययन था जिसने 200 प्रतिभागियों पर 20 सप्ताह के लिए सप्ताह में एक बार एक आश्रित चर (डीवी) को मापा। हालांकि मुझे सामान्य, विशिष्ट DV में दिलचस्पी है कि मैं नौकरी के प्रदर्शन को भाड़े पर या नैदानिक ​​मनोविज्ञान के हस्तक्षेप के बाद विभिन्न कल्याणकारी उपायों को शामिल करने के बारे में सोच रहा हूं।

मुझे पता है कि मल्टीलेवल मॉडलिंग का उपयोग समय और डीवी के बीच संबंधों को मॉडल करने के लिए किया जा सकता है। आप व्यक्तियों के बीच भिन्नता और प्रतिभागियों के लिए विशेष मूल्यों का अनुमान लगाने के लिए गुणांक (उदाहरण के लिए, स्वीकार्यता, ढलान, आदि) की अनुमति भी दे सकते हैं। लेकिन क्या होगा अगर आप नेत्रहीन डेटा का निरीक्षण करते हैं, तो आप पाते हैं कि समय और डीवी के बीच संबंध निम्न में से कोई एक है:

  • कार्यात्मक रूप में भिन्न (शायद कुछ रैखिक हैं और अन्य घातांक हैं या कुछ में एक असंतोष है)
  • त्रुटि भिन्नता में भिन्न (कुछ व्यक्ति एक समय बिंदु से अगले तक अधिक अस्थिर होते हैं)

प्रश्न :

  • मॉडलिंग डेटा को इस तरह एप्रोच करने का एक अच्छा तरीका क्या होगा?
  • विशेष रूप से, विभिन्न प्रकार के रिश्तों की पहचान करने और उनके प्रकार के संबंध में व्यक्तियों को वर्गीकृत करने में कौन से दृष्टिकोण अच्छे हैं?
  • इस तरह के विश्लेषण के लिए आर में क्या कार्यान्वयन मौजूद हैं?
  • क्या ऐसा करने के लिए कोई संदर्भ हैं: पाठ्यपुस्तक या वास्तविक अनुप्रयोग?

जवाबों:


20

मैं निम्नलिखित तीन दिशाओं को देखने का सुझाव दूंगा:

  • अनुदैर्ध्य क्लस्टरिंग : यह अनुपलब्ध है, लेकिन आप विभाजन की गुणवत्ता (पैकेज kml , और संदर्भ ऑनलाइन मदद में शामिल हैं) की गुणवत्ता का आकलन करने के लिए केलिंस्की कसौटी पर भरोसा करने के लिए k- साधन दृष्टिकोण का उपयोग करते हैं; इसलिए मूल रूप से, यह व्यक्तिगत समय के लिए विशिष्ट आकार की पहचान करने में मदद नहीं करेगा, लेकिन सिर्फ अलग-अलग समरूप विकास प्रोफ़ाइल
  • विषम विकास के लिए किसी प्रकार की अव्यक्त वृद्धि वक्र लेखांकन: मेरा सबसे अच्छा अनुमान MPlus सॉफ्टवेयर, विशेष रूप से FAQ और मेलिंग के आसपास के व्यापक संदर्भों को देखना होगा । मैंने यादृच्छिक प्रभाव गुणात्मक विषमलैंगिक मॉडल के बारे में भी सुना है (उन खोजशब्दों के चारों ओर घूमने का प्रयास करें)। मुझे ये पेपर ( 1 , 2 ) दिलचस्प लगे, लेकिन मैंने इनका विवरण नहीं देखा। मैं अपने कार्यालय में वापस एक बार न्यूरोसाइकोलॉजिकल मूल्यांकन के संदर्भों के साथ अपडेट करूंगा।
  • कार्यात्मक पीसीए ( fpca पैकेज) लेकिन यह कार्यात्मक डेटा विश्लेषण को देखने के लायक हो सकता है

अन्य संदर्भ (बस मक्खी पर ब्राउज़):


1
धन्यवाद। एक क्लस्टरिंग प्रक्रिया का उपयोग करने का विचार मुझे हुआ था। मैं कल्पना करता हूं कि चुनौती पर्याप्त रूप से सार्थक स्तर पर संभव व्यक्तिगत स्तर की वक्र विशेषताओं को पकड़ने और वजन करने के लिए होगी। मैं देखता हूँ कि यह किमी में कैसे काम करता है।
जेरोमे एंग्लीम सेप

1
खैर, यह बहुत अच्छी तरह से काम करता है, हालांकि इंटरफ़ेस भयानक है (और मुझे पता है कि इसे बनाने वाले :) :) - मैंने इसे दो महीने पहले विकासात्मक माप (ब्रुनेट-लेज़िन) पर व्यक्तिगत प्रोफाइल के आधार पर नैदानिक ​​समूहों को अलग करने के लिए उपयोग किया था।
chl

1
एफडीए के लिए एक और प्राथमिक संदर्भ यहां दिया गया है: psych.mcgill.ca/misc/fda
माइक लॉरेंस

1
मुझे यह परिचय रामसे (2008) के एफडीए लिंक से मिला, विशेष रूप से सुलभ gbi.agrsci.dk/~shd/public/FDA2008/FDA_Sage.pdf
जेरेमी एंग्लीम

8

मैं हेपेटिंग झांग द्वारा कागज के एक जोड़े पर एक नज़र डालते हुए अनुदैर्ध्य डेटा के लिए अनुकूली विभाजन का उपयोग करने की सलाह दूंगा:

इसके अलावा, R पैकेज सहित सॉफ़्टवेयर के लिए MASAL पृष्ठ देखें ।


6

यह मुझे लगता है कि ग्रोथ मिक्सचर मॉडल्स में आपको अपनी त्रुटि विचरण की जांच करने की अनुमति देने की क्षमता हो सकती है। ( यहां पीडीएफ )। (मुझे नहीं पता कि गुणात्मक विषमलैंगिक मॉडल क्या हैं, लेकिन मुझे निश्चित रूप से उन्हें जांचना होगा)।

अव्यक्त विज्ञान में अव्यक्त समूह आधारित प्रक्षेपवक्र मॉडल वास्तव में लोकप्रिय हो गए हैं। लेकिन बहुत से लोग बस यह मान लेते हैं कि समूह वास्तव में मौजूद हैं, और कुछ सूक्ष्म अनुसंधान ने बताया है कि आपको यादृच्छिक डेटा में भी समूह मिलेंगे। यह भी ध्यान दें कि नागिन के समूह आधारित मॉडलिंग दृष्टिकोण आपको अपनी त्रुटि का आकलन करने की अनुमति नहीं देता है (और ईमानदारी से मैंने कभी ऐसा मॉडल नहीं देखा है जो किसी भी चीज़ को एक असंतोष की तरह देखेगा)।

यद्यपि यह 20 समय बिंदुओं के साथ मुश्किल होगा, खोज के उद्देश्यों के लिए सरल पहचान बनाने के लिए पैटर्न की पहचान करना सहायक हो सकता है (उदाहरण के लिए हमेशा कम या हमेशा उच्च, भिन्नता का गुणांक)। मैं स्प्रेडशीट या समानांतर निर्देशांक भूखंडों में स्पार्कलाइन की कल्पना कर रहा हूं, लेकिन मुझे संदेह है कि वे मददगार होंगे (मैंने ईमानदारी से कभी भी एक समानांतर समन्वय साजिश नहीं देखी है जो बहुत ही ज्ञानवर्धक है)।

सौभाग्य


@chl, कोई बात नहीं, आपके द्वारा यहां सूचीबद्ध सभी संसाधनों के लिए धन्यवाद।
एंडी डब्ल्यू

अव्यक्त समूहों के बारे में अच्छी बात। मैंने अव्यक्त वर्ग विश्लेषण और क्लस्टर विश्लेषण के कई अनुप्रयोग देखे हैं जहाँ ऐसा प्रतीत होता है कि यह एक निरंतर परिवर्तनीय int श्रेणियों जैसे कि निम्न और उच्च ( jeromyanglim.blogspot.com/2009/09/… ) को उकेर रहा है । हालाँकि, मेरे पास कुछ व्यक्तिगत-स्तर के अनुदैर्ध्य डेटा हैं जो नेत्रहीन रूप से देखते हैं कि वे स्पष्ट रूप से अलग-अलग डेटा जनरेटिंग प्रक्रियाओं (जैसे, हमेशा उच्च, हमेशा कम, क्रमिक वृद्धि, कम-तब-अचानक-वृद्धि, आदि) और श्रेणियों के भीतर से आ रहे हैं। मापदंडों की निरंतर भिन्नता है।
जेरोमे एंगलिम

@Jeromy, मुझे नहीं लगता कि मेरे द्वारा उद्धृत कार्य अव्यक्त समूहों की पहचान करने के लिए ऐसे तरीकों का उपयोग करने से लोगों को हतोत्साहित करेगा। मैं कहूंगा कि काम की बात यह है कि आप ऐसे तरीकों का उपयोग पूरी तरह से समूहों के अस्तित्व का पता लगाने के लिए नहीं कर सकते हैं, क्योंकि आप हमेशा समूह पाएंगे, यहां तक ​​कि यादृच्छिक डेटा में भी। यह अधिक व्यक्तिपरक व्याख्या पर निर्भर करता है कि क्या आप जो समूह पाते हैं वे वास्तविक हैं या केवल विधि की कलाकृतियां हैं। आप कुछ तार्किक सिद्धांतों की पहचान कर सकते हैं जो इस तरह की प्रक्रियाओं को उत्पन्न करते हैं और फिर देखते हैं कि क्या समूह उन सिद्धांतों के भीतर फिट हैं।
एंडी डब्ल्यू

5

इस प्रश्न को पूछने के चार साल बाद, मैंने कुछ चीजें सीखी हैं, इसलिए शायद मुझे कुछ विचार जोड़ने चाहिए।

मुझे लगता है कि बायेसियन पदानुक्रमित मॉडलिंग इस समस्या के लिए एक लचीला दृष्टिकोण प्रदान करता है।

सॉफ्टवेयर : जैग, स्टेन, विनबग जैसे उपकरण और संभावित रूप से उनके संबंधित आर इंटरफेस पैकेज (उदाहरण के लिए, rjags, राइस्टर) के साथ मिलकर ऐसे मॉडल निर्दिष्ट करना आसान बनाते हैं।

व्यक्ति त्रुटि के भीतर भिन्नता: बेसेसियन मॉडल लोगों के बीच भिन्न होने वाले यादृच्छिक कारक के रूप में व्यक्ति त्रुटि संस्करण को निर्दिष्ट करना आसान बनाते हैं।

yमैं=1,,nj=1,जम्मू

yमैंj~एन(μमैं,σमैं2)
μमैं=γ
γ~एन(μγ,σγ2)
σमैं~जीमीटरमीटर(α,β)

इस प्रकार प्रत्येक व्यक्ति का मानक विचलन गामा वितरण के रूप में प्रतिरूपित किया जा सकता है। मैंने इसे कई मनोवैज्ञानिक डोमेन में एक महत्वपूर्ण पैरामीटर पाया है जहां लोग समय के साथ अलग-अलग होते हैं।

वक्रों की अव्यक्त कक्षाएं: मैंने अभी तक इस विचार का पता नहीं लगाया है, लेकिन प्रत्येक व्यक्ति के लिए दो या दो से अधिक संभावित डेटा जनरेटिंग फ़ंक्शन निर्दिष्ट करने के लिए यह अपेक्षाकृत सीधे आगे है और फिर बायेसियन मॉडल को किसी दिए गए व्यक्ति के लिए सबसे अधिक संभावना वाला मॉडल चुनने दें। इस प्रकार, आप आमतौर पर प्रत्येक व्यक्ति के लिए बाद की संभावनाएं प्राप्त करेंगे जिसके बारे में कार्यात्मक रूप व्यक्तियों के डेटा का वर्णन करता है।

एक मॉडल के लिए एक विचार के एक स्केच के रूप में, आप निम्नलिखित की तरह कुछ हो सकता है:

yमैंj~एन(μमैंj,σ2)
μमैंj=γमैंλमैंj(1)+(1-γमैं)λमैंj(2)
λमैंj(1)=θ1मैं(1)+θ2मैं(1)exp(-θ3मैं(1))
λमैंj(2)=θ1मैं(2)+θ2मैं(2)एक्समैंj+θ3मैं(2)एक्समैंj2
γमैं=बीआरnयूएलएलमैं(πमैं)

जहां समय है और λ ( 1 ) i jएक्समैंjλमैंj(1)λमैंj(2)πमैंλमैंj(1)


मैं बायेसियन फ्रेमवर्क में भी जा रहा हूं, और अनिश्चित फ़ंक्शन रूपों के समय श्रृंखला विश्लेषण के लिए गॉसियन प्रक्रियाओं का उपयोग करने पर पढ़ रहा हूं। अभी भी यह स्पष्ट नहीं है कि इसे पदानुक्रमित डेटा के मामले में कैसे लागू किया जा सकता है (मेरी अनुत्तरित क्वेरी यहाँ देखें: group.google.com/d/msg/stan-users/yjDWtMhxQQE/2TiYwvy0ZwUJ )
माइक लॉरेंस

3

जॉन फॉक्स के पास अनुदैर्ध्य डेटा को देखने के लिए एक शानदार एपेंडिक्स है जो कि लक्सम का उपयोग कर ऑन लाइन उपलब्ध है। यह आपके लिए उपयोगी हो सकता है:

http://cran.r-project.org/doc/contrib/Fox-Companion/appendix-mixed-models.pdf

वहाँ बहुत सारी चीजें हैं (और फॉक्स की किताबें आमतौर पर काफी अच्छी हैं!)।


2
टूटी हुई कड़ी। हालाँकि, यह लेखक के वेब पेज से यहाँ उपलब्ध है
Glen_b -Reinstate Monica
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.