ग्रोथ चार्ट बनाने की सबसे अच्छी विधि


10

मुझे 5 से 15 वर्ष की आयु के बच्चों के लिए (ग्रोथ चार्ट के समान) चार्ट बनाने हैं (केवल 5,6,7 इत्यादि; स्वास्थ्य चर के लिए कोई भिन्न मान नहीं हैं) जो गैर-नकारात्मक, निरंतर और में है 50-150 की सीमा (इस सीमा के बाहर केवल कुछ मूल्यों के साथ)। मुझे ९ ० वें, ९ ५ वें और ९९ वें परसेंटाइल कर्व बनाने हैं और इन परसेंटाइल के लिए टेबल भी बनाने हैं। नमूने का आकार लगभग 8000 है।

मैंने जाँच की और संभावित तरीकों का अनुसरण किया:

  1. मात्राओं का पता लगाएं और फिर इन मात्राओं से एक चिकनी वक्र प्राप्त करने के लिए loess पद्धति का उपयोग करें। चिकनेपन की डिग्री को 'स्पैन' पैरामीटर द्वारा समायोजित किया जा सकता है।

  2. एलएमएस (लैम्ब्डा-म्यू-सिग्मा) विधि का उपयोग करें (जैसे आर में गेमल्स या वीजीएएम पैकेज का उपयोग करना)।

  3. मात्रात्मक प्रतिगमन का उपयोग करें।

  4. प्रत्येक आयु वर्ग के माध्य और एसडी का उपयोग उस उम्र के लिए प्रतिशत का अनुमान लगाने और प्रतिशत घटता बनाने के लिए करें।

यह करने के लिए सबसे अच्छा तरीका क्या है? 'सर्वोत्तम' से मेरा मतलब या तो आदर्श विधि है जो इस तरह के विकास घटता के निर्माण के लिए मानक विधि है और सभी के लिए स्वीकार्य होगा। या विधि को लागू करने के लिए एक आसान और सरल, जिसमें कुछ सीमाएं हो सकती हैं, लेकिन एक स्वीकार्य, तेज विधि है। (उदाहरण के लिए, प्रतिशत मूल्यों पर लोस का उपयोग करना, गेमल्स पैकेज के एलएमएस का उपयोग करने की तुलना में बहुत तेज है)।

इसके अलावा उस पद्धति के लिए मूल R कोड क्या होगा।

आपकी सहायता के लिए धन्यवाद।


2
आप "सर्वश्रेष्ठ" के लिए पूछ रहे हैं जो आमतौर पर कठिन और असंभव के बीच कहीं भी निश्चित रूप से चर्चा करने के लिए है। (स्तर का "सबसे अच्छा" उपाय पर्याप्त कठिन है।) आपने बच्चों में स्वास्थ्य परिवर्तन के लिए अपने प्रश्न को स्पष्ट रूप से बांधा है, लेकिन "सर्वोत्तम" पर आपके मानदंड स्पष्ट नहीं हैं, विशेष रूप से किस प्रकार या चिकनाई की डिग्री स्वीकार्य या अस्वीकार्य है।
निक कॉक्स

मैं प्रयास का स्वागत करता हूं, लेकिन ए) जाहिर तौर पर मौजूद नहीं है, अन्यथा प्रतिस्पर्धा के समाधान क्यों हैं, या आप जो साहित्य पढ़ रहे हैं, उसमें यह स्पष्ट क्यों नहीं है? सदियों पुरानी नहीं तो इस समस्या में दिलचस्पी निश्चित रूप से दशकों से है। आसान का मतलब है: समझने में आसान, सामान्य रूप से मेडिक्स या गैर-सांख्यिकीय दिमाग वाले पेशेवरों को समझाना आसान, लागू करना आसान ...? मुझे कोई संदेह नहीं है कि मैं चुदक्कड़ लग रही हूँ, लेकिन आपको यहाँ गति की परवाह क्यों करनी चाहिए? इन विधियों में से कोई भी कम्प्यूटेशनल रूप से मांग नहीं है।
निक कॉक्स

@NickCox: मैंने आपकी टिप्पणियों के अनुसार प्रश्न संपादित किया है। मैं एक वास्तविक उत्तर की सराहना करूंगा।
rnso

1
क्षमा करें, लेकिन मैं इस क्षेत्र में काम नहीं करता हूं और मुझे लगता है कि आपका प्रश्न उत्तर देने के लिए बहुत मायावी है। टिप्पणियाँ मौजूद हैं क्योंकि लोग जवाब देने में असमर्थ या अनिच्छुक हो सकते हैं, लेकिन फिर भी कुछ कहना होगा। मैं आदेश देने के लिए उत्तर नहीं लिखता।
निक कॉक्स

जवाबों:


6

विकास घटता पर एक बड़ा साहित्य है। मेरे दिमाग में तीन "शीर्ष" दृष्टिकोण हैं। इन तीनों में, समय को सीमित क्यूबिक रेखा के रूप में पर्याप्त संख्या में समुद्री मील (जैसे, 6) के साथ तैयार किया गया है। यह उत्कृष्ट प्रदर्शन और आसान व्याख्या के साथ एक पैरामीट्रिक चिकनी है।

  1. निरंतर समय AR1 जैसे एक समझदार सहसंबंध पैटर्न के साथ अनुदैर्ध्य डेटा के लिए शास्त्रीय विकास वक्र मॉडल (सामान्यीकृत कम से कम वर्ग)। यदि आप दिखा सकते हैं कि अवशिष्ट गाऊसी हैं तो आप अनुमानित साधनों और सामान्य सामान्य विचलन का उपयोग करके मात्रा के MLE प्राप्त कर सकते हैं।
  2. मात्रात्मक प्रतिगमन। यह गैर-बड़े लिए कुशल नहीं है । भले ही परिशुद्धता इष्टतम नहीं है, विधि न्यूनतम धारणाएं बनाती है (क्योंकि एक मात्रा के लिए अनुमान एक अलग मात्रा के अनुमान से जुड़े नहीं हैं) और निष्पक्ष है।n
  3. साधारण प्रतिगमन। यह आनुपातिक बाधाओं मॉडल जैसे अर्ध-पैरामीट्रिक मॉडल का उपयोग करते हुए, मजबूत होने के लिए निरंतर को क्रमबद्ध मानता है । क्रमिक मॉडल से आप औसत और किसी भी मात्रा का अनुमान लगा सकते हैं, उत्तरार्द्ध केवल अगर निरंतर है।Y यYY

जब आपने आनुपातिक बाधाओं का उपयोग किया है, तो आपने परिणाम के इतने स्तरों के साथ पीओ धारणा (इसे विफल मानते हुए) को कैसे समायोजित किया? धन्यवाद।
18

2
यहां तक ​​कि अगर यह विफल रहता है तो मॉडल कुछ अन्य मॉडलों की तुलना में बेहतर प्रदर्शन कर सकता है क्योंकि कुल मिलाकर कम धारणाएं हैं। या अन्य ऑर्डिनल मॉडल में से एक पर स्विच करें संचयी संभाव्यता परिवार जैसे आनुपातिक खतरे (लॉग-लॉग संचयी संभावना लिंक है)।
फ्रैंक हरेल

1

गाऊसी प्रक्रिया प्रतिगमन । चौकोर घातीय कर्नेल के साथ शुरू करें और आंखों से मापदंडों को आज़माएं और ट्यून करें। बाद में, यदि आप चीजों को ठीक से करना चाहते हैं, तो विभिन्न गुठली के साथ प्रयोग करें और मापदंडों का अनुकूलन करने के लिए सीमांत संभावना का उपयोग करें।

यदि आप ऊपर दिए गए ट्यूटोरियल से अधिक विस्तार चाहते हैं, तो यह पुस्तक बहुत अच्छी है


आपके उत्तर के लिए धन्यवाद। आप बताए गए अन्य तरीकों की तुलना में गॉसियन प्रक्रिया प्रतिगमन को कैसे रेट करते हैं। Scikit-learn.org/0.11/auto_examples/gaussian_process/… पर दूसरा गाऊसी भूखंड LOESS (स्थानीय प्रतिगमन) के इस पृष्ठ पर दूसरे अंतिम भूखंड के समान प्रतीत होता है: princeoflides.blogspot.in/2011/05/… । LOESS प्रदर्शन करना बहुत आसान है।
rnso

व्यक्तिगत रूप से, मैं दृढ़ता से किसी भी डेटासेट के लिए जीपीआर पसंद करता हूं जो आपको फिट करने के लिए पर्याप्त छोटा है। सैद्धांतिक दृष्टिकोण से "अच्छे" होने के साथ-साथ यह अधिक लचीला, मजबूत है, और अच्छी तरह से कैलिब्रेटेड प्रोबेबिलिस्टिक आउटपुट देता है। यह सब कहने के बाद, यदि आपका डेटा सघन और सुव्यवस्थित है, तो आपके दर्शक संभवत: LOESS और GPR के बीच का अंतर तब तक नहीं बता पाएंगे जब तक वे सांख्यिकीविद नहीं होंगे।
एंडी जोन्स

3
yएक्स

1
@ निक: मेरा इरादा सलाह थी कि आप अपने डेटा का एक मॉडल तैयार करें और फिर मॉडल का उपयोग (सुचारू) शतकीय वक्र बनाने के लिए करें। अब आप इसका उल्लेख कर चुके हैं, हाँ, मैं पूरी तरह से दूसरे घटक (यानी वास्तविक प्रश्न) से चूक गया।
एंडी जोन्स

1
1.96
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.