मेरे पास डेटा के साथ उपयोग करने के लिए उचित बूटस्ट्रैपिंग तकनीक के बारे में एक प्रश्न है जहां मजबूत क्लस्टरिंग मौजूद है।
मुझे एक बहुभिन्नरूपी मिश्रित प्रभाव का आकलन करने का काम सौंपा गया है, जो बीमा दावों के डेटा पर मौजूदा बेसलाइन मॉडल को अधिक हाल के दावों के डेटा पर स्कोर करके निर्धारित करता है, यह निर्धारित करने के लिए कि मॉडल कितनी अच्छी तरह भविष्यवाणी करता है कि देखभाल के एपिसोड में सत्रों की उच्चतम आवृत्ति शामिल है (ऊपरी 95 प्रतिशत)। मॉडल की प्रभावशीलता का आकलन करने के लिए संवेदनशीलता, विशिष्टता और सकारात्मक भविष्य कहनेवाला मूल्य (पीपीवी) का उपयोग किया जाएगा।
बूटस्ट्रैपिंग संवेदनशीलता, विशिष्टता और पीपीवी प्रतिशत के लिए आत्मविश्वास अंतराल के निर्माण के लिए जाने का सही तरीका लगता है। दुर्भाग्य से, एक भोली बूटस्ट्रैप उचित नहीं है कि दावा डेटा 1 है) देखभाल प्रदाता द्वारा सहसंबद्ध, 2) देखभाल के एपिसोड में महीनों के दौरान अधिक लगातार यात्राओं के साथ देखभाल के एपिसोड में वर्गीकृत किया गया है (इसलिए कुछ ऑटोकरालेशन मौजूद हैं)। चलती ब्लॉक बूटस्ट्रैप तकनीक पर एक बदलाव यहाँ उचित होगा?
या शायद एक तीन-चरण बूटस्ट्रैप प्रक्रिया काम करेगी: 1) डेटा में अलग-अलग प्रदाताओं से प्रतिस्थापन के साथ नमूना, फिर 2) चयनित प्रदाताओं द्वारा देखभाल के अलग-अलग एपिसोड से प्रतिस्थापन के साथ नमूना, फिर 3) प्रत्येक दावे के भीतर अलग-अलग दावों से प्रतिस्थापन के साथ नमूना चयनित एपिसोड।
किसी भी सुझाव के लिए बहुत धन्यवाद!