मैं वर्तमान में स्वास्थ्य बीमा दावों के डेटा के एक बड़े सेट के साथ काम कर रहा हूं जिसमें कुछ प्रयोगशाला और फार्मेसी दावे शामिल हैं। डेटा सेट में सबसे सुसंगत जानकारी, हालांकि, निदान (ICD-9CM) और प्रक्रिया कोड (CPT, HCSPCS, ICD-9CM) से बनी है।
मेरे लक्ष्य हैं:
- क्रोनिक किडनी रोग जैसी चिकित्सा स्थिति के लिए सबसे प्रभावशाली अग्रदूत की स्थिति (कोमर्बिडिटीज) की पहचान करें;
- इस संभावना (या संभावना) को पहचानें कि एक मरीज अतीत में उन स्थितियों के आधार पर एक चिकित्सा स्थिति विकसित करेगा;
- 1 और 2 जैसा ही करें, लेकिन प्रक्रियाओं और / या निदान के साथ।
- अधिमानतः, परिणाम एक डॉक्टर द्वारा व्याख्या योग्य होंगे
मैंने हेरिटेज हेल्थ प्राइज माइलस्टोन पेपर्स जैसी चीजों को देखा है और उनसे बहुत कुछ सीखा है, लेकिन वे हॉस्पिटलाइजेशन की भविष्यवाणी करने पर केंद्रित हैं।
तो यहाँ मेरे प्रश्न हैं: इस तरह की समस्याओं के लिए आपको क्या तरीके अच्छे लगते हैं? और, स्वास्थ्य विज्ञान और नैदानिक चिकित्सा के लिए प्रासंगिक डेटा विज्ञान अनुप्रयोगों और विधियों के बारे में जानने के लिए कौन से संसाधन सबसे उपयोगी होंगे?
EDIT # 2 प्लेनटेक्स्ट टेबल जोड़ने के लिए:
CKD लक्ष्य स्थिति है, "क्रोनिक किडनी रोग", ".any" यह दर्शाता है कि उन्होंने उस समय उस स्थिति को प्राप्त कर लिया है, ".isbefore.ckd" का अर्थ है कि सीकेडी के पहले निदान से पहले उनकी यह स्थिति थी। अन्य संक्षिप्तीकरण ICD-9CM कोड समूहों द्वारा पहचानी गई अन्य स्थितियों के अनुरूप हैं। यह समूहीकरण SQL में आयात प्रक्रिया के दौरान होता है। प्रत्येक चर, patient_age के अपवाद के साथ, द्विआधारी है।