मैं एक स्वास्थ्य समस्या की भविष्यवाणी करना चाहता हूं। मेरे पास 3 परिणाम श्रेणियां हैं जो क्रमबद्ध हैं: 'सामान्य', 'हल्का' और 'गंभीर'। मैं दो भविष्यवाणियों चर, एक परीक्षा परिणाम (एक सतत, अंतराल सहसंयोजक) और इस समस्या (हाँ या नहीं) के साथ परिवार के इतिहास से इसकी भविष्यवाणी करना चाहता हूं। मेरे नमूने में, संभावनाएं 55% (सामान्य), 35% (हल्के) और 10% (गंभीर) हैं। इस अर्थ में, मैं हमेशा केवल normal सामान्य ’की भविष्यवाणी कर सकता था और सही समय का 55% हो सकता था, हालांकि इससे मुझे व्यक्तिगत रोगियों के बारे में कोई जानकारी नहीं मिलेगी। मैं निम्नलिखित मॉडल को फिट करता हूं:
मान लें कि कोई बातचीत नहीं है और मॉडल के साथ सब कुछ ठीक है। समरूपता, सी, 60.5% है, जिसे मैं मॉडल की अधिकतम सटीकता की भविष्यवाणी करने वाला समझता हूं।
मैं निम्नलिखित डेटा के साथ दो नए रोगियों में आता हूं: 1. परीक्षण = 3.26, परिवार = 0; 2. परीक्षण = 2.85, परिवार = 1. मैं उनके पूर्वानुमान की भविष्यवाणी करना चाहता हूं। सूत्र का उपयोग: (और फिर संचयी संभावनाओं के बीच मतभेदों को ले जा रहा), मैं प्रतिक्रिया श्रेणियों मॉडल पर सशर्त अधिक संभावना वितरण की गणना कर सकते हैं। आर कोड (एनबी, गोलाई मुद्दों के कारण, आउटपुट पूरी तरह से मेल नहीं खाता):
cut1 <- -2.18
cut2 <- -4.27
beta <- c(0.6, 1.05)
X <- rbind(c(3.26, 0), c(2.85, 1))
pred_cat1 <- exp(-1*(X%*%beta)-cut1)/(1+exp(-1*(X%*%beta)-cut1))
pred_cat2.temp <- exp(-1*(X%*%beta)-cut2)/(1+exp(-1*(X%*%beta)-cut2))
pred_cat3 <- 1-pred_cat2.temp
pred_cat2 <- pred_cat2.temp-pred_cat1
predicted_distribution <- cbind(pred_cat1, pred_cat2, pred_cat3)
अर्थात्: 1. 0 = 55.1%, 1 = 35.8%, 2 = 9.1%; और 2. 0 = 35.6%, 1 = 46.2%, 2 = 18.2%। मेरा सवाल यह है कि मैं संभावित वितरण से एक अनुमानित प्रतिक्रिया श्रेणी में कैसे जाऊं?
मैंने नमूना डेटा का उपयोग करते हुए कई संभावनाओं की कोशिश की है, जहां परिणाम ज्ञात है। अगर मैं अधिकतम (संभावना) उठाता हूं, तो सटीकता 57% है, अशक्त पर थोड़ा सुधार, लेकिन सहमति से नीचे है। इसके अलावा, नमूने में, यह दृष्टिकोण कभी भी 'गंभीर' नहीं होता है, जो कि मैं वास्तव में जानना चाहता हूं। मैंने अशक्त और मॉडल संभावनाओं को बाधाओं में परिवर्तित करके और फिर अधिकतम (ऑड्स अनुपात) उठाकर बायेसियन दृष्टिकोण की कोशिश की। यह कभी-कभार 'गंभीर' हो जाता है, लेकिन इससे 49.5% अधिक सटीकता होती है। मैंने प्रायिकताओं और गोलाई द्वारा भारित श्रेणियों के योग की भी कोशिश की। यह, फिर से, 'गंभीर' नहीं है, और इसकी सटीकता 51.5% है।
वह समीकरण क्या है जो उपरोक्त जानकारी लेता है और इष्टतम सटीकता (60.5%) प्राप्त करता है?