मुझे इस द्विआधारी भविष्यवाणी समस्या से कैसे संपर्क करना चाहिए?


9

मुझे निम्नलिखित प्रारूप के साथ एक डाटासेट मिला है।

कैंसर नहीं होने का पूर्वानुमान

एक द्विआधारी परिणाम कैंसर / कोई कैंसर नहीं है। डेटासेट में मौजूद हर डॉक्टर ने हर मरीज को देखा और स्वतंत्र निर्णय दिया कि मरीज को कैंसर है या नहीं। डॉक्टर फिर 5 का विश्वास स्तर देते हैं कि उनका निदान सही है, और विश्वास स्तर कोष्ठक में प्रदर्शित किया गया है।

मैंने इस डेटासेट से अच्छे पूर्वानुमान प्राप्त करने के लिए विभिन्न तरीके आज़माए हैं।

यह मेरे लिए बहुत अच्छा काम करता है कि मैं डॉक्टरों के पार जाऊं, उनके आत्मविश्वास के स्तर को अनदेखा करूं। ऊपर की तालिका में रोगी 1 और रोगी 2 के लिए सही निदान का उत्पादन होगा, हालांकि यह गलत तरीके से कहा जाएगा कि रोगी 3 में कैंसर है, 2-1 बहुमत से डॉक्टरों को लगता है कि रोगी 3 को कैंसर है।

मैंने एक तरीका भी आजमाया, जिसमें हम बेतरतीब ढंग से दो डॉक्टरों का नमूना लेते हैं, और यदि वे एक-दूसरे से असहमत हैं, तो निर्णायक मत जो भी डॉक्टर के पास जाता है, वह अधिक आश्वस्त होता है। यह विधि किफायती है, जिसमें हमें बहुत सारे डॉक्टरों से परामर्श करने की आवश्यकता नहीं है, लेकिन यह त्रुटि दर को भी थोड़ा बढ़ा देता है।

मैंने एक संबंधित विधि की कोशिश की जिसमें हम बेतरतीब ढंग से दो डॉक्टरों का चयन करते हैं, और यदि वे एक दूसरे से असहमत हैं तो हम बेतरतीब ढंग से दो और का चयन करते हैं। यदि एक निदान कम से कम दो 'वोटों' से आगे होता है तो हम उस निदान के पक्ष में चीजों को हल करते हैं। यदि नहीं, तो हम अधिक डॉक्टरों का नमूना लेते रहते हैं। यह विधि बहुत ही किफायती है और बहुत अधिक गलतियाँ नहीं करती है।

मैं यह महसूस करने में मदद नहीं कर सकता कि मैं चीजों को करने का कुछ अधिक परिष्कृत तरीका याद कर रहा हूं। उदाहरण के लिए, मुझे आश्चर्य है कि अगर कोई तरीका है जो मैं डेटासेट को प्रशिक्षण और परीक्षण सेट में विभाजित कर सकता हूं, और निदान को संयोजित करने के लिए कुछ इष्टतम तरीके से काम कर सकता हूं, और फिर देख सकता हूं कि परीक्षण सेट पर वे कैसे प्रदर्शन करते हैं। एक संभावना कुछ प्रकार की विधि है जो मुझे डाउनवेट डॉक्टरों की अनुमति देती है जो ट्रायल सेट पर गलतियां करते रहते हैं, और शायद उच्च निदान जो आत्मविश्वास के साथ किए जाते हैं (आत्मविश्वास इस डेटासेट में सटीकता के साथ सहसंबंध रखता है)।

मुझे इस सामान्य विवरण से मेल खाते हुए विभिन्न डेटासेट मिले हैं, इसलिए नमूना आकार भिन्न होते हैं और सभी डेटासेट डॉक्टरों / रोगियों से संबंधित नहीं होते हैं। हालांकि, इस विशेष डेटासेट में 40 डॉक्टर हैं, जिनमें से प्रत्येक ने 108 मरीजों को देखा।

EDIT: यहाँ कुछ भारों का एक लिंक दिया गया है, जो मेरे @ जेरेमी-मील के उत्तर को पढ़ने से उत्पन्न होते हैं।

  1. अनचाहे परिणाम पहले कॉलम में हैं। वास्तव में इस डेटासेट में अधिकतम आत्मविश्वास मूल्य 4 था, 5 नहीं जैसा कि मैंने पहले गलती से कहा था। इस प्रकार @ जेरेमी-मील के दृष्टिकोण का उच्चतम अंक किसी भी रोगी को मिल सकता है। 7. इसका मतलब यह होगा कि शाब्दिक रूप से प्रत्येक डॉक्टर को 4 के विश्वास स्तर के साथ उस रोगी को कैंसर था। किसी भी मरीज को मिलने वाला सबसे कम अंक वाला स्कोर 0 होता है, जिसका अर्थ यह होगा कि हर डॉक्टर 4 के आत्मविश्वास स्तर के साथ यह दावा करता है कि उस मरीज को कैंसर नहीं था।

  2. Cronbach's अल्फा द्वारा वेटिंग। मैंने SPSS में पाया कि 0.9807 का कुल मिलाकर Cronbach's का अल्फा था। मैंने यह सत्यापित करने की कोशिश की कि क्रोनबैक की अल्फा को अधिक मैनुअल तरीके से गणना करके यह मान सही था। मैंने सभी 40 डॉक्टरों का एक सहसंयोजक मैट्रिक्स बनाया, जिसे मैं यहां पेस्ट करता हूं । फिर क्रोनबाक के अल्फा फॉर्मूला की मेरी समझ पर आधारित जहां आइटमों की संख्या है (यहां डॉक्टर 'आइटम' हैं) मैंने covariance मैट्रिक्स में सभी विकर्ण तत्वों को गणना की है , और सभी तत्वों में योग करने के लिए सहसंयोजक मैट्रिक्स। मैं तब मिलाα=-1(1-Σσएक्समैं2σटी2)Σσएक्समैं2σटी2α=4040-1(1-8.7915200.7112)=0.9807 मैंने तब 40 विभिन्न क्रोनबाक अल्फा परिणामों की गणना की, जो प्रत्येक डॉक्टर द्वारा हटाए जाने पर उत्पन्न होंगे। डाटासेट। मैंने किसी भी डॉक्टर को भारित किया जिसने क्रोनबच के अल्फा में शून्य में नकारात्मक योगदान दिया। मैं बचे हुए डॉक्टरों के वजन के साथ क्रोनबेक के अल्फा के लिए उनके सकारात्मक योगदान के लिए आया था।

  3. कुल आइटम सहसंबंधों द्वारा भार। मैं सभी कुल आइटम सहसंबंधों की गणना करता हूं, और फिर प्रत्येक डॉक्टर को उनके सहसंबंध के आकार के आनुपातिक वजन।

  4. प्रतिगमन गुणांक द्वारा भार।

एक बात मुझे अभी भी यकीन नहीं है कि यह कैसे कहना है कि कौन सी विधि दूसरे की तुलना में "बेहतर" काम कर रही है। पहले मैं पीयरस स्किल स्कोर जैसी चीजों की गणना कर रहा था, जो ऐसे उदाहरणों के लिए उपयुक्त है जिनमें एक द्विआधारी भविष्यवाणी और एक द्विआधारी परिणाम है। हालाँकि, अब मेरे पास 0 से 1 के बजाय 0 से 7 तक के पूर्वानुमान हैं। क्या मुझे सभी भारित स्कोर> 3.50 से 1, और सभी भारित स्कोर <3.50 से 0 में बदलना चाहिए?


हम कह सकते हैं कि No Cancer (3)है Cancer (2)? यह आपकी समस्या को थोड़ा सरल करेगा।
वेन

1
पुन: आपकी डेटा संरचना, अलग-अलग स्तंभों में अलग-अलग चर (चाहे रोगी को कैंसर हो; मूल्यांकन कितना आश्वस्त है) होना लगभग हमेशा बेहतर होता है। उन्हें "नो कैंसर (3)" के रूप में संयोजित करना आपके विकल्पों को गंभीर रूप से सीमित करता है।
rolando2

@Wayne डेटा कैंसर की भविष्यवाणी से लेकर अधिकतम आत्मविश्वास के साथ अधिकतम कैंसर Cancer (4)के पूर्वानुमान से संबंधित है No Cancer (4)। हम जानते हैं कि यह नहीं कह सकते No Cancer (3)और Cancer (2)एक ही हैं, लेकिन हम कह सकते हैं एक निरंतरता है, और इस सातत्य में मध्यम अंक हैं Cancer (1)और No Cancer (1)
user1205901 - मोनिका

@ rolando2 सलाह के लिए धन्यवाद। मैंने अपनी डेटा फ़ाइल में चीजों को फिर से व्यवस्थित किया है ताकि अब वे अलग हो जाएं।
user1205901 - मोनिका

1
ध्यान दें कि आपकी सीमा एक ट्यूनेबल पैरामीटर है , इसलिए उपयुक्त कटऑफ आपके मूल्यांकन मानदंड पर निर्भर करेगा। जैसा कि मैं आपकी मीट्रिक I Googled से अपरिचित था, और वास्तव में पहली हिट आपके लिए प्रासंगिक हो सकती है: अधिकतम Peirce कौशल स्कोर (2007) पर एक नोट
जियोमैट

जवाबों:


7

पहले, मैं देखूंगा कि क्या डॉक्टर एक-दूसरे से सहमत हैं। आप 50 डॉक्टरों का अलग-अलग विश्लेषण नहीं कर सकते, क्योंकि आप मॉडल से आगे निकल जाएंगे - एक डॉक्टर बहुत अच्छा लगेगा, संयोग से।

आप एक 10 बिंदु पैमाने पर विश्वास और निदान को संयोजित करने का प्रयास कर सकते हैं। यदि कोई डॉक्टर कहता है कि रोगी को कैंसर नहीं है, और वे बहुत आश्वस्त हैं, तो यह एक 0. यदि डॉक्टर कहता है कि उन्हें कैंसर है और वे बहुत आश्वस्त हैं, तो यह एक 9. यदि वे डॉक्टर कहते हैं कि वे नहीं करते हैं, और आश्वस्त नहीं हैं, यह एक 5 है, आदि।

जब आप भविष्यवाणी करने की कोशिश कर रहे हैं, तो आप किसी प्रकार का प्रतिगमन विश्लेषण करते हैं, लेकिन इन चरों के कारण क्रम के बारे में सोचते हुए, यह दूसरा तरीका है। रोगी को कैंसर है या नहीं, इसका कारण निदान है।

आपकी पंक्तियाँ रोगी होनी चाहिए, और आपके कॉलम डॉक्टर होने चाहिए। अब आपके पास एक ऐसी स्थिति है जो साइकोमेट्रिक्स में आम है (यही वजह है कि मैंने टैग जोड़ा है)।

फिर स्कोर के बीच संबंधों को देखें। प्रत्येक मरीज का माध्य स्कोर होता है, और प्रत्येक डॉक्टर का एक अंक होता है। क्या हर डॉक्टर के अंक के साथ माध्य स्कोर सकारात्मक रूप से सहसंबंधित है? यदि नहीं, तो वह डॉक्टर शायद भरोसेमंद नहीं है (इसे आइटम-कुल सहसंबंध कहा जाता है)। कभी-कभी आप कुल स्कोर (या माध्य स्कोर) में से एक डॉक्टर को हटा देते हैं और देखते हैं कि क्या डॉक्टर अन्य सभी डॉक्टरों के साथ सह-संबंध रखता है - यह सही आइटम कुल सहसंबंध है।

आप क्रोनबेक के अल्फा (जो इंट्रा-क्लास सहसंबंध का एक रूप है) और प्रत्येक डॉक्टर के बिना अल्फा की गणना कर सकते हैं। जब आप डॉक्टर को जोड़ते हैं तो अल्फा हमेशा बढ़ जाती है, इसलिए यदि आप डॉक्टर को हटाते हैं, तो उस डॉक्टर की रेटिंग संदिग्ध है (यह अक्सर आपको सही आइटम-कुल सहसंबंध से अलग कुछ भी नहीं बताता है)।

यदि आप R का उपयोग करते हैं, तो फ़ंक्शन अल्फा का उपयोग करके इस तरह की चीज़ मनोवैज्ञानिक पैकेज में उपलब्ध है। यदि आप Stata का उपयोग करते हैं, तो कमांड अल्फा है, एसएएस में यह अधिप्राप्ति है, और SPSS में यह स्केल, विश्वसनीयता के अंतर्गत है।

फिर आप एक अंक की गणना कर सकते हैं, प्रत्येक डॉक्टर से माध्य स्कोर के रूप में, या भारित माध्य (सहसंबंध द्वारा भारित) और देखें कि क्या स्कोर सही निदान की भविष्यवाणी है।

या आप उस चरण को छोड़ सकते हैं, और अलग-अलग निदान पर प्रत्येक डॉक्टर के स्कोर को पुनः प्राप्त कर सकते हैं, और प्रतिगमन मापदंडों को भार के रूप में मान सकते हैं।

स्पष्टीकरण के लिए पूछने के लिए स्वतंत्र महसूस करें, और यदि आप एक पुस्तक चाहते हैं, तो मुझे स्ट्रेनर और नॉर्मन के "स्वास्थ्य मापन स्केल" पसंद हैं।

-Edit: OPs अतिरिक्त जानकारी पर आधारित है।

वाह, यह एक क्रोनबाक के अल्फा की एक बिल्ली है। केवल समय मैंने यह देखा है कि उच्च तब होता है जब कोई गलती की गई थी।

अब मैं लॉजिस्टिक रिग्रेशन करूंगा और आरओसी कर्व्स को देखूंगा।

प्रतिगमन और सहसंबंध द्वारा भार के बीच का अंतर इस बात पर निर्भर करता है कि आप कैसे डॉक्टरों का जवाब दे रहे हैं। कुछ डॉक्स आम तौर पर अधिक आत्मविश्वास से भरे (अधिक कुशल होने के बिना) हो सकते हैं, और इसलिए वे चरम सीमाओं का अधिक उपयोग कर सकते हैं। यदि आप इसके लिए सही करना चाहते हैं, तो प्रतिगमन के बजाय, प्रतिगमन का उपयोग करते हुए, ऐसा करता है। मैं शायद प्रतिगमन द्वारा वजन करूंगा, क्योंकि यह मूल डेटा रखता है (और किसी भी जानकारी को नहीं छोड़ता)।

संपादित करें (2): मैंने आर में लॉजिस्टिक रिग्रेशन मॉडल चलाया, यह देखने के लिए कि प्रत्येक ने आउटपुट की कितनी अच्छी भविष्यवाणी की है। tl / dr: उनके बीच कुछ भी नहीं है।

यहाँ मेरा कोड है:

d <- read.csv("Copy of Cancer data - Weightings.csv")

mrc <- glm(cancer ~ weightrc, data = d, family = "binomial")
mun <- glm(cancer ~ unweight, data = d, family = "binomial")
mca <- glm(cancer ~ weightca, data = d, family = "binomial")
mic <- glm(cancer ~ weightic, data = d, family = "binomial")

d$prc <- predict(mrc, type = "response")
d$pun <- predict(mun, type = "response")
d$pca <- predict(mca, type = "response")
d$pic <- predict(mic, type = "response")

par(mfrow = c(2, 2))
roc(d$cancer, d$prc, ci = TRUE, plot = TRUE)
roc(d$cancer, d$pun, ci = TRUE, plot = TRUE)
roc(d$cancer, d$pca, ci = TRUE, plot = TRUE)
roc(d$cancer, d$pic, ci = TRUE, plot = TRUE)

4 आरओसी घटता है

और आउटपुट:

> par(mfrow = c(2, 2))
> roc(d$cancer, d$prc, ci = TRUE, plot = TRUE)

Call:
roc.default(response = d$cancer, predictor = d$prc, ci = TRUE,     plot = TRUE)

Data: d$prc in 81 controls (d$cancer 0) < 27 cases (d$cancer 1).
Area under the curve: 0.9831
95% CI: 0.9637-1 (DeLong)
> roc(d$cancer, d$pun, ci = TRUE, plot = TRUE)

Call:
roc.default(response = d$cancer, predictor = d$pun, ci = TRUE,     plot = TRUE)

Data: d$pun in 81 controls (d$cancer 0) < 27 cases (d$cancer 1).
Area under the curve: 0.9808
95% CI: 0.9602-1 (DeLong)
> roc(d$cancer, d$pca, ci = TRUE, plot = TRUE)

Call:
roc.default(response = d$cancer, predictor = d$pca, ci = TRUE,     plot = TRUE)

Data: d$pca in 81 controls (d$cancer 0) < 27 cases (d$cancer 1).
Area under the curve: 0.9854
95% CI: 0.9688-1 (DeLong)
> roc(d$cancer, d$pic, ci = TRUE, plot = TRUE)

Call:
roc.default(response = d$cancer, predictor = d$pic, ci = TRUE,     plot = TRUE)

Data: d$pic in 81 controls (d$cancer 0) < 27 cases (d$cancer 1).
Area under the curve: 0.9822
95% CI: 0.9623-1 (DeLong)

1
बहुत अच्छा। और, जैसा कि आपके तर्क की अनुमति है, यह संभव है कि कुछ डॉक्टर ट्रेंड को आगे बढ़ाते हुए अद्वितीय अंतर्दृष्टि का योगदान देकर अल्फा को बदतर बना देंगे।
rolando2

@ जेरेमी-मील इस उत्तर के लिए धन्यवाद, और इसके बारे में सवालों के क्षेत्र में इस तरह की पेशकश। मैंने आपके द्वारा सुझाए गए कार्यों को लागू करने की कोशिश की, और कुछ परिणामों को पोस्ट करने के लिए ओपी को संपादित किया। मुख्य बात जो मैं सोच रहा हूं कि क्या मैंने आपकी पोस्ट की सही व्याख्या की है, और यह भी कि यह दिखाने के लिए क्या होगा कि एकत्रीकरण के कुछ तरीके परिणाम की भविष्यवाणी करने में अन्य तरीकों की तुलना में बेहतर काम कर रहे हैं।
user1205901 - मोनिका

डेटा पोस्ट करने के लिए धन्यवाद। मैं इसे बाद में देखूंगा। (आप किस सॉफ्टवेयर का उपयोग कर रहे हैं?)
जेरेमी माइल्स

@JeremyMiles इस संपादन को पोस्ट करने के लिए धन्यवाद! मैं MATLAB का उपयोग कर रहा हूं, लेकिन मैं आर के बारे में काफी कुछ जानता हूं और इसके बजाय इसका उपयोग करना चाहता हूं, क्योंकि आपने पहले ही आर कोड पोस्ट किया है। मैंने गणना की कि SPSS में क्रोनबाक का अल्फा - क्या आपको आर से एक अलग मूल्य मिलता है?
user1205901 -

1
हां, यही मैं सोच रहा था। इसलिए प्रत्येक डॉक्टर का वजन अलग होता है।
जेरेमी मील्स

2

दो आउट-ऑफ-द-बॉक्स सुझाव:

  1. आप अपने लॉजिस्टिक रिग्रेशन के नुकसान फ़ंक्शन पर वेट का उपयोग कर सकते हैं, ताकि डॉक्टर जो निश्चित है कि रोगी को P = 1 के साथ कैंसर है, दुगना प्रभाव पड़ता है, दूसरे का कहना है कि उसे P = 0.75 से कैंसर है। अपनी संभावनाओं को ठीक से वज़न में बदलना न भूलें।
  2. अक्सर उपेक्षित मॉडल के परिवार रैंकिंग मॉडल होते हैं। रैंकर्स के भीतर तीन बड़े समूह होते हैं: लिस्ट वाइज, पॉइंटवाइज़ और पेयरवाइज़ रैंकिंग, आपके इनपुट के आधार पर। ऐसा लगता है कि आप अपने मामले में पॉइंटवाइज़ रैंकिंग का उपयोग कर सकते हैं ।

क्या आप संभावनाओं को ठीक से वज़न में बदलने का एक तरीका सुझा सकते हैं? मैंने इस अवधारणा को समझने की कोशिश की, लेकिन यह कैसे करना है, इस बारे में कोई स्पष्ट सलाह नहीं मिल सकी।
user1205901 - मोनिका

@ user1205901, मेरे मन में कुछ बहुत ही सरल था जैसे: चलो P= डॉक्टर द्वारा दिए जाने वाले कैंसर होने की संभावना, फिर (अजगर संकेतन में): y=[1 if p >= 0.5 else 0 for p in P]और w=[abs(p-0.5)*2 for p in P]। फिर मॉडल को प्रशिक्षित करें:LogisticRegression().fit(X,y,w)
रिकार्डो क्रूज़

नुकसान के कार्य में, यह उदाहरण के लिए, कैंसर नहीं होने के लिए 0.1 से 0.2 से दोगुना वजन (0.1 -> 0.8 और 0.2 -> 0.6) होगा। यदि डॉक्टर अनिश्चित है (पी ~ 0.5) तो अवलोकन नुकसान में लगभग कुछ भी नहीं योगदान देता है। वह जो भी मॉडल का उपयोग करता है उसे नुकसान फ़ंक्शन में एक कॉस्ट वेक्टर जोड़ने का समर्थन करने की आवश्यकता होती है, जो अधिकांश मॉडल का समर्थन करते हैं। मुझे नहीं पता कि यह कोई अच्छा है, लेकिन यह कोशिश करने के लिए तुच्छ लगता है। उसे पहले एक मीट्रिक निर्दिष्ट करने की आवश्यकता है। जो भी मीट्रिक वह अधिकतम करना चाहता है उसके लिए नुकसान फ़ंक्शन को और अधिक दर्जी बनाया जा सकता है।
रिकार्डो क्रूज़

2

(यह मेरी विशेषज्ञता के क्षेत्र से बाहर है, इसलिए जेरेमी माइल्स का जवाब अधिक विश्वसनीय हो सकता है।)

यहाँ एक विचार है।

सबसे पहले, कल्पना करें कि कोई आत्मविश्वास स्तर नहीं है। फिर प्रत्येक रोगी के लिए , उन्हें या तो कैंसर है या नहीं , और प्रत्येक डॉक्टर या तो उन्हें कैंसर का निदान किया है या नहीं, ।मैं=1...एनसीमैं{0,1}जे=1...मैंजे{0,1}

एक सरल दृष्टिकोण यह मान लेना है, जबकि डॉक्टर किसी दिए गए रोगी के निदान पर सहमत या असहमत हो सकते हैं, यदि हम रोगी की वास्तविक स्थिति जानते हैं , तो प्रत्येक डॉक्टर के निदान को स्वतंत्र माना जा सकता है। है यही कारण है, हैं सशर्त स्वतंत्र दिए गए । यह एक अच्छी तरह से परिभाषित क्लासिफायर के रूप में जाना जाता है जिसे नाइव बेस के रूप में जाना जाता है , ऐसे मापदंडों के साथ जिनका अनुमान लगाना आसान है।मैंजेसीमैं

विशेष रूप से, प्राथमिक पैरामीटर आधार दर, , और सशर्त निदान की संभावना है ध्यान दें कि यह बाद वाला पैरामीटर डॉक्टर लिए निदान का एक भारित औसत है , जहां वजन सही रोगी की स्थिति है ।पी[सी]1एनΣमैंसीमैं

पी[जे|सी]ΣमैंमैंजेसीमैंΣमैंसीमैं
जेसीमैं

अब यदि यह मॉडल उचित है, तो आत्मविश्वास स्तरों को शामिल करने का एक तरीका वजन को समायोजित करना है। फिर सशर्त संभावनाएँ यहां एक वजन है जो के आत्मविश्वास के स्तर के लिए है ।

पी[जे|सी,wजे]ΣमैंमैंजेwमैंजेसीमैंΣमैंwमैंजेसीमैं
wमैंजे0मैंजे

ध्यान दें कि यदि आपका वजन संभाव्यता रूप में डाला जाता है , तो आप " बर्नोली शॉर्टकट" फॉर्मूला को मामले के लिए उचित रूप से खाता है।w[0,1]

पी[|w]=w(1-)1-w
=0

नोट: इसके लिए यह आवश्यक है कि आपका सॉफ़्टवेयर 0^0=1इसके बजाय दे 0^0=NaN, जो कि सामान्य है लेकिन जाँच के लायक है! वैकल्पिक रूप से आप सुनिश्चित कर सकते हैं , उदाहरण के लिए यदि आत्मविश्वास तो काम करेगा।w(0,1){1...}w=/(+1)


@Wayne द्वारा टिप्पणी के संदर्भ में: यदि आप कहते हैं No Cancer (3) = Cancer (2), यह का उपयोग करने के बाद से मेरे भारित मॉडल के अनुरूप है , । वैकल्पिक रूप से, यदि आप कहते हैं , यह साथ संगत है , क्योंकि । w[]=25=1-35No Cancer (3) = Cancer (3)w[]=+136=1-36
GeoMatt22

क्या मैं जाँच सकता हूँ कि मैं सही ढंग से ? यदि परिणाम [1,0,1] हैं और एक डॉक्टर पूर्वानुमान [0,1,1], और डॉक्टर का वजन [0.2,0.4,0.8] है, तो क्या भारित सशर्त निदान की संभावना 0.5 हो जाती है?
पी[जे|सी,wजे]ΣमैंमैंजेwमैंजेसीमैंΣमैंwमैंजेसीमैं
user1205901 -

क्षमा करें, मुझे एहसास हुआ कि मैंने अभी-अभी इरादा किया था भारित किया जाना चाहिए, यानी δ[0,1]संकेतक के बजाय {0,1}। तो आपके मामले के लिएδमैं=wमैं(मैं=1)+(1-wमैं)(मैं=0)δ=[0.8,0.4,0.8]। फिरपी[सी,δ]=सीδ¯=0.8+0+0.83=230.8, जबकि पी[2]=सी¯=23 तथा पी[δ]=δ¯=560.8। इसलिएपी[सी|δ]=पी[सी,δ]/पी[δ]=0.8 तथा पी[δ|सी]=पी[सी,δ]/पी[सी]=0.8
जियोमैट

0

आपके प्रश्न से, यह प्रतीत होता है कि आप जो परीक्षण करना चाहते हैं वह आपकी माप प्रणाली है। प्रक्रिया इंजीनियरिंग क्षेत्र में, यह एक विशेषता माप प्रणाली विश्लेषण या एमएसए होगा।

यह लिंक आवश्यक नमूना आकार पर कुछ उपयोगी जानकारी प्रदान करता है और गणना इस प्रकार का अध्ययन करने के लिए चलती है। https://www.isixsigma.com/tools-templates/measurement-systems-analysis-msa-gage-rr/making-sense-attribute-gage-rr-calculations/

इस अध्ययन के साथ, आपको कम से कम दो बार एक ही जानकारी वाले एक ही रोगी का निदान करने के लिए डॉक्टर की भी आवश्यकता होगी।

आप इस अध्ययन को दो तरह से कर सकते हैं। चिकित्सकों और प्रत्येक चिकित्सक के बीच समझौते का निर्धारण करने के लिए आप साधारण कैंसर / कैंसर की रेटिंग का उपयोग कर सकते हैं। आदर्श रूप से, उन्हें विश्वास के समान स्तर के साथ निदान करने में सक्षम होना चाहिए। फिर आप प्रत्येक चिकित्सक के बीच समझौते का परीक्षण करने के लिए पूर्ण 10 बिंदु पैमाने का उपयोग कर सकते हैं। (सभी को सहमत होना चाहिए कि कैंसर (5) एक ही रेटिंग है, कि कोई भी कैंसर (1) एक ही रेटिंग नहीं है, और c)

लिंक किए गए वेबसाइट में गणना आपके परीक्षण के लिए उपयोग किए जा रहे किसी भी प्लेटफॉर्म में संचालित करने के लिए सरल है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.