सांख्यिकी.कॉम ने सप्ताह की एक समस्या प्रकाशित की: आवासीय बीमा धोखाधड़ी की दर 10% है (दस दावों में से एक धोखाधड़ी है)। एक सलाहकार ने दावों की समीक्षा करने और उन्हें धोखाधड़ी या नो-फ्रॉड के रूप में वर्गीकृत करने के लिए एक मशीन लर्निंग सिस्टम का प्रस्ताव दिया है। यह प्रणाली कपटपूर्ण दावों का पता लगाने में 90% प्रभावी है, लेकिन गैर-धोखाधड़ी दावों को सही ढंग से वर्गीकृत करने में केवल 80% प्रभावी है (यह गलती से एक को "धोखाधड़ी" के रूप में लेबल करता है)। यदि सिस्टम एक दावे को धोखाधड़ी के रूप में वर्गीकृत करता है, तो क्या संभावना है कि यह वास्तव में धोखाधड़ी है?
https://www.statistics.com/news/231/192/Conditional-Probability/?showtemplate=true
मेरे सहकर्मी और मैं दोनों एक ही जवाब के साथ स्वतंत्र रूप से आए और यह प्रकाशित समाधान से मेल नहीं खाता।
हमारा समाधान:
(.9 * .1) / ((। 9 * .1) + (। 2 * .9)) = 1/3
उनका समाधान:
यह सशर्त संभावना में एक समस्या है। (यह एक बायेसियन समस्या भी है, लेकिन बेयस नियम में सूत्र को लागू करने से केवल यह पता लगाने में मदद मिलती है कि क्या चल रहा है।) 100 दावों पर विचार करें। 10 फर्जी होंगे, और सिस्टम उनमें से 9 को "धोखाधड़ी" के रूप में सही ढंग से लेबल करेगा। 90 दावे ठीक होंगे, लेकिन सिस्टम गलत तरीके से 72 (80%) को "धोखाधड़ी" के रूप में वर्गीकृत करेगा, इसलिए कुल 81 दावों को लेबल किया गया है। धोखाधड़ी के रूप में, लेकिन उनमें से केवल 9, 11%, वास्तव में धोखेबाज हैं।
कौन सही था