याद करने पर अधिक सटीक कब महत्वपूर्ण है?


18

क्या कोई मुझे कुछ उदाहरण दे सकता है जहां परिशुद्धता महत्वपूर्ण है और कुछ उदाहरण जहां याद रखना महत्वपूर्ण है?


f1-

आप दोनों के बीच और अधिक महत्वपूर्ण क्या है, आपको पूछना चाहिए कि ऐसे कौन से मामले हैं, जिनमें आप एक को दूसरे से अधिक करना चाहते हैं (जो जरूरी नहीं कि दूसरे को "कम" महत्वपूर्ण बना दे)।
जेंटस

जवाबों:


28
  • दुर्लभ कैंसर डेटा मॉडलिंग के लिए, कुछ भी जो झूठे-नकारात्मक के लिए जिम्मेदार नहीं है, एक अपराध है। स्मरण परिशुद्धता की तुलना में बेहतर उपाय है।
  • YouTube अनुशंसाओं के लिए, गलत-नकारात्मक एक चिंता का विषय है। यहां परिशुद्धता बेहतर है।

1
@fateh प्रमुख अंतर एफपी बनाम एफएन है। YouTube अनुशंसा में FN पर जोर नहीं दिया जाता है, लेकिन अस्पताल के नैदानिक ​​निर्णयों पर ध्यान देना चाहिए।
हेलोवर्ल्ड

11

याद होने पर अधिक महत्वपूर्ण होने पर मैं आपको अपना वास्तविक मामला दे सकता हूं:

हमारे पास हर हफ्ते हजारों मुफ्त ग्राहक हमारी वेबसाइट में पंजीकृत हैं। कॉल सेंटर की टीम उन सभी को कॉल करना चाहती है, लेकिन यह असंभव है, इसलिए वे मुझे एक खरीदार होने के लिए अच्छे अवसरों के साथ चयन करने के लिए कहते हैं (उच्च तापमान के साथ हम उन्हें कैसे संदर्भित करते हैं)। हम उस आदमी को कॉल करने की परवाह नहीं करते हैं जो खरीदने नहीं जा रहा है (इसलिए परिशुद्धता महत्वपूर्ण नहीं है) लेकिन हमारे लिए यह बहुत महत्वपूर्ण है कि उच्च तापमान वाले सभी हमेशा मेरे चयन में हैं, इसलिए वे खरीदने के बिना नहीं जाते हैं। इसका मतलब है कि मेरे मॉडल को उच्च याद रखने की आवश्यकता है , चाहे कोई भी सटीक नरक जाए।

मुझे उम्मीद है यह मदद करेगा! मिगुएल।


6

यद्यपि कुछ स्थितियों में याद किया जाना सटीक (या इसके विपरीत) से अधिक महत्वपूर्ण हो सकता है, आपको अधिक व्याख्यात्मक मूल्यांकन प्राप्त करने के लिए दोनों की आवश्यकता है।

उदाहरण के लिए, जैसा कि @SmallChess द्वारा उल्लेख किया गया है, चिकित्सा समुदाय में, एक झूठी नकारात्मक आमतौर पर प्रारंभिक निदान के लिए एक झूठी सकारात्मक की तुलना में अधिक विनाशकारी होती है। इसलिए, किसी व्यक्ति को वापस बुलाना अधिक महत्वपूर्ण माप माना जा सकता है। हालाँकि, आप 100% रिकॉल कर सकते हैं, फिर भी एक बेकार मॉडल है: यदि आपका मॉडल हमेशा सकारात्मक भविष्यवाणी करता है, तो यह 100% रिकॉल होगा, लेकिन पूरी तरह से एकरूप नहीं होगा।

यही कारण है कि हम कई मीट्रिक देखते हैं:


6

जो अधिक महत्वपूर्ण है, बस यह निर्भर करता है कि प्रत्येक त्रुटि की लागत क्या है।

प्रत्यक्ष लागतों को शामिल करने के लिए परिशुद्धता शामिल है; आपके पास जितने अधिक झूठे सकारात्मक हैं, आपके पास प्रति सकारात्मक लागत उतनी अधिक है। यदि आपकी लागत कम है, तो परिशुद्धता उतना मायने नहीं रखती है। उदाहरण के लिए, यदि आपके पास 1M ईमेल पते हैं, और उन सभी को एक ईमेल भेजने के लिए $ 10 का खर्च आएगा, तो संभवत: यह समय आपके लायक नहीं है कि आप लोगों की प्रतिक्रिया की संभावना को पहचानने की कोशिश करें, बल्कि उन सभी को स्पैमिंग करें।

स्मरण करो, दूसरे पर अवसर लागत शामिल करने के लिए जाता है; आप हर बार झूठे नकारात्मक होने के अवसर छोड़ रहे हैं। इसलिए याद रखना कम से कम महत्वपूर्ण है जब अतिरिक्त सही पहचान का सीमांत मूल्य छोटा है, जैसे कि कई अवसर हैं, उनके बीच थोड़ा अलग है, और केवल एक सीमित संख्या का पीछा किया जा सकता है। उदाहरण के लिए, मान लीजिए कि आप एक सेब खरीदना चाहते हैं। दुकान पर 100 सेब हैं, और उनमें से 10 खराब हैं। यदि आपके पास खराब सेबों को अलग करने की एक विधि है जो 80% अच्छे लोगों को याद करती है, तो आप 18 अच्छे सेबों की पहचान करेंगे। आम तौर पर, 20% की याद भयानक होगी, लेकिन यदि आप केवल 5 सेब चाहते हैं, तो उन 72 सेबों को गायब करना वास्तव में कोई मायने नहीं रखता है।

इसलिए याद रखना सबसे महत्वपूर्ण है जब:

अवसरों की संख्या कम है (यदि केवल 10 अच्छे सेब थे, तो आपको 5 अच्छे लोगों को केवल 20% की याद दर के साथ मिलने की संभावना नहीं होगी)
- अवसरों के बीच महत्वपूर्ण अंतर हैं (यदि कुछ सेब दूसरों की तुलना में बेहतर हैं , तो 20% की रिकॉल दर 5 अच्छे सेब प्राप्त करने के लिए पर्याप्त है, लेकिन वे जरूरी नहीं कि सबसे अच्छे सेब हों)
OR
-The अवसरों का मामूली लाभ अधिक रहता है, यहां तक ​​कि बड़ी संख्या में अवसरों के लिए भी। उदाहरण के लिए, जबकि अधिकांश दुकानदारों को 18 से अधिक अच्छे सेबों से अधिक लाभ नहीं होगा, लेकिन दुकान में बेचने के लिए 18 से अधिक सेब होना चाहिए।

इस प्रकार, अभिनय की लागत अधिक होने पर, रिकॉल की तुलना में सटीकता अधिक महत्वपूर्ण होगी, लेकिन अभिनय की लागत कम है। ध्यान दें कि यह अभिनय / प्रति उम्मीदवार की लागत है, न कि "सभी पर कोई कार्रवाई होने की लागत" "सभी पर कोई कार्रवाई न होने की लागत"। सेब के उदाहरण में, किसी विशेष सेब को खरीदने / न खरीदने की लागत है, न कि कुछ सेब खरीदने की लागत बनाम किसी सेब को न खरीदने की लागत; एक विशेष सेब नहीं खरीदने की लागत कम है क्योंकि बहुत सारे अन्य सेब हैं। चूंकि खराब सेब खरीदने की लागत अधिक है, लेकिन एक विशेष सेब को पारित करने की लागत कम है, उस उदाहरण में परिशुद्धता अधिक महत्वपूर्ण है। जब इसी तरह के बहुत सारे उम्मीदवार हैं तो एक और उदाहरण काम पर रखा जाएगा।

एक्टिंग की लागत कम होने पर रिकॉल सटीक से अधिक महत्वपूर्ण है, लेकिन एक उम्मीदवार पर पास होने का अवसर लागत अधिक है। मेरे द्वारा पहले दिया गया स्पैम उदाहरण है (ईमेल पते पर गुम होने की लागत अधिक नहीं है, लेकिन किसी व्यक्ति को ईमेल भेजने की लागत जो प्रतिक्रिया नहीं देती है वह भी कम है), और एक अन्य उदाहरण के लिए उम्मीदवारों की पहचान करना होगा फ़्लू शॉट: फ़्लू शॉट किसी ऐसे व्यक्ति को दें जिसे इसकी आवश्यकता नहीं है, और इसकी कीमत कुछ डॉलर है, इसे किसी ऐसे व्यक्ति को न दें, जिसे इसकी आवश्यकता हो, और वे मर सकते हैं। इस वजह से, स्वास्थ्य देखभाल की योजना आम तौर पर सभी को फ्लू शॉट की पेशकश करेगी, पूरी तरह से सटीक उपेक्षा।


3

संचय का एक बड़ा जवाब है कि आप कैसे अधिक उदाहरणों के साथ याद करने और इसके विपरीत सटीकता के महत्व को समझा सकते हैं।

अधिकांश अन्य उत्तर याद करने के महत्व के लिए एक सम्मोहक मामला बनाते हैं इसलिए मैंने सोचा कि मैं सटीक के महत्व पर एक उदाहरण दूंगा। यह पूरी तरह से काल्पनिक उदाहरण है लेकिन यह मामला बनाता है।

बता दें कि मशीन लर्निंग मॉडल यह भविष्यवाणी करने के लिए बनाया गया है कि क्या एक निश्चित दिन उपग्रह लॉन्च करने के लिए एक अच्छा दिन है या मौसम पर आधारित नहीं है।

  • यदि मॉडल गलती से भविष्यवाणी करता है कि उपग्रहों को लॉन्च करने के लिए एक अच्छा दिन खराब ( गलत नकारात्मक ) है, तो हम लॉन्च करने का मौका याद करते हैं। यह इतनी बड़ी बात नहीं है।

  • हालांकि, यदि मॉडल भविष्यवाणी करता है कि यह एक अच्छा दिन है, लेकिन यह वास्तव में उपग्रहों ( झूठे सकारात्मक ) को लॉन्च करने के लिए एक बुरा दिन है तो उपग्रहों को नष्ट किया जा सकता है और नुकसान की लागत अरबों में होगी।

यह एक ऐसा मामला है जहां सटीक याद से अधिक महत्वपूर्ण है।


1

मेरे पास सटीक और याद रखने के बीच का अंतर याद रखने में कठिन समय था, जब तक कि मैं अपने लिए इस महामारी के साथ नहीं आया था:

प्रीरेगन प्री टेस्ट के लिए है, क्योंकि रिकॉल कॉल सेंटर के लिए है।

गर्भावस्था परीक्षण के साथ, परीक्षण निर्माता को यह सुनिश्चित करने की आवश्यकता है कि सकारात्मक परिणाम का मतलब है कि महिला वास्तव में गर्भवती है। लोग अचानक शादी करने या घर खरीदने से एक सकारात्मक परीक्षण पर प्रतिक्रिया कर सकते हैं (यदि कई उपभोक्ताओं को झूठी सकारात्मकता मिली और बिना किसी कारण के भारी लागत का सामना करना पड़ा, तो परीक्षण निर्माता ग्राहकों की कमी होगी)। मुझे एक बार एक झूठी नकारात्मक गर्भावस्था का परीक्षण मिला, और इसका मतलब था कि मुझे गर्भवती होने का पता चलने में कुछ और सप्ताह लग गए ... सच में आखिरकार माफी मिल गई। (जानबूझ का मजाक।)

अब बीमा दावों के लिए एक कॉल सेंटर की तस्वीर लें। अधिकांश धोखेबाज दावों को सोमवार को फोन किया जाता है, धोखेबाज सहयोगियों के साथ जुड़ने और सप्ताहांत के दौरान उनकी बनाई गई कहानियों ("चलो कहते हैं कि कार चोरी हो गई थी") को तैयार करने के लिए। सोमवार को बीमा कंपनी के लिए सबसे अच्छी बात क्या है? शायद उन्हें सटीक रूप से याद करने का पक्ष लेना चाहिए। आगे की जांच के लिए सकारात्मक (संभावित धोखाधड़ी) के रूप में अधिक दावों को झंडी देना कहीं बेहतर है कि धोखाधड़ी और कुछ नकद का भुगतान न करें जो कभी भुगतान नहीं किया जाना चाहिए। एक झूठी सकारात्मक (संभवत: धोखाधड़ी के रूप में अतिरिक्त जांच के लिए चिह्नित किया गया था, लेकिन ग्राहक की हानि वास्तविक थी) एक अनुभवी समायोजक को निर्दिष्ट करके स्पष्ट किया जा सकता है, जो पुलिस रिपोर्ट पर जोर दे सकता है, सुरक्षा वीडियो बनाने का अनुरोध कर सकता है, आदि। एक धोखेबाज '

एफ 1 महान है लेकिन यह समझना कि परीक्षण / भविष्यवाणी का उपयोग कैसे किया जाएगा वास्तव में महत्वपूर्ण है, क्योंकि हमेशा गलत होने का कुछ जोखिम होता है ... आप जानना चाहते हैं कि गलत होने पर परिणाम कितने गंभीर होंगे।


1

ईमेल स्पैम का पता लगाना : यह एक उदाहरण है, जहां रिकॉल की तुलना में परिशुद्धता अधिक महत्वपूर्ण है ।

त्वरित पुनर्प्राप्ति :

  • परिशुद्धता : यह बताता है कि जब आप कुछ सकारात्मक की भविष्यवाणी करते हैं, तो वे वास्तव में कितनी बार सकारात्मक थे। जहाँ तक,

  • स्मरण करो : यह वास्तविक सकारात्मक डेटा से बाहर बताता है, आपने कितनी बार सही भविष्यवाणी की है।

ऊपर कहे जाने के बाद, स्पैम ईमेल का पता लगाने के मामले में, एक ठीक होना चाहिए अगर कोई स्पैम ईमेल (पॉजिटिव केस) अनपेक्षित छोड़ दिया गया है और स्पैम फ़ोल्डर में नहीं जाता है लेकिन , यदि कोई ईमेल अच्छा है (नकारात्मक), तो उसे नहीं जाना चाहिए स्पैम फोल्डर। यानी Precison अधिक महत्वपूर्ण है। (यदि मॉडल कुछ सकारात्मक (यानी स्पैम) की भविष्यवाणी करता है, तो यह स्पैम होना बेहतर है। अन्यथा, आप महत्वपूर्ण ईमेल याद कर सकते हैं)।

आशा है कि यह स्पष्ट करता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.