भविष्यवाणी और अनुमान में क्या अंतर है?


37

मैं " सांख्यिकीय ज्ञान का परिचय " के माध्यम से पढ़ रहा हूं । अध्याय 2 में, वे एक फ़ंक्शन अनुमान लगाने के कारण पर चर्चा करते हैं ।f

2.1.1 क्यों अनुमान ?f

दो मुख्य कारण हम अनुमान कर सकते हैं कर रहे हैं : भविष्यवाणी और अनुमान । हम बारी-बारी से प्रत्येक पर चर्चा करते हैं।

मैंने इसे कुछ समय में पढ़ा है, लेकिन मैं अभी भी भविष्यवाणी और अनुमान के अंतर पर आंशिक रूप से अस्पष्ट हूं। क्या कोई मतभेदों का (व्यावहारिक) उदाहरण दे सकता है?


5
एन इंट्रोडक्शन टू स्टैटिस्टिकल लर्निंग के लेखकों ने हमें यहाँ एक असहमति दी है। एक अनुमान लगाने के लिए इनफेक्शन बनाता है जैसे एक कारण और प्रभाव को समझने के लिए इनफॉरमेशन करता है। मेरियम-webster.com "अनुमान" को मुख्य रूप से "तथ्यों या परिसर से निष्कर्ष के रूप में प्राप्त करने के लिए" परिभाषित करता है। यह कारण और भविष्य कहनेवाला दोनों को शामिल करता है। यह भ्रामक, भ्रामक और लंबे समय तक मानक उपयोग के विरुद्ध "हीन" की परिभाषा को कम करने के लिए केवल कार्य-कारण के मामलों को शामिल करने के लिए है। तो: चलो विपरीत अनुमान के साथ कारण अनुमान लगाते हैं।
rolando2

2
@ rolando2: तब मुझे लगता है कि हमें वर्णनात्मक (गैर-कारण) मॉडल में मापदंडों के बारे में वर्णनात्मक निष्कर्ष की भी आवश्यकता है ।
kjetil b halvorsen

जवाबों:


29

Inference: डेटा के एक सेट को देखते हुए आप अनुमान लगाना चाहते हैं कि डेटा के फ़ंक्शन के रूप में आउटपुट कैसे उत्पन्न होता है।

भविष्यवाणी: एक नए माप को देखते हुए, आप एक मॉडल बनाने के लिए मौजूदा डेटा सेट का उपयोग करना चाहते हैं जो परिणामों के एक सेट से सही पहचानकर्ता का चयन करता है।


आविष्कार: आप यह जानना चाहते हैं कि टाइटन डिजास्टर से बचे जेंडर का एज, पैसेंजर क्लास और क्या प्रभाव पड़ता है। आप एक लॉजिस्टिक रिग्रेशन रख सकते हैं और प्रत्येक यात्री के जीवित रहने की दर पर प्रभाव का पता लगा सकते हैं।

भविष्यवाणी: टाइटैनिक यात्री की कुछ जानकारी को देखते हुए, आप सेट से चुनना चाहते हैं और जितनी बार संभव हो सही हो। (भविष्यवाणी के लिए पूर्वाग्रह-भिन्नता के व्यापार को देखें यदि आप आश्चर्यचकित होते हैं कि जितनी बार संभव हो उतना सही कैसे हो।){lives,dies}


भविष्यवाणी इनपुट और आउटपुट के बीच सबसे सटीक संबंध स्थापित करने के चारों ओर घूमती नहीं है, सटीक भविष्यवाणी नई टिप्पणियों को यथासंभव सही कक्षा में रखने के बारे में परवाह करती है।

इसलिए 'व्यावहारिक उदाहरण' गंभीर रूप से निम्नलिखित अंतर को उगलता है: एक एकल यात्री अनुमान दृष्टिकोण के लिए यात्री डेटा के एक सेट को देखते हुए आपको जीवित रहने की संभावना देता है, क्लासिफायर आपको जीवन या मृत्यु के बीच एक विकल्प देता है।

ट्यूनिंग क्लासिफायर उसी तरह से एक बहुत ही रोचक और महत्वपूर्ण विषय है जो पी-वैल्यू और आत्मविश्वास के अंतराल की सही व्याख्या करता है।


1
अच्छा उत्तर। लेकिन जब कुछ लोग "अनुमान" शब्द सुनते हैं, तो उन्हें लगता है कि "कारण निष्कर्ष।" आप उस बारे में भी कुछ कहना चाह सकते हैं, भले ही (या शायद इसलिए क्योंकि) ISLR इस पर केंद्रित नहीं है।
जेनेरिक_युसर

1
मुझे लगता है कि गहरी सीखने की दुनिया में अनुमान भविष्यवाणी की तरह ही बहुत अधिक है। blogs.nvidia.com/blog/2016/08/22/…
user1893354

1
यह मुझे पूरी तरह से एक अच्छा जवाब की तरह लगता है।
गूँज - मोनिका

3
मेरा मानना ​​है कि यह उत्तर गलत है, विशेष रूप से "अनुमान दृष्टिकोण आपको जीवित रहने की संभावना देता है, क्लासिफायर आपको जीवन या मृत्यु के बीच एक विकल्प देता है", और भी विशेष रूप से पहला भाग। एक यात्री के जीवित रहने की संभावना की गणना एक भविष्यवाणी है, विशेष रूप से एक संभावना है। निरंतर मामले में यह एक घनत्व पूर्वानुमान होगा। हम एक कठिन वर्गीकरण प्राप्त करने के लिए इस अनुमानित संभावना को सीमा में रख सकते हैं , हाँ। ...
एस। कोलासा - मोनिका

3
... जबकि भविष्यवाणी परिणामों के बारे में भविष्यवाणी करने के बारे में है , अनुमान परिणाम के इनपुट के संबंध को समझने के बारे में है: किस इनपुट का ऐसा संबंध है, और हम यादृच्छिक कोवरिएशन से "सच्चे" रिश्ते को कैसे अलग कर सकते हैं (जो कि मूल्यों के बारे में है) अंदर आएं)? क्या कोई मुझे समझा सकता है कि मैं कहाँ हूँ?
एस। कोलासा - मोनिका

11

आम तौर पर डेटा विश्लेषण करते समय हम कल्पना करते हैं कि किसी प्रकार की "डेटा जनरेटिंग प्रक्रिया" होती है जो डेटा को जन्म देती है, और इस प्रक्रिया की संरचना के बारे में सीखने से आशय संदर्भित है जबकि भविष्यवाणी का अर्थ है वास्तव में इससे आने वाले डेटा का पूर्वानुमान लगाना। । अक्सर दोनों एक साथ चलते हैं, लेकिन हमेशा नहीं।

एक उदाहरण जहां दोनों हाथों में हाथ डाले सरल रेखीय प्रतिगमन मॉडल होगा

Yi=β0+β1xi+ϵi.

β0β1


3
"लेकिन मॉडल जरूरी नहीं कि पर्दे के पीछे क्या हो रहा है, इस बारे में सार्थक जानकारी देता है।" " ब्लैक बॉक्स " शब्द दिमाग में आता है। :)
एलेक्सिस

या बहु-परत तंत्रिका जाल
शिहाब शहरयार खान

"लेकिन अन्य प्रकार के मॉडल हैं जहां एक समझदार भविष्यवाणियां करने में सक्षम है, लेकिन मॉडल जरूरी नहीं है कि पर्दे के पीछे क्या हो रहा है, इसके बारे में सार्थक अंतर्दृष्टि हो।", कौन परवाह करता है जब आप इसे परिभाषित करते हैं, तो अनुमान की समस्या, अभी भी मॉडल के मापदंडों को निर्धारित करने में से एक है। मुझे समझ में नहीं आता है कि आप इस वाक्य को "लेकिन" से क्यों शुरू करते हैं और आपने इस वाक्य को अपनी परिभाषा और भविष्यवाणी के संदर्भ में भी क्यों लिखा है।
nbro

1
"लेकिन" का उपयोग इसलिए है क्योंकि पूर्ववर्ती और निम्नलिखित मॉडल का वर्णन दोनों सही हैं, हालांकि निम्नलिखित मॉडल उन तरीकों से पूर्व की प्रकृति से अलग है जिनकी आपको उम्मीद नहीं थी जब तक कि आप भविष्यवाणी और अनुमान के बीच अंतर को समझ नहीं लेते हैं इसका चित्रण किया जा रहा है। मैं पहले से ही परिचित हूँ w / भेद, फिर भी, मैं इस उदाहरण को व्यावहारिक और उपयोगी मानता हूँ। +1
गुंग - को पुनः स्थापित मोनिका

10

पुस्तक के पृष्ठ 20 में, लेखक एक सुंदर उदाहरण प्रदान करते हैं जिसने मुझे अंतर को समझा।

यहाँ पुस्तक से पैराग्राफ है: एक परिचय सांख्यिकीय सीखना

"उदाहरण के लिए , एक रियल एस्टेट सेटिंग में, कोई व्यक्ति घरों के मूल्यों को अपराध दर, ज़ोनिंग, एक नदी से दूरी, हवा की गुणवत्ता, स्कूलों, समुदाय के आय स्तर, घरों के आकार, और इसी तरह से संबंधित कर सकता है। इस मामले में किसी की दिलचस्पी हो सकती है कि अलग-अलग इनपुट वैरिएबल कीमतों को कैसे प्रभावित करते हैं - यानी, अगर घर में नदी का दृश्य हो तो घर कितना अतिरिक्त होगा? यह एक अनुमान समस्या है । वैकल्पिक रूप से, एक बस दिलचस्पी हो सकती है । एक घर के मूल्य की भविष्यवाणी करने में इसकी विशेषताओं को बताया गया है: क्या यह घर अंडर-या अधिक मूल्यवान है? यह एक भविष्यवाणी समस्या है । "


5

yटीx1,टीx2,टी

yt=f(x1,t1,x2,t1)+εt

अब, अगर आप आय पर डेटा मिलता है, का कहना है कि बीईए से व्यक्तिगत प्रयोज्य आय श्रृंखला, और वर्ष चर के समय का निर्माण, आप यह अनुमान लगा सकता है समारोह , तो इस में वर्ष के समय जनसंख्या आय का नवीनतम मूल्यों और प्लग समारोह। इससे स्टोर के राजस्व की अगली तिमाही के लिए भविष्यवाणी होगी।

f/x2tβ2x2,t1

xसहसंबद्ध हैं कि भविष्यवक्ता के प्रभाव को अन्य भविष्यवक्ताओं के प्रभाव से अलग करना कठिन है। भविष्यवाणी के लिए यह कोई मायने नहीं रखता है, आप सभी का ध्यान पूर्वानुमान की गुणवत्ता है।


3

कल्पना कीजिए, आप एक गहन देखभाल इकाई पर एक चिकित्सा चिकित्सक हैं। आपके पास एक मजबूत बुखार और रक्त कोशिकाओं की एक संख्या और शरीर का एक वजन और सौ अलग-अलग डेटा हैं और आप भविष्यवाणी करना चाहते हैं, अगर वह जीवित है या नहीं। यदि हाँ, तो वह अपनी पत्नी को दूसरे बच्चे के बारे में उस कहानी को छुपाने जा रहा है, यदि नहीं, तो उसके लिए यह महत्वपूर्ण है कि वह इसे प्रकट करे, जबकि वह कर सकता है।

डॉक्टर इस भविष्यवाणी को पूर्व रोगियों के डेटा के आधार पर कर सकते हैं जो उन्होंने अपनी इकाई में की थी। अपने सॉफ्टवेयर ज्ञान के आधार पर, वह या तो सामान्यीकृत रैखिक प्रतिगमन (glm) या एक तंत्रिका जाल (nn) के माध्यम से भविष्यवाणी कर सकता है।

1. सामान्यीकृत रैखिक मॉडल

Glm के लिए कई सहसंबद्ध मापदंडों में से एक हैं ताकि परिणाम प्राप्त करने के लिए, डॉक्टर को मान्यताओं (रैखिकता आदि) और निर्णय लेने पड़ेंगे जिनके बारे में मापदंडों का प्रभाव पड़ने की संभावना है। ग्लम उसे अपने प्रत्येक मापदंडों के लिए महत्व के टी-टेस्ट के साथ पुरस्कृत करेगा ताकि वह मजबूत सबूत इकट्ठा कर सके, कि लिंग और बुखार का महत्वपूर्ण प्रभाव है, शरीर का वजन जरूरी नहीं है।

2. तंत्रिका जाल

तंत्रिका जाल सभी रोगियों को निगलने और पचाने वाली जानकारी देगा जो पूर्व रोगियों के नमूने में है। यह परवाह नहीं करेगा, कि क्या भविष्यवक्ता सहसंबद्ध हैं और यह उस जानकारी को प्रकट नहीं करेगा, कि क्या शरीर के वजन का प्रभाव केवल हाथ में या सामान्य रूप से नमूने में महत्वपूर्ण लगता है (कम से कम विशेषज्ञता के स्तर पर नहीं है कि डॉक्टर की पेशकश करनी है)। यह सिर्फ एक परिणाम की गणना करेगा।

बेहतर क्या है

किस विधि का चयन करना है यह उस कोण पर निर्भर करता है जिससे आप समस्या को देखते हैं: एक रोगी के रूप में, मैं तंत्रिका जाल को प्राथमिकता दूंगा जो सभी उपलब्ध डेटा का उपयोग करता है, जो कि रैखिकता जैसी मजबूत और स्पष्ट रूप से गलत धारणाओं के बिना मेरे लिए सबसे अच्छा अनुमान लगाएगा। डॉक्टर के रूप में, जो किसी जर्नल में कुछ डेटा प्रस्तुत करना चाहता है, उसे पी-वैल्यू की आवश्यकता है। दवा बहुत रूढ़िवादी है: वे पी-मूल्यों के लिए पूछने जा रहे हैं। इसलिए डॉक्टर रिपोर्ट करना चाहते हैं, कि ऐसी स्थिति में लिंग का महत्वपूर्ण प्रभाव होता है। रोगी के लिए, इससे कोई फर्क नहीं पड़ता है, बस जो कुछ भी नमूना सबसे अधिक होने का सुझाव देता है, उसका उपयोग करें।

इस उदाहरण में, रोगी भविष्यवाणी करना चाहता है, डॉक्टर का वैज्ञानिक पक्ष अनुमान चाहता है। ज्यादातर, जब आप एक प्रणाली को समझना चाहते हैं, तो अनुमान अच्छा है। यदि आपको एक निर्णय लेने की आवश्यकता है जहां आप सिस्टम को समझ नहीं सकते हैं, तो भविष्यवाणी को सहना होगा।


1
"एक रोगी के रूप में, मैं तंत्रिका जाल को प्राथमिकता दूंगा ..." आप इस तथ्य को नजरअंदाज करते हैं कि बड़ी मात्रा में डेटा नैदानिक ​​विज्ञान में आने के लिए बेहद कठिन हो सकता है। सुरक्षा, गोपनीयता और नैतिक चिंताओं के कारण प्रति समूह सिर्फ कई टिप्पणियों के डेटा सेट असामान्य नहीं हैं। यदि आप डेटा-जनरेट करने की प्रक्रिया पर रक्षात्मक धारणाएँ बना सकते हैं, तो आप डेटा का अधिक कुशल उपयोग कर सकते हैं।
फ्रैंस रोडेनबर्ग

यह एक काल्पनिक परिदृश्य माना जाता था, जिसमें कोई भी इस बात से आसानी से संबंधित हो सकता है कि क्यों समान रूप से एक ही समस्या अनुमान प्रश्नों और भविष्यवाणी समस्याओं का संकेत दे सकती है और वे एक समान क्यों नहीं हैं। मैं वास्तव में रोगी के बचने के अवसरों की भविष्यवाणी करने के तरीकों का प्रस्ताव नहीं कर रहा था और हां, मुझे यह अच्छी तरह पता है कि ध्यान देने योग्य आकार के विश्वसनीय नैदानिक ​​डेटा प्राप्त करना कितना कठिन हो सकता है। डेटा-जनरेट करने की प्रक्रिया की IMHO अच्छी धारणाएं / ज्ञान भविष्यवाणी के साथ-साथ अनुमान लगाने में भी मदद करेगा, इस प्रकार दोनों में अंतर नहीं होगा।
बर्नहार्ड

1

आप यहां अकेले नहीं हैं। उत्तर पढ़ने के बाद, मैं अब उलझन में नहीं हूं - इसलिए नहीं कि मैं अंतर को समझता हूं, बल्कि इसलिए कि मैं समझता हूं कि यह देखने वाले की नजर में है और मौखिक रूप से प्रेरित है। मुझे यकीन है कि अब वे दो शब्द वैज्ञानिक होने के बजाय राजनीतिक परिभाषा हैं। उदाहरण के लिए पुस्तक से स्पष्टीकरण लें, जिसे कॉलेजों ने एक अच्छे के रूप में उपयोग करने की कोशिश की: "एक घर में नदी के दृश्य होने पर कितना अतिरिक्त मूल्य होगा? यह एक अनुमान समस्या है।" मेरे दृष्टिकोण से, यह पूरी तरह से एक भविष्यवाणी समस्या है। आप नागरिक निर्माण कंपनी के मालिक हैं, और आप घरों के अगले सेट के निर्माण के लिए सबसे अच्छी जमीन चुनना चाहते हैं। आपको एक ही शहर में दो स्थानों में से एक को चुनना होगा, एक नदी के पास, दूसरा ट्रेन स्टेशन के पास। आप भविष्यवाणी करना चाहते हैंदोनों स्थानों के लिए मूल्य। या आप अनुमान लगाना चाहते हैं । आप आंकड़ों के सटीक तरीकों को लागू करने जा रहे हैं, लेकिन आप इस प्रक्रिया को नाम देते हैं। :)


यह विचार कि नदी के दृश्य के लिए एक निश्चित मूल्य की आवश्यकता होगी, एक कारण व्याख्या है। भविष्यवाणी कार्य-कारण के बारे में अज्ञेय है: मैं कारणों, प्रभावों के कारणों या किसी अन्य प्रभाव w ​​/ समान कारणों से 1 प्रभाव की भविष्यवाणी कर सकता हूं। मेरे दोस्त बिली पर विचार करें, जो 5'10 है "और जिसके पास एक समान जुड़वां है, बॉबी, कि मैं कभी नहीं मिला हूं। फिर भी, मैं बॉबी की भविष्यवाणी कर सकता हूं 5'10", लेकिन अगर मैं उसे एलीवेटर जूते देकर बिली को लंबा बनाता हूं। मैं जरूरी नहीं अनुमान लगा सकता हूं कि बिली इसी तरह लंबा होगा।
गूँज - मोनिका

आप जिस उदाहरण का हवाला देते हैं, वह केवल एक खराब उदाहरण है, इसीलिए यह भ्रामक है। निश्चित रूप से "राजनीति" की तुलना में अनुमान और विधेय के बीच अंतर अधिक है।
रिचर्ड हार्डी

1

वहाँ अच्छा अनुसंधान दिखा रहा है कि उधारकर्ताओं के ऋण चुकाने के लिए एक मजबूत भविष्यवक्ता है कि क्या वे अपने पैरों को फर्नीचर के पैरों से खरोंचने से बचाने के लिए महसूस करते हैं। यह "महसूस किया गया" वैरिएबल एक पूर्वानुमान मॉडल के लिए एक अलग सहायता होगा जहां परिणाम चुकौती बनाम डिफ़ॉल्ट है। हालांकि, अगर उधारदाता इस परिणाम पर अधिक लाभ उठाना चाहते हैं, तो वे यह सोचकर कि वे ऐसा कर सकते हैं, जैसा कि वे व्यापक रूप से महसूस कर सकते हैं वितरित करके फिर से हो जाएंगे।

"इस उधारकर्ता को चुकाने की कितनी संभावना है?" एक भविष्यवाणी समस्या है; "मैं परिणाम को कैसे प्रभावित कर सकता हूं?" समस्या का कारण है।


-1

y = f (x) तब

भविष्यवाणी (x के दिए गए मान के साथ Y का मान क्या है: यदि x का विशिष्ट मान क्या है तो Y का मान क्या हो सकता है

inference (एक्स में परिवर्तन के साथ वाई कैसे बदलता है): यदि एक्स बदलता है तो वाई पर क्या प्रभाव हो सकता है

भविष्यवाणी उदाहरण: मान लीजिए कि एक व्यक्ति के वेतन का प्रतिनिधित्व करते हैं तो अगर हम इनपुट के अनुभव, डिग्री के रूप में इनपुट चर जैसे डिग्री प्रदान करते हैं तो हमारा कार्य कर्मचारी के वेतन की भविष्यवाणी करता है।

अनुमान उदाहरण: मान लीजिए कि जीवित परिवर्तनों की लागत तो वेतन में कितना परिवर्तन है


मैं यह नहीं देखता कि यह उत्तर दो डाउनवोट्स में से क्यों होता है।
गूँग - मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.