एक्सट्रपलेशन के साथ क्या गलत है?


68

मुझे याद है कि स्टैटस कोर्स में बैठना एक अन्डरग्राउंड हियरिंग के बारे में था कि एक्सट्रपलेशन एक बुरा विचार क्यों था। इसके अलावा, ऑनलाइन कई तरह के स्रोत हैं जो इस पर टिप्पणी करते हैं। यहाँ भी इसका उल्लेख है

क्या कोई मुझे यह समझने में मदद कर सकता है कि एक्सट्रपलेशन एक बुरा विचार क्यों है? यदि यह है, तो यह कैसे होता है कि पूर्वानुमान तकनीक सांख्यिकीय रूप से अमान्य नहीं हैं?


3
@Firebug मार्क ट्वेन के बारे में कुछ कहना था। प्रासंगिक मार्ग आँकड़े.स्टैकएक्सचेंज . com / a / 24649 / 919 पर मेरे उत्तर के अंत के पास उद्धृत किया गया है ।
whuber

1
@ मुझे लगता है कि अब इसके बारे में बिल्कुल एक्सट्रपलेशन सोच नहीं है। कहते हैं, हम एक एल्गोरिथ्म को ठीक से प्रशिक्षित करते हैं और डेटा में एक सप्ताह की भविष्यवाणी करने की सुविधा में मान्य करते हैं। सही रीसम्पलिंग (और ट्यूनिंग, यदि ट्यून करने के लिए हाइपरपरमेटर्स हैं), तो मैं यह नहीं देख सकता कि क्या गलत है, यदि आपके पास प्रतिक्रिया है और आपको उस प्रतिक्रिया का विश्वास भी पता होना चाहिए। अब, यदि आप एक सप्ताह से सप्ताह के आधार पर अपने एल्गोरिथ्म को प्रशिक्षित करते हैं तो आप भविष्य में एक वर्ष की सटीक भविष्यवाणी करने की उम्मीद नहीं कर सकते हैं। संभव भ्रम के लिए क्षमा करें।
फायरबग

7
@ फ़ायरबग को माफ़ी मांगने की ज़रूरत नहीं है - आपकी टिप्पणी में उपयोगी स्पष्ट जानकारी है। जैसा कि मैंने उन्हें पढ़ा, वे सुझाव देते हैं कि "एक्सट्रपलेट" पूर्वानुमान सेटिंग में कई व्याख्याएं हो सकती हैं। एक यह है कि इसमें समय का एक "एक्सट्रपलेशन" शामिल है। लेकिन जब आप मानक समय-श्रृंखला के मॉडल को देखते हैं, विशेष रूप से वे जहां समय एक स्पष्ट सहसंयोजक नहीं है, वे पिछले मूल्यों के संदर्भ में भविष्य के मूल्यों की भविष्यवाणी करते हैं । जब वे पिछले मूल्य पिछले पिछले मूल्यों की सीमाओं के भीतर रहते हैं, तो मॉडल बिल्कुल भी कोई अतिरिक्त प्रदर्शन नहीं करता है! इसमें स्पष्ट विरोधाभास का संकल्प निहित हो सकता है।
whuber


2
मैं निराश xkcd को प्रदर्शित होने में कितना समय लगा, इस बात से निराश हूँ
डंकन एक्स सिम्पसन

जवाबों:


89

एक प्रतिगमन मॉडल का उपयोग अक्सर एक्सट्रपलेशन के लिए किया जाता है, अर्थात एक इनपुट की प्रतिक्रिया की भविष्यवाणी करना जो मॉडल को फिट करने के लिए उपयोग किए जाने वाले पूर्वसूचक चर के मूल्यों की सीमा के बाहर होता है। एक्सट्रपलेशन से जुड़े खतरे को निम्न आकृति में चित्रित किया गया है। एक्स्ट्रापॉलिटेड लाइन दिखाने वाला ग्राफ ऊपर की तरफ बढ़ता रहता है जहाँ "सही" वैल्यू घटती है

प्रतिगमन मॉडल "एक निर्माण के मॉडल" द्वारा एक प्रक्षेप मॉडल है, और एक्सट्रपलेशन के लिए उपयोग नहीं किया जाना चाहिए, जब तक कि यह ठीक से उचित न हो।


1
यह एक्सट्रपलेशन के खिलाफ एक भयानक उदाहरण है। स्ट्रेट रिग्रेशन लाइन फिट डेटा आपके कर्वी ट्रू फंक्शन की तुलना में बहुत बेहतर है।
राशिफल

9
"सीधी प्रतिगमन रेखा फिट डेटा आपके सुडौल सच्चे फ़ंक्शन की तुलना में बहुत बेहतर है" यह कथन गलत है। सही प्रतिगमन समारोह के लिए आरएसएस सरल प्रतिगमन लाइन के लिए आरएसएस से छोटा है,
कोस्टिया

बिंदु लिया गया और आप सही हो सकते हैं। लेकिन अंकों के बैच से देखते हुए, कोई तरीका नहीं है कि कोई भी सच्चे फ़ंक्शन का पता लगा सके।
राशिफल

27
ठीक ठीक। और इस कारण एक्सट्रपलेशन खराब विचार हो सकता है।
कोस्तिया

"प्रतिगमन मॉडल" निर्माण द्वारा "एक प्रक्षेप मॉडल" है -> मुझे लगता है कि हम प्रक्षेप के साथ वास्तव में एक ही मुद्दा हो सकता है (भले ही ऐसा होने की संभावना कम हो)
16

88

यह xkcd कॉमिक सभी को समझाती है।

xkcd कॉमिक

क्यूबोल (छड़ी के साथ आदमी) के डेटा बिंदुओं का उपयोग करते हुए, उसने कहा कि उसने अगले महीने के अंत तक महिला को "चार दर्जन" पति दिए होंगे, और इस एक्सट्रपलेशन का इस्तेमाल थोक में शादी के केक खरीदने के लिए किया जाएगा।

संपादन 3: आपमें से जो कहते हैं कि "उसके पास पर्याप्त डेटा बिंदु नहीं हैं", यहाँ एक और xkcd कॉमिक है :

xkcd कॉमिक

यहां, समय के साथ "टिकाऊ" शब्द का उपयोग एक अर्ध-लॉग प्लॉट पर दिखाया गया है, और डेटा बिंदुओं को एक्सट्रपलेट करने से हमें यह पता लगाने का अनुचित अनुमान प्राप्त होता है कि भविष्य में "टिकाऊ" शब्द कितनी बार आएगा।

संपादन 2: आप में से उन लोगों के लिए जो कहते हैं कि "आपको पिछले सभी डेटा बिंदुओं की भी आवश्यकता है", फिर भी एक और xkcd कॉमिक: xkcd कॉमिक

यहां, हमारे पास पिछले सभी डेटा पॉइंट हैं, लेकिन हम Google धरती के रिज़ॉल्यूशन की सटीक भविष्यवाणी करने में विफल हैं। ध्यान दें कि यह एक अर्ध-लॉग ग्राफ़ भी है।

संपादित करें: कभी-कभी, यहां तक ​​कि सबसे मजबूत (r = .9979 इस मामले में) सहसंबंध केवल गलत हैं।


यदि आप अन्य सहायक सबूतों के बिना एक्सट्रपलेशन करते हैं, तो आप सहसंबंध का उल्लंघन भी करते हैं , इसका मतलब यह नहीं है ; आँकड़ों की दुनिया में एक और महान पाप।

यदि आप X को Y के साथ एक्सट्रपलेट करते हैं, तो, आपको यह सुनिश्चित करना चाहिए कि आप केवल Y के साथ X की सटीक (अपनी आवश्यकताओं को पूरा करने के लिए) भविष्यवाणी कर सकते हैं लगभग हमेशा, प्रभाव X की तुलना में कई कारक होते हैं।

मैं एक और उत्तर की लिंक साझा करना चाहूंगा जो इसे नासिम निकोलस तालेब के शब्दों में समझाता है।


14
xkcd को हर संभव गणित / सांख्यिकी समस्या के बारे में एक चुटकुला सुनाया जा सकता है?
एंडर बिगुरी

24
यह विचार प्रक्षेप के विरुद्ध एक तर्क के रूप में इस्तेमाल किया जा सकता है: "कल रात आपके पास 0.5 पति थे"।
जीके

3
@JiK अगर आप सभी जानते हैं कि उसके पास अब एक है, और दो दिन पहले उसके पास कोई नहीं था, तो यह बुरा अनुमान नहीं है
;;

9
सस्टेनेबल सस्टेनेबल सस्टेनेबल सस्टेनेबल सस्टेनेबल सस्टेनेबल सस्टेनेबल। en.wikipedia.org/wiki/…
मेनी रोसेनफेल्ड

1
अधिक xkcd, लोग!
no --zɐɹƆ

24

"भविष्यवाणी बहुत मुश्किल है, खासकर अगर यह भविष्य के बारे में है"। उद्धरण किसी न किसी रूप में कई लोगों को दिया जाता है । मैं निम्नलिखित "एक्सट्रपलेशन" को "ज्ञात सीमा के बाहर की भविष्यवाणी" में प्रतिबंधित करता हूं, और एक आयामी सेटिंग में, ज्ञात अतीत से अज्ञात भविष्य में एक्सट्रपलेशन।

तो एक्सट्रपलेशन में क्या गलत है। पहले, अतीत को मॉडल करना आसान नहीं है । दूसरा, यह जानना कठिन है कि अतीत के एक मॉडल का उपयोग भविष्य के लिए किया जा सकता है या नहीं । दोनों कथनों के पीछे कारण या अर्गोडिटी, व्याख्यात्मक चर की पर्याप्तता आदि के बारे में गहन प्रश्न हैं, जो काफी हद तक निर्भर हैं। क्या गलत है कि एक भी एक्सट्रपलेशन स्कीम चुनना मुश्किल है, जो विभिन्न संदर्भों में ठीक है, बिना किसी अतिरिक्त जानकारी के।

यह सामान्य बेमेल स्पष्ट रूप से नीचे दिखाए गए Anscombe चौकड़ी डाटासेट में सचित्र है । रेखीय प्रतिगमन भी है ( कोर्डिनेट रेंज के बाहर ) एक्सट्रपलेशन का एक उदाहरण। समान मानक आँकड़ों के साथ एक ही पंक्ति चार सेटों को पुनः प्राप्त करती है। हालांकि, अंतर्निहित मॉडल काफी अलग हैं।x

Anscombe चौकड़ी

हालांकि, पूर्वानुमान को कुछ विस्तार के लिए ठीक किया जा सकता है। अन्य उत्तरों में जोड़ना, कुछ अवयवों को व्यावहारिक रूप से बदलने में मदद कर सकता है:

  1. आप अपनी दूरी (इंडेक्स ) के अनुसार नमूनों को उस स्थान ले जा सकते हैं जहाँ आप एक्सट्रपलेशन करना चाहते हैं। उदाहरण के लिए, एक बढ़ा हुआ कार्य का उपयोग (साथ ) की तरह, घातीय भार या चौरसाई , या नमूनों की रपट खिड़कियां पुराने मूल्यों के लिए कम महत्व देने के लिए।पी एफ पी ( एन ) पी nnpfp(n)pn
  2. आप कई एक्सट्रपलेशन मॉडल का उपयोग कर सकते हैं, और उन्हें जोड़ सकते हैं या सर्वश्रेष्ठ का चयन कर सकते हैं ( कम्बाइनिंग पूर्वानुमान , जे। स्कॉट आर्मस्ट्रांग, 2001)। हाल ही में, उनके इष्टतम संयोजन पर कई कार्य हुए हैं (यदि आवश्यक हो तो मैं संदर्भ प्रदान कर सकता हूं)।

हाल ही में, मैं एक वास्तविक समय के वातावरण में सिमुलेशन सबसिस्टम के संचार के लिए मूल्यों को अतिरिक्त रूप देने के लिए एक परियोजना में शामिल हुआ हूं। इस डोमेन में हठधर्मिता यह थी कि अतिरिक्तकरण अस्थिरता का कारण बन सकता है। हमने वास्तव में महसूस किया कि दोनों उपरोक्त सामग्रियों का संयोजन बहुत ही कुशल था, ध्यान देने योग्य अस्थिरता के बिना (औपचारिक प्रमाण के बिना, और वर्तमान में समीक्षा के बिना )। और एक्सट्रपलेशन ने सरल बहुपद के साथ काम किया, बहुत कम कम्प्यूटेशनल बोझ के साथ, अधिकांश ऑपरेशन पहले से गणना किए गए और लुक-अप तालिकाओं में संग्रहीत किए गए।

अंत में, जैसा कि एक्सट्रपलेशन अजीब ड्राइंग का सुझाव देता है, निम्नलिखित रैखिक प्रतिगमन का पिछड़ा प्रभाव है:

प्यार और रैखिक प्रतिगमन के साथ मज़ा


+1 अच्छा जवाब। इस वेबसाइट के अनुसार ऐसा लगता नहीं है कि बोह्र ने कहा है। यह एक असामान्य लेकिन सामान्य डेनिश कहावत होने की अधिक संभावना है।
us --r11852

@ us @r11852 अनलकीली उन्होंने "कभी कहा था"? इसीलिए मैंने कहा "जिम्मेदार", क्या मुझे अधिक सतर्क होना चाहिए?
लॉरेंट डुवल

2
मैंने कभी हिस्सा नहीं कहा । मैंने यह टिप्पणी इसलिए की क्योंकि यह कहा जाता है कि यह कहावत दानिश की एक कहावत है, इसके लिए विशेष रूप से जिम्मेदार (अत्यधिक प्रतीक) होने के कारण डेन को ओवर-बिलिंग का थोड़ा सा लगता है - विशेष रूप से यह देखते हुए कि बोहर का कोई रिकॉर्ड नहीं है। मूल लेखक कल के कैच पर टिप्पणी करने वाला एक अनाम मछुआरा हो सकता है! मैं यहाँ छोटे आदमी के लिए निहित हूँ! : D
us atr11852

2
पिछले उद्धरण किंवदंतियों के साथ-साथ मॉडल के लिए बहुत कठिन है।
लॉरेंट डुवल

3
निश्चित रूप से प्रश्न दोनों शब्दों का उपयोग करता है: पूरे बिंदु यह है कि क्या "पूर्वानुमान" को "एक्सट्रपलेशन" का एक रूप माना जाना है। आपकी परिचयात्मक टिप्पणियों के अनुसार, आप अतीत को "भविष्य का मॉडल" बनाने के लिए एक्सट्रपलेशन को परिभाषित करते हैं। जब तक आप प्रत्येक की स्पष्ट और विशिष्ट परिभाषाएँ प्रस्तुत नहीं करते, तब तक आपका उत्तर गलत समझा जा सकता है।
जुबेर

17

हालांकि एक मॉडल का फिट " अच्छा " हो सकता है , डेटा की सीमा से परे एक्सट्रपलेशन को संदेहपूर्वक व्यवहार किया जाना चाहिए। कारण यह है कि कई मामलों में एक्सट्रपलेशन (दुर्भाग्य से और अनजाने में) उनके देखे गए समर्थन से परे डेटा के व्यवहार के बारे में अस्थिर धारणाओं पर निर्भर करता है।

जब किसी को एक्सट्रपलेशन करते समय दो निर्णय कॉल करने चाहिए: पहला, मात्रात्मक दृष्टिकोण से, डेटा की सीमा के बाहर मॉडल कितना वैध है? दूसरा, गुणात्मक दृष्टिकोण से, एक बिंदु कितना प्रशंसनीय है जो हम नमूना के लिए मानने वाली आबादी का सदस्य होने के लिए मनाया नमूना सीमा के बाहर बिछाते हैं? चूँकि दोनों प्रश्न अस्पष्टता के एक निश्चित अंश में प्रवेश करते हैं, अतः इसे एक अस्पष्ट तकनीक भी माना जाता है। यदि आपके पास यह मानने के कारण हैं कि ये धारणाएं पकड़ में आती हैं, तो एक्सट्रपलेशन आमतौर पर एक मान्य ह्रास प्रक्रिया है।xout

एक अतिरिक्त चेतावनी यह है कि कई गैर-पैरामीट्रिक अनुमान तकनीक मूल रूप से एक्सट्रपलेशन की अनुमति नहीं देती हैं। यह समस्या विशेष रूप से स्पलाइन स्मूथिंग के मामले में ध्यान देने योग्य है जहां फिटेड स्पलाइन को लंगर करने के लिए अधिक गाँठ नहीं हैं।

मुझे इस बात पर जोर देना चाहिए कि एक्सट्रपलेशन बुराई से दूर है। उदाहरण के लिए, सांख्यिकी में व्यापक रूप से उपयोग की जाने वाली संख्यात्मक विधियाँ (उदाहरण के लिए ऐटकेन की डेल्टा-स्क्वैर्ड प्रक्रिया और रिचर्डसन एक्सट्रैपलेशन ) अनिवार्य रूप से इस विचार के आधार पर एक्सट्रपलेशन स्कीम हैं कि देखे गए कार्यों के लिए विश्लेषण किए गए फ़ंक्शन का अंतर्निहित व्यवहार फ़ंक्शन के समर्थन में स्थिर रहता है।


एल्थो के लिए Wynn (Aitken का कम्प्यूटेशनल रूप से उपयोगी सामान्यीकरण ) और रिचर्डसन एक्सट्रपलेशन के लिए सुरक्षा उपायों को लिखना संभव है , यह हो सकता है और ऐसा होता है कि इन एल्गोरिदम को अंतर्निहित धारणाएं इसे खिलाए गए दृश्यों से बहुत अच्छी तरह से संतुष्ट नहीं हैं। अनिश्चितता के अनुक्रमों के साथ इन एक्सट्रपलेशन विधियों का उपयोग करते समय, पर्याप्त रूप से विरोधाभास आमतौर पर परीक्षण के लिए हाथ में इन अभिसरण त्वरण विधियों में से दो या अधिक होंगे, और केवल परिणामों पर भरोसा करेंगे यदि इनमें से कम से कम दो वैचारिक रूप से बहुत अलग तरीके उनके परिणामों में सहमत हों। । Δ 2εΔ2
JM

15

अन्य उत्तरों के विपरीत, मैं कहूँगा कि एक्सट्रपलेशन के साथ कुछ भी गलत नहीं है जहाँ तक इसका इस्तेमाल नासमझ तरीके से नहीं किया गया है। सबसे पहले, ध्यान दें कि एक्सट्रपलेशन है :

मूल अवलोकन सीमा से परे आकलन की प्रक्रिया, एक चर के साथ अपने संबंधों के आधार पर एक चर का मूल्य।

... तो यह बहुत व्यापक शब्द है और कई अलग-अलग तरीके हैं जो सरल रैखिक एक्सट्रपलेशन से लेकर रैखिक प्रतिगमन, बहुपद प्रतिगमन, या यहां तक ​​कि कुछ उन्नत समय-श्रृंखला पूर्वानुमान विधियों में इस तरह की परिभाषा फिट करते हैं। वास्तव में, एक्सट्रपलेशन, पूर्वानुमान और पूर्वानुमान निकटता से संबंधित हैं। आंकड़ों में हम अक्सर बनाने भविष्यवाणियों और पूर्वानुमान । यह भी वही है जो आप कहते हैं कि लिंक:

हमें 1 दिन के आंकड़ों से सिखाया जाता है कि एक्सट्रपलेशन एक बड़ी संख्या है, लेकिन यह वास्तव में पूर्वानुमान है।

भविष्यवाणियों को बनाने के लिए कई अतिरिक्त तरीकों का उपयोग किया जाता है , इसके अलावा, अक्सर कुछ सरल तरीके छोटे नमूनों के साथ बहुत अच्छी तरह से काम करते हैं, इसलिए जटिल लोगों को पसंद किया जा सकता है। समस्या यह है, जैसा कि अन्य उत्तरों में देखा गया है, जब आप एक्सट्रपलेशन विधि का अनुचित तरीके से उपयोग करते हैं।

उदाहरण के लिए, कई अध्ययनों से पता चलता है कि पश्चिमी देशों में समय के साथ यौन दीक्षा की उम्र कम हो जाती है। अमेरिका में पहले संभोग की उम्र के बारे में नीचे एक भूखंड पर एक नज़र डालें। यदि हमने पहले संभोग की उम्र का अनुमान लगाने के लिए रैखिक प्रतिगमन का अंधाधुंध उपयोग किया है, तो हम इसे कुछ वर्षों में शून्य से नीचे जाने की भविष्यवाणी करेंगे (तदनुसार पहली शादी और जन्म के कुछ समय बाद होने वाले पहले जन्म) ... हालाँकि, अगर आपको बनाने की आवश्यकता है एक साल का पूर्वानुमान है, तो मुझे लगता है कि रैखिक प्रतिगमन प्रवृत्ति के लिए बहुत सटीक अल्पकालिक भविष्यवाणियों का नेतृत्व करेगा।

यहाँ छवि विवरण दर्ज करें

(स्रोत guttmacher.org )

सभी मॉडल गलत हैं , एक्सट्रपलेशन भी गलत है, क्योंकि यह आपको सटीक भविष्यवाणियां करने में सक्षम नहीं करेगा। अन्य गणितीय / सांख्यिकीय उपकरणों के रूप में यह आपको अनुमानित भविष्यवाणियाँ करने में सक्षम करेगा । वे कितने सटीक होंगे, यह उस डेटा की गुणवत्ता पर निर्भर करता है जो आपके पास है, आपकी समस्या के लिए पर्याप्त तरीकों का उपयोग करते हुए, आपके मॉडल और कई अन्य कारकों को परिभाषित करते समय आपके द्वारा की गई धारणाएं। लेकिन इसका मतलब यह नहीं है कि हम ऐसे तरीकों का इस्तेमाल नहीं कर सकते। हम कर सकते हैं, लेकिन हमें उनकी सीमाओं के बारे में याद रखना चाहिए और किसी समस्या के लिए उनकी गुणवत्ता का आकलन करना चाहिए ।


4
जब आप 1980 के दशक के प्रारंभ में प्रतिगमन के लिए उपयोग किए जाने वाले डेटा को समाप्त कर देते हैं, तो आप संभवतः आसानी से परीक्षण कर सकते हैं कि उस तिथि से आगे कब तक अतिरिक्त काम होगा।
गेरिट

@gerrit मैं सहमत हूं, लेकिन दुर्भाग्य से मैं उपयुक्त डेटा नहीं खोज पाया। लेकिन अगर कोई मुझे यह इंगित कर सकता है तो मुझे इस तरह की तुलना के लिए अपना जवाब अपडेट करने में खुशी होगी।
टिम

इस मामले में, एक्सट्रपलेशन विफल हो जाता है, यह देखते हुए कि पिछले कई वर्षों में पहले सेक्स की उम्र कूद गई है। (लेकिन इस के लिए डेटा हमेशा जन्म का एक-दो दशक तक जन्म लेता है, ऐसे कारणों से जो स्पष्ट होना चाहिए।)
डेविड मैनहेम

13

मैं नसीम तालेब द्वारा उदाहरण को काफी पसंद करता हूं (जो बर्ट्रेंड रसेल द्वारा पहले के उदाहरण का रूपांतरण था):

एक टर्की पर विचार करें जो हर दिन खिलाया जाता है। हर एक खिला पक्षी के विश्वास को दृढ़ करेगा कि यह मानव जाति के अनुकूल सदस्यों द्वारा हर दिन खिलाए जाने वाले जीवन का सामान्य नियम है "एक राजनीतिज्ञ के रूप में अपने सर्वोत्तम हितों की तलाश में"। थैंक्सगिविंग से पहले बुधवार की दोपहर को, टर्की को कुछ अप्रत्याशित होगा। यह विश्वास का एक संशोधन होगा।

कुछ गणितीय एनालॉग निम्नलिखित हैं:

  • किसी फ़ंक्शन के पहले कुछ टेलर गुणांक का ज्ञान हमेशा यह गारंटी नहीं देता है कि सफल गुणांक आपके निर्धारित पैटर्न का पालन करेंगे।

  • एक विभेदक समीकरण की प्रारंभिक स्थितियों का ज्ञान हमेशा अपने अस्वाभाविक व्यवहार के ज्ञान की गारंटी नहीं देता है (जैसे लोरेंज के समीकरण, कभी-कभी तथाकथित "तितली प्रभाव" में विकृत होते हैं)

यहाँ इस मामले पर एक अच्छा एमओ धागा है।


3
... और निश्चित रूप से, तालेब को नैतिक पाठ को इंगित करना है : "टर्की मत बनो"! इस संदर्भ में: एक लापरवाह निर्लिप्त मत बनो, और पतिव्रता के पाप के आगे मत झुकना।
JM

@ uo askingP uzɐɹC, मैं इसके लिए नहीं कह रहा था, लेकिन धन्यवाद!
जेएम

वास्तव में क्रॉस मान्य प्रतिष्ठा के लिए उपयोग नहीं है - और किसी ने आपका जवाब नहीं देखा और यह वास्तव में अच्छा था। का आनंद लें!
no --zɐɹƆ

12

यदि आप करेंगे, तो निम्न कहानी को बताइए।

मुझे एक सांख्यिकी पाठ्यक्रम में बैठना भी याद है, और प्रोफेसर ने हमें बताया कि एक्सट्रपलेशन एक बुरा विचार था। फिर अगली कक्षा के दौरान उन्होंने हमें बताया कि यह एक बुरा विचार था; वास्तव में, उन्होंने दो बार कहा।

मैं बाकी सेमेस्टर के लिए बीमार था, लेकिन मैं निश्चित था कि मैं बहुत सारी सामग्री को याद नहीं कर सकता था, क्योंकि पिछले हफ्ते तक आदमी निश्चित रूप से कुछ भी नहीं कर रहा था, लेकिन लोगों को बार-बार बता रहा था कि कैसे एक्सट्रपलेशन एक बुरा विचार था। ।

अजीब तरह से, मैं परीक्षा में बहुत उच्च स्कोर नहीं किया।


6
सवाल पूछता है "एक्सट्रपलेशन के साथ क्या गलत है?"। हम उन उत्तरों की तलाश में हैं जो कारण देते हैं कि एक्सट्रपलेशन खराब विचार क्यों हो सकता है।
रॉबर्ट लांग

8
@RobertLong: यह वास्तव में एक तरह का मेटा / मज़ाक का जवाब है, और xkcd.com/605 के समान है - फिर भी शायद एक उत्तर की तुलना में एक टिप्पणी के रूप में बेहतर है।
नील स्लेटर

@NeilSlater: आपको अपनी टिप्पणी एक उत्तर के रूप में पोस्ट करनी चाहिए ... :)
us11r11852

@RobertLong: यह उस तरह का उत्तर है। यह बस एक दृष्टान्त का रूप है।
ईनपोकलम

2
यह स्पष्ट नहीं है कि आपका मॉडल घातीय है।
गेरिट

6

सवाल सिर्फ सांख्यिकीय नहीं है, यह महामारी विज्ञान भी है। एक्सट्रैपलेशन एक तरह से प्रकृति के बारे में हम सीखते हैं, यह प्रेरण का एक रूप है । मान लें कि हमारे पास 0 से 20 सेल्सियस तक के तापमान में एक सामग्री की विद्युत चालकता के लिए डेटा है, हम 40 डिग्री सेल्सियस पर चालकता के बारे में क्या कह सकते हैं?

यह छोटे नमूने के अनुमान से निकटता से संबंधित है: हम एक छोटे नमूने पर किए गए माप से पूरी आबादी के बारे में क्या कह सकते हैं? यह गॉसेट द्वारा गुनेस के रूप में शुरू किया गया था , जो छात्र टी-वितरण के साथ आया था। इससे पहले कि वे सांख्यिकीविद छोटे नमूनों के बारे में सोचने की जहमत नहीं उठाते थे कि नमूना आकार हमेशा बड़ा हो सकता है। वह गिनी में था और बीयर के नमूनों से यह तय करना था कि बीयर के पूरे बैच के साथ क्या करना है।

इसलिए, व्यवहार (व्यवसाय), इंजीनियरिंग और विज्ञान में हमें हमेशा कुछ तरीकों से अतिरिक्त काम करना पड़ता है। यह छोटे नमूनों को बड़े पैमाने पर एक्सट्रपलेशन कर सकता है, या सीमित परिस्थितियों में इनपुट स्थितियों की एक विस्तृत श्रृंखला से लेकर, त्वरक में क्या हो रहा है, जो कि ब्लैक मील के अरबों मील दूर क्या हुआ आदि यह विज्ञान में हालांकि विशेष रूप से महत्वपूर्ण है। , जैसा कि हम वास्तव में हमारे एक्सट्रपलेशन अनुमानों और वास्तविक मापों के बीच विसंगतियों का अध्ययन करके सीखते हैं। जब हम विसंगतियाँ बड़ी या सुसंगत होती हैं तो अक्सर हम नई घटनाएँ पाते हैं।

इसलिए, मैं कहता हूं कि एक्सट्रपलेशन के साथ कोई समस्या नहीं है। यह कुछ ऐसा है जो हमें हर दिन करना है। यह सिर्फ मुश्किल है।


4

एक्सट्रैपलेशन खुद आवश्यक रूप से बुराई नहीं है, लेकिन यह एक ऐसी प्रक्रिया है जो खुद को निष्कर्ष पर ले जाती है जो इंटरपोलेशन के साथ आने से अधिक अनुचित हैं।

  • एक्सट्रैपलेशन अक्सर नमूना क्षेत्र से काफी दूर मूल्यों का पता लगाने के लिए किया जाता है। अगर मैं 0-10 से 100 मानों का नमूना ले रहा हूं, और फिर थोड़ा बाहर निकालता हूं, तो केवल 11 तक, मेरा नया बिंदु संभवतः किसी भी डेटापोइंट से किसी भी प्रक्षेप से 10 गुना अधिक दूर हो सकता है। इसका मतलब यह है कि एक चर के लिए बहुत अधिक जगह हाथ से बाहर निकलने के लिए (गुणात्मक रूप से) है। ध्यान दें कि मैंने जानबूझकर केवल एक मामूली एक्सट्रपलेशन चुना है। यह दूर तक बिगड़ सकता है
  • एक्सट्रपलेशन को कर्व फिट के साथ किया जाना चाहिए जो एक्सट्रपलेशन करने के लिए इरादा था। उदाहरण के लिए, कई बहुपद फिट्स एक्सट्रपलेशन के लिए बहुत खराब हैं क्योंकि सैंपल रेंज पर अच्छी तरह से व्यवहार करने वाले शब्द आपके छोड़ने के बाद फट सकते हैं। अच्छा एक्सट्रपलेशन एक "अच्छे अनुमान" पर निर्भर करता है जैसे कि नमूना क्षेत्र के बाहर क्या होता है। जो मुझे लाता है ...
  • चरण संक्रमण की उपस्थिति के कारण एक्सट्रपलेशन का उपयोग करना अक्सर बेहद मुश्किल होता है। कई प्रक्रियाएँ जिन्हें करने की इच्छा हो सकती है, उन पर निश्चित रूप से गैर-संपत्तियों की संपत्तियां होती हैं, जो नमूना क्षेत्र में पर्याप्त रूप से उजागर नहीं होती हैं। ध्वनि की गति के आसपास वैमानिकी एक उत्कृष्ट उदाहरण है। कम गति से कई एक्सट्रपलेशन आप तक पहुँचते हैं और हवा में सूचना हस्तांतरण की गति से अधिक हो जाते हैं। सॉफ्ट साइंसेज के साथ भी यह अक्सर होता है, जहां पॉलिसी ही पॉलिसी की सफलता को प्रभावित कर सकती है। केनेसियन अर्थशास्त्र ने यह बताया कि अर्थव्यवस्था कैसे मुद्रास्फीति के विभिन्न स्तरों के साथ व्यवहार करेगी, और सर्वोत्तम संभव परिणाम की भविष्यवाणी की। दुर्भाग्य से, दूसरे क्रम के प्रभाव थे और परिणाम आर्थिक समृद्धि नहीं था, बल्कि अमेरिका द्वारा देखी गई सबसे अधिक मुद्रास्फीति की दर थी।
  • लोग एक्स्ट्रापोलिशन पसंद करते हैं । सामान्यतया, लोग वास्तव में चाहते हैं कि कोई व्यक्ति क्रिस्टल बॉल में सहकर्मी हो और उन्हें भविष्य बताए। वे आश्चर्यजनक रूप से खराब एक्सट्रपलेशन को केवल इसलिए स्वीकार करेंगे क्योंकि यह सभी जानकारी है। हो सकता है कि यह एक्सट्रपलेशन को स्वयं खराब न करे, प्रति se, लेकिन यह निश्चित रूप से कुछ है जिसका उपयोग करते समय इसका हिसाब रखना चाहिए।

एक्सट्रपलेशन में अंतिम के लिए, मैनहट्टन प्रोजेक्ट पर विचार करें। भौतिकविदों ने जहां वास्तविक चीज़ के निर्माण से पहले बेहद छोटे पैमाने पर परीक्षणों के साथ काम करने के लिए मजबूर किया। उनके पास परीक्षणों पर बर्बाद करने के लिए पर्याप्त यूरेनियम नहीं था। उन्होंने जो किया सबसे अच्छा किया, और वे स्मार्ट थे। हालांकि, जब अंतिम परीक्षण हुआ, तो यह तय किया गया कि प्रत्येक वैज्ञानिक यह तय करेगा कि विस्फोट से कितना दूर वे जब यह जाना चाहते थे। इस बात पर पर्याप्त मतभेद थे कि "सुरक्षित" कितनी दूर थी क्योंकि हर वैज्ञानिक जानता था कि वे अपने परीक्षणों से काफी दूर थे। यहां तक ​​कि गैर-तुच्छ विचार भी था कि वे परमाणु बम से वातावरण को आग लगा सकते हैं, एक मुद्दा यह भी है कि पर्याप्त रूप से अतिरिक्त पृथक्करण के साथ!


3

यहाँ बहुत सारे अच्छे उत्तर हैं, मैं केवल इस मुद्दे के मूल के रूप में जो कुछ भी देखता हूं, उसका प्रयास करना और इसे संश्लेषित करना चाहता हूं: यह उस डेटा जनरेटिंग प्रक्रिया से परे है जो अनुमान के नमूने को जन्म देता है। इसे कभी-कभी 'संरचनात्मक परिवर्तन' कहा जाता है।

पूर्वानुमान मान्यताओं के साथ आता है, मुख्य एक जो डेटा जनरेट करने की प्रक्रिया है (जैसा कि निकट कोई महत्वपूर्ण अंतर नहीं है) उसी के समान है जो नमूना उत्पन्न करता है (आरएच चर के अलावा, जिनके परिवर्तन आप मॉडल में स्पष्ट रूप से खाते हैं) । यदि कोई संरचनात्मक परिवर्तन होता है (यानी तालेब के उदाहरण में धन्यवाद), तो सभी दांव बंद हो जाते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.