यह xkcd कॉमिक सभी को समझाती है।
क्यूबोल (छड़ी के साथ आदमी) के डेटा बिंदुओं का उपयोग करते हुए, उसने कहा कि उसने अगले महीने के अंत तक महिला को "चार दर्जन" पति दिए होंगे, और इस एक्सट्रपलेशन का इस्तेमाल थोक में शादी के केक खरीदने के लिए किया जाएगा।
संपादन 3: आपमें से जो कहते हैं कि "उसके पास पर्याप्त डेटा बिंदु नहीं हैं", यहाँ एक और xkcd कॉमिक है :
यहां, समय के साथ "टिकाऊ" शब्द का उपयोग एक अर्ध-लॉग प्लॉट पर दिखाया गया है, और डेटा बिंदुओं को एक्सट्रपलेट करने से हमें यह पता लगाने का अनुचित अनुमान प्राप्त होता है कि भविष्य में "टिकाऊ" शब्द कितनी बार आएगा।
संपादन 2: आप में से उन लोगों के लिए जो कहते हैं कि "आपको पिछले सभी डेटा बिंदुओं की भी आवश्यकता है", फिर भी एक और xkcd कॉमिक:
यहां, हमारे पास पिछले सभी डेटा पॉइंट हैं, लेकिन हम Google धरती के रिज़ॉल्यूशन की सटीक भविष्यवाणी करने में विफल हैं। ध्यान दें कि यह एक अर्ध-लॉग ग्राफ़ भी है।
संपादित करें: कभी-कभी, यहां तक कि सबसे मजबूत (r = .9979 इस मामले में) सहसंबंध केवल गलत हैं।
यदि आप अन्य सहायक सबूतों के बिना एक्सट्रपलेशन करते हैं, तो आप सहसंबंध का उल्लंघन भी करते हैं , इसका मतलब यह नहीं है ; आँकड़ों की दुनिया में एक और महान पाप।
यदि आप X को Y के साथ एक्सट्रपलेट करते हैं, तो, आपको यह सुनिश्चित करना चाहिए कि आप केवल Y के साथ X की सटीक (अपनी आवश्यकताओं को पूरा करने के लिए) भविष्यवाणी कर सकते हैं । लगभग हमेशा, प्रभाव X की तुलना में कई कारक होते हैं।
मैं एक और उत्तर की लिंक साझा करना चाहूंगा जो इसे नासिम निकोलस तालेब के शब्दों में समझाता है।