डेटा अनिश्चितता के आधार पर रैखिक प्रतिगमन ढलान की अनिश्चितता की गणना करें


12

डेटा अनिश्चितता (संभवतः एक्सेल / गणित में) के आधार पर रैखिक प्रतिगमन ढलान की अनिश्चितता की गणना कैसे करें?

उदाहरण: उदाहरण कथानक चलो डेटा अंक (0,0), (1,2), (2,4), (3,6), (4,8), ... (8, 16) हैं, लेकिन प्रत्येक y मान है 4 की अनिश्चितता। सबसे अधिक कार्य जो मैंने पाया, वह अनिश्चितता की गणना 0 के रूप में करेगा, क्योंकि अंक पूरी तरह से फ़ंक्शन y = 2x से मेल खाते हैं। लेकिन, जैसा कि चित्र पर दिखाया गया है, y = x / 2 अंक के साथ भी मेल खाते हैं। यह एक अतिरंजित उदाहरण है, लेकिन मुझे आशा है कि यह दिखाता है कि मुझे क्या चाहिए।

संपादित करें: यदि मैं थोड़ा और समझाने की कोशिश करता हूं, जबकि उदाहरण के प्रत्येक बिंदु का y का एक निश्चित मूल्य है, तो हम दिखावा करते हैं कि हमें पता नहीं है कि क्या यह सच है। उदाहरण के लिए पहला बिंदु (0,0) वास्तव में (0,6) या (0, -6) या बीच में कुछ भी हो सकता है। मैं पूछ रहा हूं कि क्या कोई लोकप्रिय समस्या है जो इसे ध्यान में रखती है। उदाहरण में (0,6), (1,6.5), (2,7), (3,7.5), (4,8), ... (8, 10) अभी भी अनिश्चितता की सीमा में हैं, इसलिए वे सही बिंदु हो सकते हैं और उन बिंदुओं को जोड़ने वाली रेखा में एक समीकरण होता है: y = x / 2 + 6, जबकि समीकरण से हम अनिश्चितताओं में फैक्टरिंग नहीं करते हैं समीकरण है: y = 2x + 0. तो k की अनिश्चितता 1,5 है और n का 6 है।

TL; DR: चित्र में, एक रेखा y = 2x है जिसे कम से कम वर्ग फिट का उपयोग करके गणना की जाती है और यह डेटा को पूरी तरह से फिट करता है। मैं यह जानने की कोशिश कर रहा हूं कि y = kx + n में k और n कितना बदल सकते हैं लेकिन यदि हम y मानों में अनिश्चितता जानते हैं तो भी डेटा को फिट कर सकते हैं। मेरे उदाहरण में, k की अनिश्चितता 1.5 है और n में 6 है। छवि में 'सबसे अच्छी' फिट लाइन है और एक लाइन है जो सिर्फ बमुश्किल बिंदुओं को फिट करती है।


1
यदि आपके पास अपने में अनिश्चितता है , तो आपको आम तौर पर साधारण रेखीय प्रतिगमन का उपयोग नहीं करना चाहिए क्योंकि यह पक्षपाती है (हालांकि छोटी अनिश्चितताओं के परिणामस्वरूप छोटे पूर्वाग्रह हो जाएंगे; शायद आपको इतना ध्यान न हो)। क्या आपके वाई में अनिश्चितताएं हमेशा बनी रहती हैं या वे बदलती रहती हैं? आप अपनी लाइन कैसे फिट कर रहे हैं? x
Glen_b -Reinstate Monica

मैं मुख्य रूप से y में अनिश्चितता के बारे में पूछ रहा हूं। लेकिन मुझे खुशी होगी अगर समाधान x के रूप में अच्छी तरह से अनिश्चितता पर विचार करेगा। आम तौर पर वे निरंतर नहीं होते हैं, लेकिन एक समाधान जो उन्हें निरंतर होने की आवश्यकता होती है वह ठीक भी होगा, मैंने रैखिकफिट, फिट, मैथेमेटिका और लिनेस्ट में फाइंडफिट के साथ फिटिंग की कोशिश की (और एक कस्टम फ़ंक्शन जिसे मैंने पाया कि अनिश्चितता से वजन बढ़ता है) एक्सेल।
शयनागार

क्या आप स्पष्ट रूप से बता सकते हैं कि "अनिश्चितता" मूल्यों का क्या संबंध होगा जो प्रयोग के दोहराने के तहत होता है? यानी क्या, ठीक है, इन अनिश्चितताओं का प्रतिनिधित्व करते हैं?
Glen_b -Reinstate Monica

उदाहरण के लिए अगर y वजन है, लेकिन डिजिटल स्केल केवल + -6 तक ही सही है। (इन मूल्यों के साथ सबसे अच्छा उदाहरण नहीं है, लेकिन उदाहरण के लिए जब पैमाने 255g से पता चलता है कि यह 255.0 या 255.9 हो सकता है)
bedanec

क्या आप बता सकते हैं कि कृपया मेरे प्रश्न के पहले वाक्य से कैसे संबंधित होंगे?
Glen_b -Reinstate Monica

जवाबों:


8

kny=kx+ny

y100(1α)(k,n)(kxi+nyi)2/σi2<χd,α2σiyid(x,y)χd,α2αd

yiyi(k,n)204(k2)2+72n(k2)+9n2=152.271

यहाँ छवि विवरण दर्ज करें


4

मैंने पायथन में इस सरल कोड के साथ एक भोली प्रत्यक्ष नमूना लिया:

import random
import numpy as np
import pylab
def uncreg(x, y, xu, yu, N=100000):
    out = np.zeros((N, 2))
    for n in xrange(N):
        tx = [s+random.uniform(-xu, xu) for s in x]
        ty = [s+random.uniform(-yu, yu) for s in y]
        a, b = np.linalg.lstsq(np.vstack([tx, np.ones(len(x))]).T, ty)[0]
        out[n, 0:2] = [a, b]
    return out
if __name__ == "__main__":
    P = uncreg(np.arange(0, 8.01), np.arange(0, 16.01, 2), 0.1, 6.)
    H, xedges, yedges = np.histogram2d(P[:, 0], P[:, 1], bins=(50, 50))
    pylab.imshow(H, interpolation='nearest', origin='low', aspect='auto',
                 extent=[xedges[0], xedges[-1], yedges[0], yedges[-1]])

और यह मिला: प्रत्यक्ष नमूने के परिणाम का हिस्टोग्राम

बेशक P, आप इच्छित डेटा के लिए मेरा उपयोग कर सकते हैं, या अनिश्चितता वितरण को बदल सकते हैं।


0

मैं पहले भी उसी शिकार पर था और मुझे लगता है कि यह शुरू करने के लिए एक उपयोगी जगह हो सकती है। एक्सेल मैक्रो फ़ंक्शन दोनों तालिकाओं में रैखिक बिंदुओं और उनकी अनिश्चितताओं को सारणीबद्ध बिंदुओं पर आधारित और प्रत्येक बिंदु के लिए अनिश्चितता देता है। हो सकता है कि कागज को देखें कि यह तय करने के लिए है कि आप इसे एक अलग वातावरण में लागू करना चाहते हैं, संशोधित करें, आदि ((गणित के लिए कुछ लेगवर्क किया गया है।) ऐसा लगता है कि सतह पर अच्छा वॉक-थ्रू डॉक्यूमेंटेशन है, लेकिन हेवन। टी ने मैक्रो को यह देखने के लिए खोला कि यह कितनी अच्छी तरह एनोटेट है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.