मुझे अंगूठे का यह नियम पसंद है:
यदि आपको आंख को निर्देशित करने के लिए लाइन की आवश्यकता है (यानी एक प्रवृत्ति दिखाने के लिए कि बिना रेखा स्पष्ट रूप से दिखाई नहीं देगी), तो आपको लाइन नहीं डालनी चाहिए ।
मनुष्य पैटर्न को पहचानने में बहुत अच्छे हैं (हम ऐसी प्रवृत्तियों को देखने के पक्ष में हैं जो मौजूदा प्रवृत्ति को याद करने से नहीं हैं)। यदि हम बिना लाइन के रुझान प्राप्त करने में सक्षम नहीं हैं, तो हम इस बात के लिए सुनिश्चित हो सकते हैं कि कोई भी आंकड़ा डेटा सेट में निर्णायक रूप से नहीं दिखाया जा सकता है।
दूसरे ग्राफ के बारे में बात करते हुए, आपके मापन बिंदुओं की अनिश्चितता का एकमात्र संकेत C: O 1.2 के 700 ° C पर दो लाल वर्ग हैं। इन दोनों के प्रसार का मतलब है कि मैं उदाहरण के लिए स्वीकार नहीं करूंगा
- वहाँ C: O 1.2 के लिए एक प्रवृत्ति है
- कि 2.0 और 3.6 के बीच अंतर है
- और यह सुनिश्चित करने के लिए कि घुमावदार मॉडल डेटा से अधिक हैं।
बहुत अच्छे कारणों के बिना। हालांकि, फिर से एक मॉडल होगा।
संपादित करें: इवान की टिप्पणी का जवाब:
मैं रसायनज्ञ हूं और मैं कहूंगा कि त्रुटि के बिना कोई माप नहीं है - जो स्वीकार्य है वह प्रयोग और उपकरण पर निर्भर करेगा।
यह उत्तर प्रायोगिक त्रुटि दिखाने के खिलाफ नहीं है, लेकिन सभी इसे दिखाने और लेने के लिए है।
मेरे तर्क के पीछे विचार यह है कि ग्राफ़ बिल्कुल एक बार-बार माप दिखाता है, इसलिए जब चर्चा होती है कि एक मॉडल कितना जटिल होना चाहिए (यानी क्षैतिज रेखा, सीधी रेखा, द्विघात, ...) यह हमें माप का विचार दे सकता है त्रुटि। आपके मामले में, इसका मतलब है कि आप एक सार्थक द्विघात (तख़्ता) नहीं कर पाएंगे, भले ही आपके पास एक हार्ड मॉडल (जैसे थर्मोडायनामिक या काइनेटिक समीकरण) हो, यह सुझाव देता है कि यह द्विघात होना चाहिए - आपके पास केवल पर्याप्त डेटा नहीं है ।
इसे समझने के लिए:
df <-data.frame (T = c ( 700, 700, 800, 900, 700, 800, 900, 700, 800, 900),
C.to.O = factor (c ( 1.2, 1.2, 1.2, 1.2, 2 , 2 , 2 , 3.6, 3.6, 3.6)),
tar = c (21.5, 18.5, 19.5, 19, 15.5, 15 , 6 , 16.5, 9, 9))
यहाँ C: O अनुपात में से प्रत्येक के लिए अपने 95% विश्वास अंतराल के साथ एक रैखिक फिट है:
ggplot (df, aes (x = T, y = tar, col = C.to.O)) + geom_point () +
stat_smooth (method = "lm") +
facet_wrap (~C.to.O)
ध्यान दें कि उच्चतर C के लिए: O अनुपात में विश्वास अंतराल 0. से नीचे होता है। इसका मतलब है कि रैखिक मॉडल की अंतर्निहित धारणा गलत है। हालांकि, आप यह निष्कर्ष निकाल सकते हैं कि उच्च सी: ओ सामग्री के लिए रैखिक मॉडल पहले से ही ओवरफिट हैं।
तो, वापस कदम रखना और केवल एक स्थिर मूल्य (यानी कोई टी निर्भरता) फिटिंग:
ggplot (df, aes (x = T, y = tar, col = C.to.O)) + geom_point () +
stat_smooth (method = "lm", formula = y ~ 1) +
facet_wrap (~C.to.O)
पूरक सी: ओ पर निर्भरता मॉडल करने के लिए है:
ggplot (df, aes (x = T, y = tar)) + geom_point (aes (col = C.to.O)) +
stat_smooth (method = "lm", formula = y ~ x)
फिर भी, आत्मविश्वास अंतराल एक क्षैतिज या थोड़ी सी आरोही रेखाओं को भी कवर करेगा।
आप जा सकते हैं और कोशिश कर सकते हैं जैसे तीन सी: ओ अनुपात के लिए अलग-अलग ऑफसेट की अनुमति, लेकिन समान ढलान का उपयोग करना।
हालांकि, पहले से ही कुछ और माप स्थिति में काफी सुधार करेंगे - ध्यान दें कि C: O = 1: 1 के लिए आत्मविश्वास अंतराल कितना कम है, जहां आपके पास केवल 3 के बजाय 4 माप हैं।
निष्कर्ष: यदि आप मेरे बिंदुओं की तुलना करते हैं कि मैं किस निष्कर्ष पर संदेह करूंगा, तो वे कुछ उपलब्ध बिंदुओं में बहुत अधिक पढ़ रहे थे!