विभिन्न डेटा सेटों में एक ही मॉडल के प्रतिगमन गुणांक की तुलना करना


12

मैं दो (2) रेफ्रिजरेंट (गैसों) का मूल्यांकन कर रहा हूं जो एक ही प्रशीतन प्रणाली में उपयोग किए गए थे। मैंने मूल्यांकन के लिए सक्शन तापमान ( ), संघनक तापमान ( ), और एम्परेज ( ) डेटा को संतृप्त किया है। डेटा के दो (2) सेट हैं; पहला सर्द ( ) और दूसरा सर्द ( )। मैं एक रेखीय, बहुभिन्नरूपी ( एंड ) का उपयोग कर रहा हूं, प्रतिगमन विश्लेषण के लिए 3 क्रम बहुपद मॉडल। मैं यह निर्धारित करना चाहूंगा कि एक प्रतिशत के रूप में औसतन कितना कम / अधिक एम्परेज (या, एक प्रदर्शन तुलना के रूप में कुछ समान मीट्रिक), दूसरा सर्द द्वारा निकाला जा रहा है।SDYR1R2SD

मेरा पहला विचार था:

  1. उपयोग करने के लिए मॉडल निर्धारित करें:Y=b0+b1S+b2D+b3SD+b4S2+b5D2+b6S2D+b7D2S+b8D3+b9S3
  2. बेसलाइन डेटा ( ) से गुणांक ( )।biR1
  3. डेटा सेट में प्रत्येक & लिए, उन गुणांक का उपयोग करके , प्रत्येक अपेक्षित amp ड्रा ( ) की गणना करें और फिर औसत।SDR2Y^
  4. डेटा के वास्तविक औसत amp ड्रा ( ) के लिए औसत की तुलना करें ।Y^Y2R2
  5. percent (%) change=(Y2Y^)/Y^

हालाँकि, चूंकि दूसरे सर्द में थोड़ा अलग थर्मल गुण हैं और प्रशीतन प्रणाली (TXV और सुपरहिट समायोजन) में छोटे बदलाव किए गए थे, मेरा मानना ​​है कि यह 'आधारभूत तुलना विधि' सटीक नहीं है।

मेरा अगला विचार दो (2) अलग प्रतिगमन विश्लेषण करना था:

Y1=a0+a1S1+a2D1+a3S1D1+a4S12+a5D12+a6S12D1+a7D12S1+a8D13+a9S13Y2=b0+b1S2+b2D2+b3S2D2+b4S22+b5D22+b6S22D2+b7D22S2+b8D23+b9S23

और फिर, संतृप्त सक्शन टेम्प ( ) के लिए, गुणांक ( बनाम ) की तुलना करें: जैसे: Sa1b1

% change=b1a1a1

हालांकि, फिर से, इन गुणांक को अलग तरीके से वजन किया जाना चाहिए। इसलिए, परिणामों को तिरछा किया जाएगा।

मेरा मानना ​​है कि मैं यह निर्धारित करने के लिए एक z- परीक्षण का उपयोग कर सकता हूं कि गुणांक कितने भिन्न हैं, लेकिन मुझे यकीन नहीं है कि मैं पूरी तरह से आउटपुट का अर्थ समझता हूं: । लेकिन, यह अभी भी मुझे एक प्रदर्शन मीट्रिक नहीं देगा, जो कि समग्र उद्देश्य है।z=(a1b1)/SEa12+SEb12)


1
1. एक बहुपद मॉडल एक रैखिक मॉडल है, क्योंकि यह गुणांक में रैखिक है। 2. मैं आपके प्रश्न को समझने की कोशिश कर रहा हूं। यदि R1 और R2 के उपयोग के बीच प्रशीतन प्रणाली को संशोधित किया गया है, तो वे वास्तव में 'समान प्रशीतन प्रणाली' (पंक्ति 1) नहीं हैं, है ना? 3. यह आपके दूसरे दृष्टिकोण में क्यों है, आपने एस के गुणांक की तुलना करना शुरू कर दिया है? 4. क्या आपने बहुपद में फिट R1 और R2 के स्तर के साथ एक सहसंयोजक 'रेफ्रिजरेंट' को पेश करने पर विचार किया है (शायद बातचीत के बिना)? इसका गुणांक प्रश्न का उत्तर दे सकता है।
किओलेथ

@qoheleth 1. मुझे यकीन नहीं है कि मैं आपकी सोच का पालन करूंगा ... गुणांक हमेशा रैखिक है - यह एक संख्या है। कब गुणांक रैखिक नहीं होगा? 2. सही है, प्रशीतन प्रणाली को थोड़ा बदल दिया गया है, लेकिन केवल दोनों रेफ्रिजरेटर के लिए एक ही आउटपुट तापमान सुनिश्चित करने के लिए - "सेब के लिए सेब"। 3. 'एस' इस विशिष्ट तुलना के लिए ब्याज का एकमात्र चर है। 4. मैंने सहसंयोजक / अंतःक्रियात्मक चर विधि के बारे में पढ़ा है, लेकिन इस तरह की विधि का उपयोग करने वाले गुणांकों के अर्थ को समझने में विफल रहता है। क्या आप आउटपुट की व्याख्या करने के बारे में विस्तार से बता सकते हैं? धन्यवाद।
gth826a

1. सांख्यिकीय दृष्टिकोण से, जिन चीजों का आप अनुमान लगा रहे हैं उनमें रैखिकता है, जो गिनती है, इसलिए एक बहुपद मॉडल रैखिक है। एक गैर-रेखीय मॉडल का एक उदाहरण होगा मित्सरचलिच फ़ंक्शन y = अल्फ़ा (1-एक्सपी (बीटा-लैम्ब्डा * एक्स)), जहां अल्फा / बीटा / लैम्ब्डा हैं जो हम अनुमान लगा रहे हैं। 3. आप वास्तव में क्या परीक्षण करने की कोशिश कर रहे हैं? क्या यह S का गुणांक है? या Y? यदि यह S है, तो आपकी पहली कोशिश \ _ {Y} की तुलना में क्यों है?
काउहलेथ

Y- टोपी होगी: 1 डेटा सेट से प्राप्त गुणांक के साथ उपयोग किए जाने वाले 2 डेटा सेट से वास्तविक एस एंड डी। रेट्रोफ़िट / रिमॉडल / रिनोवेशन / आदि के बाद ऊर्जा की खपत के लिए पिछले उपकरण की ऊर्जा खपत की तुलना करते समय 'प्रदर्शन कॉन्ट्रैक्टिंग' ऊर्जा विश्लेषण के लिए यह विधि आम है। समीकरण यह होगा: ऊर्जा की खपत = y- हैट = बेसेलोएड + एनर्जी / डिग्री-डे * डिग्री-डे ... जहां एनर्जी / डिग्री-डे बेसलाइन रिग्रेशन एनालिसिस से प्राप्त कोएफ़ है, और डिग्री-डे रिनोवेशन से होता है । "आपने इस परियोजना के परिदृश्य को नहीं किया तो क्या खाया होगा" ...
gth826a

1
इसलिए ऐसा लगता है कि अंततः आप वाई की तुलना करना चाहते हैं। मैं कहूंगा कि गुणांक में% परिवर्तन की गणना के बारे में भूल जाओ, उच्च आदेश की शर्तों (एस ^ 2, एस ^ 3 आदि) की उपस्थिति में, गुणांक वे नहीं हैं जो आप सोचते हैं। वो हैं। Y पर ध्यान दें। मेरे लिए शेष प्रश्न स्पष्ट है, क्या आप कह रहे हैं कि R2 में S & D का अर्थ R1 में S & D के लिए अलग-अलग चीजें हैं? यदि नहीं, तो आप बस एक मॉडल को संयुक्त डेटासेट में फिट कर सकते हैं, जिसमें रेफ्रिजरेंट (आर 1 या आर 2) नामक एक अतिरिक्त कोवरिएट (एक्स चर) होता है, और अपने मॉडल को पर्याप्त मानते हुए, अनुमान लगाने के लिए इसके गुणांक को देखें।
किओलेथ

जवाबों:


2

यहाँ आदर्श गैस कानून से , , एक आनुपातिक मॉडल का सुझाव दे रहा है। सुनिश्चित करें कि आपकी इकाइयाँ पूर्ण तापमान में हैं। आनुपातिक परिणाम के लिए पूछना एक आनुपातिक त्रुटि मॉडल होगा। विचार करें, शायद , फिर एक से अधिक रैखिक प्रतिगमन के लिए कोई भी कर है Y, D, और S मान, ताकि यह तब , जहाँ सब्सक्राइब का अर्थ है "लघुगणक।" अब, यह आपके द्वारा उपयोग किए जा रहे रैखिक मॉडल की तुलना में बेहतर काम कर सकता है, और, उत्तर तो सापेक्ष त्रुटि प्रकार हैं।PV=nRTY=aDbScln(Y)=ln(a)+bln(D)+cln(S)Yl=al+bDl+cSll

यह सत्यापित करने के लिए कि किस प्रकार के मॉडल का उपयोग करने का प्रयास करें और जांचें कि अवशिष्ट होमोसिस्टैस्टिक हैं या नहीं। यदि वे नहीं हैं तो आपके पास एक पक्षपाती मॉडल है , तो कुछ और करें जैसे कि लघुगणक मॉडल, जैसा कि ऊपर या एक या एक से अधिक x या y डेटा, वर्गमूल, वर्ग, घातांक और अवशिष्ट के होमोसेक्सुअल होने तक प्राप्त होता है। यदि मॉडल होमोसैडैस्टिक अवशेषों का उत्पादन नहीं कर सकता है, तो जरूरत पड़ने पर सेंसरिंग के साथ कई लीनियर थाइल रिग्रेशन का उपयोग करें।

आमतौर पर डेटा को y अक्ष पर कैसे वितरित किया जाता है, इसकी आवश्यकता नहीं है, लेकिन, आउटलेरर्स और अक्सर प्रतिगमन पैरामीटर परिणामों को स्पष्ट रूप से विकृत कर सकते हैं। यदि समरूपता नहीं पाई जा सकती है, तो सामान्य कम से कम वर्गों का उपयोग नहीं किया जाना चाहिए और कुछ अन्य प्रकार के प्रतिगमन करने की आवश्यकता है, जैसे भारित प्रतिगमन, थिल प्रतिगमन, x में कम से कम वर्ग, प्रतिगमन और आगे। साथ ही, त्रुटियों को क्रमिक रूप से सहसंबद्ध नहीं होना चाहिए।

आउटपुट का अर्थ: , हो सकता है या नहीं हो सकता है। से मिलता जुलता। यह मानता है कि कुल भिन्नता दो स्वतंत्र भिन्नताओं का योग है। इसे दूसरे तरीके से रखने के लिए, प्लॉट पर स्वतंत्रता ऑर्थोगोनलिटी (लंबवत) है । यही है, कुल परिवर्तनशीलता (विचरण) तो पाइथागोरस प्रमेय, अनुसरण करती है , जो आपके डेटा के लिए हो सकती है या नहीं। अगर ऐसा है, तो -statistic एक रिश्तेदार दूरी, यानी, का अर्थ है (एक दूरी) के एक अंतर है, पाइथागोरस, उर्फ वेक्टर, मानक त्रुटि (एसई) है, जो मानक विचलन (SDS) कर रहे हैं के अलावा से विभाजित विभाजित है द्वाराz=(a1b1)/SEa12+SEb12)x,yH=+A2+O2zN, जहां एसई खुद दूरियां हैं। एक दूरी को दूसरे से विभाजित करना, फिर उन्हें सामान्य करता है, अर्थात, कुल (मानक) त्रुटि से विभाजित साधनों में अंतर, जो तब एक रूप में होता है ताकि एक संभावना खोजने के लिए एनडी (0,1) लागू कर सके।

अब, क्या होगा यदि उपाय स्वतंत्र नहीं हैं, और कोई भी इसके लिए कैसे परीक्षण कर सकता है? आपको ज्यामिति से याद हो सकता है कि त्रिकोण जो समकोण नहीं हैं, अपनी भुजाओं को रूप में जोड़ते हैं , यदि नहीं यहाँ अपनी याददाश्त ताज़ा करें । यही है, जब कुल्हाड़ियों के बीच 90 डिग्री के कोण के अलावा कुछ होता है, तो हमें यह शामिल करना होगा कि कुल दूरी की गणना में वह कोण क्या है। पहले याद रखें कि सहसंबंध क्या है, मानकीकृत सहसंयोजक। यह कुल दूरी और सहसंबंध बन जाता हैC2=A2+B22ABcos(θ),θ=(A,B)σTρA,BσT2=σA2+σB22σAσBρA,B। दूसरे शब्दों में, यदि आपके मानक विचलन सहसंबद्ध हैं (उदाहरण के लिए, जोड़ीदार), तो वे स्वतंत्र नहीं हैं।


"यह सत्यापित करने के लिए कि किस प्रकार के मॉडल का उपयोग करने का प्रयास करें और देखें कि क्या अवशेष होमोसिस्टैस्टिक हैं", हाँ, निश्चित रूप से ... सिवाय इसके कि आप इस धारणा को बिल्कुल भी नहीं बनाते हैं, और भले ही यह वैध हो - यह किसी भी तरह से सुनिश्चित नहीं करता है कि आपके पास एक "अच्छा" मॉडल है।
रेपमत

यदि कोई ओएलएस का उपयोग करता है और अवशिष्ट हेटरोसैडैस्टिक हैं, तो निश्चित रूप से एक पक्षपाती मॉडल है। Homoscedasticity एक OLS आवश्यकता है, यहाँ दिखाया गया है । एक अच्छे मॉडल के लिए अन्य स्थितियों की आवश्यकता होती है, जैसे कि छोड़े गए परिवर्तनीय पूर्वाग्रह से बचना , लेकिन सीरियल असंबद्ध त्रुटियां , और मॉडल बनाम निर्भर चर की रैखिकता।
कार्ल

आपके पास एक निष्पक्ष और / या सुसंगत मॉडल (अनुमान) हो सकता है, जहां अवशिष्ट हेटेरोसेक्लास्टिक होते हैं। इसका मतलब केवल यह होगा कि सामान्य निष्कर्ष प्रक्रियाएं काम नहीं करती हैं
रेपमत

विषमलैंगिकता ढलान को समतल करती है, भले ही एक बाहरी ने इसे ठीक किया हो, जुर्माना बड़े आत्मविश्वास अंतराल और एक घटिया मॉडल होगा। इस तरह के एक मॉडल का उपयोग नहीं करेगा, लेकिन, हां, एक घटिया मॉडल बना सकता है। चिकित्सा साहित्य उनमें भरा हुआ है।
कार्ल

आपकी टिप्पणी का पहला हिस्सा सिर्फ सादा गलत है। मुझे भी यकीन नहीं है कि इसका क्या मतलब है।
रेपमत
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.