मैं यह सुझाव देना चाहूंगा कि ऊर्जा लागत का एक शारीरिक रूप से यथार्थवादी, व्यावहारिक रूप से उपयोगी मॉडल विकसित करना महत्वपूर्ण है । कच्चे डेटा के किसी भी दृश्य की तुलना में लागत में परिवर्तन का पता लगाने के लिए बेहतर काम करेगा। एसओ पर दिए गए समाधान के साथ इसकी तुलना करके , हमारे पास डेटा को वक्र करने और एक सार्थक सांख्यिकीय विश्लेषण करने के बीच अंतर में एक बहुत अच्छा मामला है ।
(यह सुझाव एक दशक पहले मेरे अपने घरेलू उपयोग के लिए इस तरह के एक मॉडल को फिट करने और उस अवधि के दौरान परिवर्तनों को ट्रैक करने के लिए लागू करने पर आधारित है। ध्यान दें कि एक बार मॉडल फिट होने के बाद, इसे आसानी से ट्रैकिंग के उद्देश्य से एक स्प्रेडशीट में गणना किया जा सकता है। परिवर्तन, इसलिए हमें स्प्रेडशीट सॉफ़्टवेयर की (इन) क्षमताओं द्वारा सीमित महसूस नहीं करना चाहिए।
इन आंकड़ों के लिए, इस तरह के एक भौतिक रूप से प्रशंसनीय मॉडल एक साधारण वैकल्पिक मॉडल (मासिक औसत तापमान के खिलाफ दैनिक उपयोग के लिए एक द्विघात न्यूनतम-वर्ग फिट) की तुलना में ऊर्जा लागत और उपयोग पैटर्न की एक बहुत अलग तस्वीर पैदा करता है । नतीजतन, सरल मॉडल को ऊर्जा उपयोग पैटर्न को समझने, भविष्यवाणी करने या तुलना करने के लिए एक विश्वसनीय उपकरण नहीं माना जा सकता है।
विश्लेषण
न्यूटन के शीतलन के नियम का कहना है कि, एक अच्छे सन्निकटन के लिए, हीटिंग की लागत (समय की एक इकाई के दौरान) बाहर के तापमान और अंदर के तापमान बीच के अंतर के सीधे आनुपातिक होनी चाहिए । उस आनुपातिकता की निरंतरता दें । यह भी ठंडा करने की लागत है कि तापमान के अंतर के लिए आनुपातिक होना चाहिए, एक ऐसी ही साथ - लेकिन जरूरी नहीं कि समान - अनुपातिकता का स्थिरांक । (इनमें से प्रत्येक को घर की इन्सुलेट क्षमता के साथ-साथ हीटिंग और कूलिंग सिस्टम की क्षमता से निर्धारित किया जाता है)।टीटी0- αβ
अनुमानित और (जो प्रति यूनिट समय प्रति किलोवाट (या डॉलर) प्रति डिग्री के रूप में व्यक्त किया जाता है) सबसे महत्वपूर्ण चीजों में से एक हैं, जो पूरा किया जा सकता है,αβ क्योंकि वे हमें भविष्य की लागतों की भविष्यवाणी करने में सक्षम करते हैं, साथ ही साथ क्षमता को मापते हैं घर और उसकी ऊर्जा प्रणाली।
क्योंकि ये डेटा कुल बिजली उपयोग हैं, उनमें प्रकाश, खाना पकाने, कंप्यूटिंग और मनोरंजन जैसे गैर-हीटिंग लागत शामिल हैं। ब्याज की भी इस औसत आधार ऊर्जा उपयोग (प्रति यूनिट समय) का एक अनुमान है , जिसे मैं कहूंगा : यह एक मंजिल प्रदान करता है कि कितनी ऊर्जा बचाई जा सकती है और भविष्य की लागतों के पूर्वानुमान को सक्षम बनाता है जब ज्ञात परिमाण के दक्षता में सुधार होता है। । (उदाहरण के लिए, चार साल के बाद मैंने एक भट्ठी को 30% अधिक कुशल होने का दावा किया है - और वास्तव में ऐसा ही था।)γ
अंत में, एक (सकल) सन्निकटन के रूप में मैं कि घर पूरे वर्ष में लगभग स्थिर तापमान पर बनाए रखा गया है । (मेरे व्यक्तिगत मॉडल में मैं दो तापमान , क्रमशः सर्दियों और गर्मियों के लिए - लेकिन इस उदाहरण में अभी तक पर्याप्त डेटा नहीं हैं कि दोनों का अनुमान लगा सकें और वे वैसे भी बहुत करीब होंगे।) मूल्य एक अलग अलग तापमान पर घर को बनाए रखने के परिणामों का मूल्यांकन करने में मदद करता है, जो एक महत्वपूर्ण ऊर्जा-बचत विकल्प है।टी0टी0≤टी1
डेटा एक विलक्षण रूप से महत्वपूर्ण और दिलचस्प जटिलता पेश करते हैं : वे पीरियड्स के दौरान कुल लागतों को दर्शाते हैं जब बाहर के तापमान में उतार-चढ़ाव होता है - और वे बहुत अधिक उतार-चढ़ाव करते हैं, आमतौर पर हर महीने उनकी वार्षिक सीमा का लगभग एक-चौथाई। जैसा कि हम देखेंगे, यह सही अंतर्निहित तात्कालिक मॉडल के बीच एक पर्याप्त अंतर बनाता है जिसे केवल वर्णित किया गया है और मासिक योग के मान हैं। प्रभाव विशेष रूप से बीच के महीनों में सुनाया जाता है, जहां दोनों (या न तो) हीटिंग और शीतलन लगते हैं। कोई भी मॉडल जो इस भिन्नता के लिए खाता नहीं है, गलती से "लगता है" ऊर्जा लागत किसी भी महीने में औसत तापमान के साथ बेस रेट पर होनी चाहिए , लेकिन वास्तविकता बहुत अलग है।γटी0
हम (आसानी से) उनकी सीमाओं के अलावा मासिक तापमान में उतार-चढ़ाव के बारे में विस्तृत जानकारी नहीं रखते हैं। मैं एक ऐसे दृष्टिकोण से निपटने का प्रस्ताव करता हूं जो व्यावहारिक है, लेकिन एक छोटा सा असंगत है। अत्यधिक तापमान को छोड़कर, प्रत्येक माह आमतौर पर तापमान में धीरे-धीरे वृद्धि या घट जाती है। इसका मतलब है कि हम वितरण को लगभग एकसमान बना सकते हैं। जब एक समान चर की श्रेणी में लंबाई , तो उस चर में का मानक विचलन होता है । मैं इस रिश्ते का उपयोग पर्वतमाला (से कन्वर्ट करने के लिए करने के लिए ) मानक विचलन है। लेकिन फिर, अनिवार्य रूप से एक अच्छी तरह से व्यवहार किए गए मॉडल को प्राप्त करने के लिए, मैं सामान्य उपयोग करके इन सीमाओं के अंत में भिन्नता को कम कर दूंगाएलs = L /6-√Avg. LowAvg. Highवितरण (इन अनुमानित एसडी और इसके द्वारा दिए गए साधनों के साथ Avg. Temp)।
अंत में, हमें डेटा को एक सामान्य इकाई समय पर मानकीकृत करना होगा। यद्यपि यह पहले से ही Daily kWh Avg.चर में मौजूद है , इसमें सटीकता की कमी है, इसलिए चलो खोई हुई सटीकता को वापस पाने के लिए दिनों की संख्या से कुल को विभाजित करें।
इस प्रकार, यूनिट-टाइम कूलिंग का मॉडल बाहरी तापमान पर हैYटी
y( t ) = γ+ α ( टी -टी0) मैं( टी <टी0) + β( टी -टी0) मैं( t >टी0) + Ε ( टी )
जहां सूचक कार्य कर और सब कुछ दर्शाता है अन्यथा इस मॉडल में स्पष्ट रूप से कब्जा नहीं किया गया है। यह अनुमान लगाने के लिए चार पैरामीटर हैं: , और । (यदि आप वास्तव में में निश्चित हैं, आप अनुमान लगाने के बजाय इसके मूल्य को ठीक कर सकते हैं।)मैंεα , β, γटी0टी0
जब तापमान समय साथ बदलता रहता है , तो से तक की अवधि के दौरान कुल लागत की रिपोर्ट की जाएगीएक्स0एक्स1टी ( एक्स )एक्स
Cost(x0,x1)=∫x1x0y(t)dt=∫x1x0(γ+α(t(x)−t0)I(t(x)<t0)+β(t(x)−t0)I(t(x)>t0)+ε(t(x)))t′(x)dx.
यदि मॉडल किसी भी तरह से अच्छा है, तो में उतार-चढ़ाव का औसत शून्य से करीब के बराबर होना चाहिए और यह महीने दर महीने अनियमित रूप से बदलता रहेगा। मा (मासिक औसत) और मानक विचलन (जैसा कि पहले मासिक सीमा से दिया गया है) और समाकलित पैदावार के सामान्य वितरण के साथ में उतार-चढ़ाव।ε(t)ε¯t(x)t¯s(t¯)
y¯(t¯)=γ+(β−α)s(t¯)2ϕs(t¯−t0)+(t¯−t0)(β+(α−β)Φs(t0−t¯))+ε¯(t¯).
इस सूत्र में, शून्य माध्य और मानक विचलन सामान्य रूप का संचयी वितरण है ; इसका घनत्व है।Φss(t¯)ϕ
मॉडल फिटिंग
यह मॉडल, हालांकि लागत और तापमान के बीच एक nonlinear संबंध व्यक्त करते हुए, फिर भी चर और में रैखिक है । हालाँकि, चूंकि यह में nonlinear है , और ज्ञात नहीं है, हमें एक nonlinear फिटिंग प्रक्रिया की आवश्यकता है। वर्णन करने के लिए, मैंने इसे एक संभावना मैक्सिमाइज़र ( अभिकलन के लिए उपयोग करते हुए) में डंप किया , यह मानते हुए कि औसत और सामान्य मानक विचलन या सामान्य वितरण के साथ स्वतंत्र और समान रूप से वितरित किए जाते हैं ।α,β,γt0t0Rε¯σ
इन आंकड़ों के लिए, अनुमान हैं
(α^,β^,γ^,t0^,σ^)=(−1.489,1.371,10.2,63.4,1.80).
इसका मतलब है की:
गर्मी की लागत लगभग kWh / दिन / डिग्री F है।1.49
ठंडा करने की लागत लगभग kWh / दिन / डिग्री एफ है। ठंडा करना थोड़ा अधिक कुशल है।1.37
आधार (गैर-हीटिंग / शीतलन) ऊर्जा का उपयोग kWh / दिन है। (यह संख्या काफी अनिश्चित है; अतिरिक्त डेटा इसे बेहतर ढंग से पिन करने में मदद करेगा।)10.2
घर का तापमान डिग्री F के पास बना हुआ है ।63.4
मॉडल में स्पष्ट रूप से हिसाब नहीं रखने वाली अन्य विविधताओं का मानक विचलन kWh / दिन है।1.80
आत्मविश्वास अंतराल और इन अनुमानों में अनिश्चितता के अन्य मात्रात्मक अभिव्यक्तियों को अधिकतम संभावना मशीनरी के साथ मानक तरीकों से प्राप्त किया जा सकता है।
दृश्य
इस मॉडल का वर्णन करने के लिए, निम्न आकृति डेटा, अंतर्निहित मॉडल, मासिक औसत के लिए फिट और एक साधारण न्यूनतम-वर्ग द्विघात फिट करती है।

मासिक डेटा को डार्क क्रॉस के रूप में दिखाया गया है। क्षैतिज धूसर रेखाएँ, जिन पर वे झूठ बोलते हैं, मासिक तापमान की सीमाएँ दिखाती हैं। न्यूटन के नियम को दर्शाता हमारा अंतर्निहित मॉडल, तापमान पर लाल और नीले रंग के लाइन सेगमेंट द्वारा दिखाया गया है । डेटा के लिए हमारा फिट होना कर्व नहीं है , क्योंकि यह तापमान रेंज पर निर्भर करता है। इसलिए इसे व्यक्तिगत ठोस नीले और लाल बिंदुओं के रूप में दिखाया गया है। (फिर भी, क्योंकि मासिक श्रेणियां बहुत भिन्न नहीं होती हैं, ये बिंदु एक वक्र का पता लगाने के लिए प्रतीत होते हैं - लगभग धराशायी द्विघात वक्र के समान।) अंत में, धराशायी वक्र द्विघात कम से कम वर्ग फिट (अंधेरे पार करने के लिए) है। )।t0
ध्यान दें कि फिट्स अंतर्निहित (तात्कालिक) मॉडल से कितना प्रस्थान करते हैं, खासकर मध्य तापमान में! यह मासिक औसत का प्रभाव है। (प्रत्येक क्षैतिज ग्रे सेगमेंट में लाल और नीले रंग की रेखाओं की ऊँचाई को "स्मियर" किया जाता है। चरम तापमान पर सब कुछ लाइनों पर केंद्रित होता है, लेकिन बीच के तापमान में "V" के दोनों किनारे एक साथ औसत हो जाते हैं, आवश्यकता को दर्शाते हैं। महीने में अन्य समय पर गर्म करने और अन्य समय पर ठंडा करने के लिए।)
मॉडल की तुलना
दो फिट - एक श्रमसाध्य रूप से यहां विकसित हुआ और सरल, आसान, द्विघात फिट - दोनों एक-दूसरे के साथ और डेटा बिंदुओं के साथ निकटता से सहमत हैं। द्विघात फिट काफी अच्छा के रूप में नहीं है, लेकिन यह अभी भी सभ्य है: अपने समायोजित मतलब अवशिष्ट (तीन के लिए पैरामीटर) है , जबकि समायोजित मतलब न्यूटन के कानून मॉडल (चार मापदंडों के लिए) का अवशिष्ट है, kWh / दिन kWh / दिन, लगभग 5% कम। यदि आप सभी डेटा बिंदुओं के माध्यम से एक वक्र बनाना चाहते हैं, तो द्विघात फिट की सादगी और सापेक्ष निष्ठा इसकी सिफारिश करेगी।2.071.97
हालांकि, द्विघात फिट पूरी तरह से सीखने के लिए बेकार है कि क्या चल रहा है! इसका सूत्र,
y¯(t¯)=219.95−6.241t¯+0.04879(t¯)2,
सीधे उपयोग के कुछ भी नहीं पता चलता है। सभी निष्पक्षता में, हम इसका थोड़ा विश्लेषण कर सकते हैं:
यह डिग्री F पर शीर्ष के साथ एक । हम इसे स्थिर घर के तापमान के अनुमान के रूप में ले सकते हैं। यह डिग्री के हमारे पहले अनुमान से काफी अलग नहीं है । हालांकि, इस तापमान पर अनुमानित लागत kWh / दिन है। यह न्यूटन के नियम के साथ आधार ऊर्जा उपयोग से दोगुना है ।t^0=6.241/(2×0.04879)=64.063.4219.95−6.241(63.4)+0.04879(63.4)2=20.4
हीटिंग या कूलिंग की सीमांत लागत व्युत्पन्न, के पूर्ण मूल्य से प्राप्त की जाती है । उदाहरण के लिए, इस सूत्र का उपयोग करके हम एक घर को गर्म करने की लागत का अनुमान लगाते हैं, जब बाहर का तापमान डिग्री से kWh / दिन / डिग्री F होता है। यह न्यूटन के अनुमानित मूल्य का दोगुना है। कानून ।y¯′(t¯)=−6.241+2(0.04879)t¯90−6.241+2(0.04879)(90)=2.54
इसी तरह, घर को डिग्री के बाहरी तापमान पर गर्म करने की लागत का अनुमान लगाया जाएगा। kWh / दिन / डिग्री F. यह न्यूटन के नियम के साथ अनुमानित मूल्य से दोगुने से अधिक है।32|−6.241+2(0.04879)(32)|=3.12
मध्य तापमान पर, द्विघात फिट दूसरी दिशा में गलती करता है। दरअसल, से डिग्री रेंज में इसके शीर्ष पर यह लगभग शून्य सीमांत हीटिंग या शीतलन लागत की भविष्यवाणी करता है , भले ही इस औसत तापमान में दिनों के रूप में ठंडा और डिग्री के रूप में गर्म हो । (इस पोस्ट को पढ़ने वाले कुछ लोग अभी भी डिग्री (= डिग्री C) पर अपनी गर्मी बंद कर देंगे !)606850785010
संक्षेप में, हालांकि यह दृश्य में लगभग उतना ही अच्छा लग रहा है , द्विघात फिट ऊर्जा के उपयोग से संबंधित मूल मात्रा में अनुमान लगाने में गलत है। उपयोग में परिवर्तन के मूल्यांकन के लिए इसका उपयोग इसलिए समस्याग्रस्त है और इसे हतोत्साहित किया जाना चाहिए।
गणना
इस Rकोड ने सभी कंप्यूटिंग और प्लॉटिंग का प्रदर्शन किया। यह आसानी से समान डेटासेट के लिए अनुकूलित किया जा सकता है।
#
# Read and process the raw data.
#
x <- read.csv("F:/temp/energy.csv")
x$Daily <- x$Usage / x$Length
x <- x[order(x$Temp), ]
#pairs(x)
#
# Fit a quadratic curve.
#
fit.quadratic <- lm(Daily ~ Temp+I(Temp^2), data=x)
# par(mfrow=c(2,2))
# plot(fit.quadratic)
# par(mfrow=c(1,1))
#
# Fit a simple but realistic heating-cooling model with maximum likelihood.
#
response <- function(theta, x, s) {
alpha <- theta[1]; beta <- theta[2]; gamma <- theta[3]; t.0 <- theta[4]
x <- x - t.0
gamma + (beta-alpha)*s^2*dnorm(x, 0, s) + x*(beta + (alpha-beta)*pnorm(-x, 0, s))
}
log.L <- function(theta, y, x, s) {
# theta = (alpha, beta, gamma, t.0, sigma)
# x = time
# s = estimated SD
# y = response
y.hat <- response(theta, x, s)
sigma <- theta[5]
sum((((y - y.hat) / sigma) ^2 + log(2 * pi * sigma^2))/2)
}
theta <- c(alpha=-1, beta=5/4, gamma=20, t.0=65, sigma=2) # Initial guess
x$Spread <- (x$Temp.high - x$Temp.low)/sqrt(6) # Uniform estimate
fit <- nlm(log.L, theta, y=x$Daily, x=x$Temp, x$Spread)
names(fit$estimate) <- names(theta)
#$
# Set up for plotting.
#
i.pad <- 10
plot(range(x$Temp)+c(-i.pad,i.pad), c(0, max(x$Daily)+20), type="n",
xlab="Temp", ylab="Cost, kWh/day",
main="Data, Model, and Fits")
#
# Plot the data.
#
l <- matrix(mapply(function(l,r,h) {c(l,h,r,h,NA,NA)},
x$Temp.low, x$Temp.high, x$Daily), 2)
lines(l[1,], l[2,], col="Gray")
points(x$Temp, x$Daily, type="p", pch=3)
#
# Draw the models.
#
x0 <- seq(min(x$Temp)-i.pad, max(x$Temp)+i.pad, length.out=401)
lines(x0, cbind(1, x0, x0^2) %*% coef(fit.quadratic), lwd=3, lty=3)
#curve(response(fit$estimate, x, 0), add=TRUE, lwd=2, lty=1)
t.0 <- fit$estimate["t.0"]
alpha <- fit$estimate["alpha"]
beta <- fit$estimate["beta"]
gamma <- fit$estimate["gamma"]
cool <- "#1020c0"; heat <- "#c02010"
lines(c(t.0, 0), gamma + c(0, -alpha*t.0), lwd=2, lty=1, col=cool)
lines(c(t.0, 100), gamma + c(0, beta*(100-t.0)), lwd=2, lty=1, col=heat)
#
# Display the fit.
#
pred <- response(fit$estimate, x$Temp, x$Spread)
points(x$Temp, pred, pch=16, cex=1, col=ifelse(x$Temp < t.0, cool, heat))
#lines(lowess(x$Temp, pred, f=1/4))
#
# Estimate the residual standard deviations.
#
residuals <- x$Daily - pred
sqrt(sum(residuals^2) / (length(residuals) - 4))
sqrt(sum(resid(fit.quadratic)^2) / (length(residuals) - 3))