क्या दिन का घंटे एक श्रेणीगत चर है?


24

क्या "दिन का घंटा" जहां मान 0, 1, 2, ..., 23 हो सकता है एक श्रेणीगत चर है? मैं 5 के बाद से नहीं, कहने के लिए लुभाया जाएगा, उदाहरण के लिए, 4 या 6 के करीब '3' या 7 है।

दूसरी ओर, 23 और 0 के बीच का अंतर है।

तो क्या यह आमतौर पर श्रेणीबद्ध माना जाता है या नहीं? ध्यान दें कि 'घंटा' स्वतंत्र चर में से एक है, वह चर नहीं है जिसकी मैं भविष्यवाणी करने की कोशिश कर रहा हूं।


7
आप क्या खत्म करने की कोशिश कर रहे हैं? यदि आप एक मॉडल फिट कर रहे हैं, तो घंटे एक कोवरिएट या प्रतिक्रिया है, उदा?
गुंग - को पुनः स्थापित मोनिका

2
यदि आप के पास स्वतंत्रता की पर्याप्त डिग्री है (यानी श्रेणीबद्ध के रूप में माना जाता है), या यदि आपने कुछ नहीं किया है तो पहले कुछ फूरियर शब्दों का उपयोग करें। सामान्य तौर पर लगता है कि प्रतिक्रिया के साथ एक संभावित संबंध का सबसे अच्छा प्रतिनिधित्व कैसे करें - जब दुकानें खुली हों तो एक एकल डमी चर।
Scortchi - को पुनः स्थापित मोनिका

घंटे की तरह कुछ भी "श्रेणीबद्ध" या "संख्यात्मक" के रूप में इलाज किया जा सकता है जो सबसे अच्छा काम करता है पर निर्भर करता है। सामान्य रूप से सही या गलत उत्तर नहीं है - यह इस बात पर निर्भर करता है कि सबसे अच्छा क्या काम करता है। मैं अलग-अलग चीज़ों को आज़माने और आपकी स्थिति में सबसे अच्छा काम करने की सलाह देता हूँ।
गोल चक्कर

जवाबों:


29

आप जो मॉडल करना चाहते हैं, उसके आधार पर, घंटे (और कई अन्य विशेषताओं जैसे सीज़न) वास्तव में क्रमिक चक्रीय चर हैं। सीज़न के मामले में आप उन्हें कमोबेश श्रेणीबद्ध मान सकते हैं, और घंटों के मामले में आप उन्हें लगातार भी मॉडल कर सकते हैं।

हालांकि, अपने मॉडल में घंटों का उपयोग एक ऐसे रूप में किया जाता है जो आपके लिए चक्रीयता का ध्यान नहीं रखता है, फलदायी नहीं होगा। इसके बजाय किसी तरह के परिवर्तन के साथ आने की कोशिश करें। घंटों का उपयोग करके आप एक त्रिकोणमितीय दृष्टिकोण का उपयोग कर सकते हैं

xhr = sin(2*pi*hr/24)
yhr = cos(2*pi*hr/24)

इस प्रकार आप के बजाय प्रयोग करेंगे xhrऔर yhrमॉडलिंग के लिए। इस पोस्ट को उदाहरण के लिए देखें: रैखिक प्रतिगमन में परिपत्र भविष्यवाणियों का उपयोग


2
(+1) क्या आप मौसम और घंटों के बीच के अंतर पर विस्तार से बता सकते हैं?
Scortchi - को पुनः स्थापित मोनिका

हम्म, मुझे लगता है कि मौसम का सुबह, दोपहर और शाम के समान अर्थ होता है जब दिन के दौरान घंटों के बारे में बोलना होता है। Imho जब केवल अस्पष्ट जानकारी उपलब्ध होती है और संकल्प खराब होता है (जैसे मौसमों में 4 मान) उन्हें स्पष्ट और एन्कोडिंग के लिए डमी चर का उपयोग करना उचित लगता है। :-)
ड्रे नोव

1
मुझे लगता है कि प्रमुख बिंदु यह है, क्योंकि ट्रिगर का उपयोग करते हुए केवल 4 सीज़न हैं। एक स्पष्ट प्रतिनिधित्व की तुलना में आप स्वतंत्रता की केवल 1 डिग्री को छोड़ देते हैं - दिन के घंटों के साथ आप स्वतंत्रता के 21 डिग्री को छोड़ देते हैं। (और यदि आप उन्हें बचाने के लिए की जरूरत नहीं है, तो xhr = sin(4*pi*hr/24), yhr = cos(4*pi*hr/24), और इतने पर बात करने के लिए जोड़ा जा सकता है, ऊपर जहां पर्याप्त टिप्पणियों आप कर सकते हैं स्पष्ट रूप में दिन के रूप में अच्छी तरह इलाज घंटे के साथ।)
Scortchi - को पुनः स्थापित मोनिका


1

दिन का घंटा एक श्रेणीबद्ध चर के रूप में सबसे अच्छा प्रतिनिधित्व नहीं करता है, क्योंकि मूल्यों का एक प्राकृतिक क्रम है। बालों का रंग, उदाहरण के लिए, श्रेणीबद्ध है, क्योंकि श्रेणियों के क्रम का कोई अर्थ नहीं है - {लाल, भूरा, गोरा} {गोरा, भूरा, लाल} के रूप में मान्य है। दिन के घंटे, दूसरी ओर, एक प्राकृतिक आदेश है - 9am 10am या 8am के करीब है, जबकि यह 6pm है। यह एक असतत क्रमिक चर के रूप में सबसे अच्छा माना जाता है। इसमें चक्रीय होने की एक अतिरिक्त विशेषता है, क्योंकि दोपहर 12 बजे से दोपहर 11 बजे तक और दोपहर 1 बजे से पहले।


क्या कुछ श्रेणीबद्ध चर के मूल्यों के लिए एक प्राकृतिक आदेश नहीं है?
dsaxton

हां, लेकिन वे उस मामले में बेहतर के रूप में वर्णित हैं। साधारण चर श्रेणीबद्ध चर होते हैं जिनमें एक प्राकृतिक अनुक्रम होता है।
परमाणु वैंग

1
तो आप प्रतिगमन मॉडल में भविष्यवक्ता के रूप में असतत, क्रमबद्ध, चक्रीय चर का प्रतिनिधित्व कैसे करेंगे?
Scortchi - को पुनः स्थापित मोनिका

0

सैद्धांतिक रूप से, यह इस बात पर निर्भर करता है कि आप चर को कैसे स्वरूपित करते हैं अर्थात यह "निरंतर" (एकल गुणांक के साथ मॉडलिंग) या श्रेणीबद्ध (दिन के "घंटे" प्रति गुणांक) हो सकता है। तुम भी जैसे दोनों टुकड़ा वार कार्यों का एक मिश्रण कर सकता है।

व्यावहारिक रूप से, क्योंकि 0 और 23 अनिवार्य रूप से दिन के समान "घंटे" हैं, मैं दिन की अवधि को बड़े, अधिक समरूप और विश्वसनीय समूहों में समूहित करने पर विचार करूंगा। उदाहरण के लिए, 8 घंटे की वेतन वृद्धि में - 8 am-4pm, 4 pm-12am, और 12-8am।


4
0 और 23 अलग-अलग घंटे हैं। 0 और 24 एक ही घंटा होगा।
पॉल रिइनर्स

BTW, मैं प्रति दिन गोंग की टिप्पणी के अनुसार मान रहा हूं कि प्रति दिन एक स्वतंत्र चर है, न कि प्रतिरूपित चर। मेरा कहना यह है कि ० और २३ वास्तव में भिन्न नहीं है - क्या आप कहेंगे कि २३:०१ बनाम ०:०१ को होने वाली आपकी मॉडल घटना के बीच एक सांख्यिकीय अंतर है?
फ्रैंक एच।

1
सुनिश्चित नहीं है कि जानकारी फेंकने वाली समस्या को हल करना है या नहीं। देखें कि एक निरंतर भविष्य कहनेवाला चर को तोड़ने से क्या लाभ है?
Scortchi - को पुनः स्थापित मोनिका

@Scortchi - जैसा कि पोस्ट कहती है, आप एक निरंतर संबंध मान रहे हैं जैसे कि बिनिंग "जानकारी को फेंक देगा"। लेकिन अगर ऐसा नहीं है, तो बिनिंग अधिक उपयुक्त परिवर्तन है। और यह मानता है कि आपके पास शुरू करने के लिए पर्याप्त डेटा है, जिसका ओपी ने उल्लेख नहीं किया है।
फ्रैंक एच।

एक भविष्यवक्ता और प्रतिक्रिया के बीच के संबंध में बाधाओं का सामना करना अपने आप में एक बुरी बात नहीं है - जैसा कि आप इस पोस्ट में पहली बार लाए हैं, कितने अवलोकन उपलब्ध हैं यह एक महत्वपूर्ण विचार है - लेकिन इसके द्वारा लगाया गया दिन के घंटे का प्रतिनिधित्व - आठ से पंद्रहवें घंटे तक फ्लैट, सोलहवीं पर कूद या ड्रॉप के साथ, और इसी तरह - आमतौर पर उपयुक्त दृष्टिकोण के लिए एक अजीब सुझाव लगता है।
Scortchi - को पुनः स्थापित मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.