ऑपरेटर का नाम क्या है जो एक श्रेणीगत वेक्टर लेता है और इसे एक-गर्म एन्कोडिंग का उपयोग करके द्विआधारी प्रतिनिधित्व में बदल देता है? मैं सोच रहा हूं कि मैं एक वैज्ञानिक पत्र लिख रहा हूं और उसके लिए एक उचित नाम की आवश्यकता है।
ऑपरेटर का नाम क्या है जो एक श्रेणीगत वेक्टर लेता है और इसे एक-गर्म एन्कोडिंग का उपयोग करके द्विआधारी प्रतिनिधित्व में बदल देता है? मैं सोच रहा हूं कि मैं एक वैज्ञानिक पत्र लिख रहा हूं और उसके लिए एक उचित नाम की आवश्यकता है।
जवाबों:
सांख्यिकीविद् डमी कोडिंग के रूप में एक-हॉट एन्कोडिंग कहते हैं । जैसा कि दूसरों ने सुझाव दिया ( टिप्पणियों में स्कॉर्टची सहित ), यह सटीक पर्याय नहीं है, लेकिन यह वह शब्द है जो आमतौर पर 0-1 एन्कोडेड श्रेणीबद्ध चर के लिए उपयोग किया जाएगा।
यह भी देखें: नाममात्र / श्रेणीबद्ध डेटा के लिए "डमी चर" बनाम "संकेतक चर"
यह आपके लक्षित दर्शकों पर निर्भर करता है।
जैसा कि टिम ने कहा, सांख्यिकीविद् इसे डमी कोडिंग कहते हैं, और यही मैं एक प्रतिगमन मॉडल की तरह कुछ का वर्णन करते समय देखने की उम्मीद करूंगा। "डमी कोडित चर को स्टोर के स्थान के लिए समायोजित करने के लिए शामिल किया गया था।" मुझे लगता है कि इसे वन-हॉट एन्कोडिंग कहना थोड़ा अजीब लगेगा।
हालांकि, जैसा कि एक अन्य टिम ने भी कहा, मशीन लर्निंग साहित्य में एक-गर्म एन्कोडिंग काफी आम है। यह स्पष्ट रूप से नोड्स (एक तंत्रिका नेटवर्क के रूप में), भौतिक तारों (एक उपकरण में), या ऐसा कुछ का अस्तित्व का अर्थ है, कम से कम मेरे लिए।
औपचारिक रूप से, मुझे लगता है कि आप संकेतक फ़ंक्शन का एक सेट लागू कर रहे हैं , लेकिन यह संभवतः एक प्रमाण के बाहर बहुत औपचारिक है।
यह शब्द इलेक्ट्रॉनिक्स इंजीनियरिंग से आया है। जरा सोचिए 1 "हॉट" किसे कहेंगे? केवल वे जो बिजली से काम करते हैं, जहां "गर्म" या "लाइव" का मतलब है कि तार पर विद्युत क्षमता है । "एक गर्म" सर्किट डिजाइन को संदर्भित करता है जहां तारों के एक सेट पर एक तार पर असतत विद्युत संकेत स्तर को डिकोड किया जाएगा। मुझे लगता है कि ईई पृष्ठभूमि वाले कुछ मशीन सीखने वाले लोगों को सादृश्य सम्मोहक मिला।
अर्थमिति और आंकड़ों में आपका सामना dummy
या indicator
परिवर्तन हो सकता है , जो काफी समान हैं क्योंकि इनका उपयोग उनके अलग-अलग संकेतकों के साथ अलग-अलग श्रेणियों का प्रतिनिधित्व करने के लिए किया जाता है। हालांकि एक सूक्ष्म अंतर है। उदाहरण के लिए, आप K श्रेणियों के लिए K-1 डमी बनाते हैं, क्योंकि बेस श्रेणी 0. से सेट सभी डमी से मेल खाती है, इसके विपरीत, मुझे लगता है कि एक गर्म एन्कोडिंग में आपके पास K तार हैं, जहां आधार श्रेणी का अपना तार होगा ( चर)।
मैं सांख्यिकीय रूप से प्रशिक्षित हूं, और हाल ही में मशीन लर्निंग / कंप्यूटर साइंस में "वन-हॉट एन्कोडिंग" के बारे में सुना है। मैंने आमतौर पर केवल एक-हेट मैट्रिक्स को एक डिज़ाइन मैट्रिक्स / डेटा मैट्रिक्स / डिज़ाइन फ़्रेम के रूप में संदर्भित किया है।
भौतिक विज्ञान और इंजीनियरिंग में, इसे (सामान्यीकृत) क्रोनकर डेल्टा कहा जाता है ।
सबसे सरल रूप में, क्रॉंकर डेल्टा को start start case के रूप में परिभाषित किया गया है। हालांकि यह सामान्य तौर पर सामान्य रूप से δ [ हालत ] ≡ { 1 अगर [ हालत ] 0 बाकी ।
तो, " " पढ़ने के लिए के रूप में करते हैं जो सबसे यदि लेखक संदर्भ से श्रेणी स्पष्ट है, तो लेखक " " को काट देगा ।δ मैं ∈ श्रेणी ≡ { 1 अगर मैं ∈ श्रेणी 0 बाकी , δ मैं
क्रोनकर डेल्टा सिग्मा / पाई / आइंस्टीन / आदि में वास्तव में उपयोगी है । क्योंकि यह शर्तों के लिए सशर्त रूप से निर्दिष्ट करने की अनुमति देता है।
बस आम प्रोग्रामिंग संरचनाओं को यह संबंधित, क्रोनेकर डेल्टा के condition?1:0
है, जहां ?:
है सशर्त ऑपरेटर ।
स्पर्शरेखा नोट के रूप में, मैं लेखकों को पुराने-फ़ैशन को सामान्यीकृत समकक्ष, पक्ष में छोड़ने के लिए प्रोत्साहित करूंगा । पुराने ढंग के नोटेशन का कोई फायदा नहीं है, जबकि सामान्यीकृत नोटेशन अधिक स्पष्ट और एक्स्टेंसिबल है।δ i = j