मोर्स कोड एक उपसर्ग टर्नरी कोड (58 वर्णों के लिए) एक उपसर्ग द्विआधारी कोड के ऊपर तीन प्रतीकों को एन्कोड करता है।
स्वीकार किए जाने पर यह बहुत छोटा जवाब था । हालांकि, उपयोगकर्ताओं के बीच काफी गलतफहमी को देखते हुए, और ओपी से एक अनुरोध का पालन करते हुए, मैंने इसे बहुत लंबा जवाब लिखा। पहला "संक्षेप" खंड आपको इसका सार देता है।
अंतर्वस्तु
एक (बड़े) संक्षेप में
यह पूछने पर कि "क्या मोर्स कोड बाइनरी, टर्नरी या क्विनरी है?" जब तक कोई स्वीकार्य उत्तर के लिए कुछ मानदंड तय नहीं करता है, कोई तुलनात्मक उत्तर नहीं है। वास्तव में, उचित मानदंडों के बिना, कोई भी किसी भी प्रकार की संरचना के लिए स्पष्टीकरण को नियंत्रित कर सकता है। मेरे द्वारा चुने गए मापदंड निम्नलिखित हैं:
इसे दूसरी श्रेणी में डॉट / डैश प्रतिनिधित्व के साथ मोर्स-कोड के तीन-स्तरीय वर्णन को प्रतिबिंबित करना चाहिए;
यह कोड के सैद्धांतिक विश्लेषण के लिए विकसित की गई प्रस्तुति और गणितीय उपकरण फिट करना चाहिए, जितना संभव हो;
यह जितना संभव हो उतना सरल होना चाहिए;
यह स्पष्ट रूप से मोर्स कोड के गुणों को स्पष्ट करना चाहिए।
यह मनमाने ढंग से हैकिंग को रोकने का इरादा है, जो वैज्ञानिक रूप से अध्ययन के रूप में कोड सिद्धांत की बुनियादी अवधारणाओं को अनदेखा करता है, और जिसे व्यवस्थित विश्लेषण का भ्रम देकर कुछ अपील हो सकती है, हालांकि निर्णायक रूप से संबोधित करने के लिए अनौपचारिक रूप से संबोधित किया गया है। यह साइट कंप्यूटर विज्ञान के बारे में
है , न कि प्रोग्रामिंग के बारे में। हमें तकनीकी प्रश्न का उत्तर देने के लिए न्यूनतम स्थापित विज्ञान और स्वीकृत अवधारणाओं का उपयोग करना चाहिए।
मानक के एक त्वरित विश्लेषण से पता चलता है कि मोर्स कोड में उपयोग किए गए सभी प्रतीकों को अंततः बाइनरी में कोडित किया गया है , क्योंकि यह समान लंबाई की इकाइयों की एक स्ट्रिंग के रूप में प्रेषित होता है, एक संकेत के साथ जो प्रत्येक इकाई के लिए चालू या बंद हो सकता है। यह बताता है कि मोर्स संदेशों अंततः एक तार्किक वर्णमाला में कोडित रहे हैं ।Σ1={0,1}
लेकिन यह कोड की आंतरिक संरचना के बारे में कुछ नहीं कहता है। एनकोडेड होने की जानकारी 58 अक्षरों (मानक के अनुसार) के वर्णमाला पर एक स्ट्रिंग है जिसमें 57 वर्ण और एक स्पेस शामिल है। करने के लिए एक वर्णमाला यह मेल खाती
Σ3={A,B,…,Z,0,1,…,9,?,=,…,×,@,[]}, अंतिम सिंबल अंतरिक्ष है।
हालांकि, मानक निर्दिष्ट वहाँ एक मध्यवर्ती वर्णमाला है कि
, के आधार पर और और संभवतः अन्य प्रतीकों। यह काफी स्पष्ट हैΣ2dot
dash
कि में तार में तार के रूप में कोडित किया जा रहे हैं Σ * 2 , औरΣ∗3Σ∗2
में तार कि हैं में तार के रूप में कोडित किया जाना Σ * 1Σ∗2Σ*1
तो, यह देखते हुए के लिए कोई विकल्प नहीं है कि वहाँ और Σ 3 , प्रश्न के रूप में समझा जाना चाहिए: " प्रतीकों में से किस नंबर हम मध्यवर्ती वर्णमाला में विचार करना चाहिए Σ 2 इसलिए संरचना axplain सबसे अच्छा और पूरे मोर्स के गुणों के रूप में कोड, "जो तीन स्तरों के बीच दो एन्कोडिंग को निर्दिष्ट करने पर जोर देता है।Σ1Σ3Σ2
तथ्य यह है कि मोर्स कोड एक है यह देखते हुए उपसर्ग समरूप (चर लंबाई) कोड है कि precludes कोई अस्पष्टता है जब एक संकेत डिकोडिंग, हम बस यह आवश्यक गुण एक साथ व्याख्या कर सकते हैं त्रिगुट वर्णमाला
{ , , }, और दो कोडिंग स्कीम सीΣ2=dot
dash
sep
से Σ 3
करने के लिए Σ 2 , और सी 2 → 1 से Σ 2 के लिए Σ 1सी३ → २Σ3Σ2सी२ → १Σ2Σ1, जो दोनों होमोमोर्फिक और उपसर्ग हैं, इस प्रकार दोनों असंदिग्ध कोड हैं, और इस प्रकार 58 प्रतीकों के एक अस्पष्ट उपसर्ग एन्कोडिंग को द्विआधारी में देने के लिए रचना करने में सक्षम है।
इसलिए मोर्स कोड एक उपसर्ग त्रिगुट कोड वर्णमाला में व्यक्त से बना है , , } इन तीन प्रतीकों खुद को बाइनरी में इनकोडिंग के साथ, निम्नलिखित कूटशब्द के साथ:{ dot
dash
sep
}
dot
, → 1110 , और → 00→ 10dash
→ 1110sep
→ 00
ध्यान दें कि क्या लगातार के बीच की जगह के रूप में जाना जाता है dot
या dash
वास्तव में के प्रतिनिधित्व में शामिल किया गया है dot
और dash
के रूप में इस कोड के इस तरह के प्रकार, जो आमतौर पर स्रोत प्रतीकों से लक्ष्य प्रतीकों के साथ व्यक्त कूटशब्द को स्ट्रिंग homomorphisms के रूप में परिभाषित कर रहे हैं के लिए सामान्य गणितीय है, जैसा मैंने अभी किया।
यह मानक में दी गई कुछ प्रस्तुति से थोड़ा हटकर है, जिसका उद्देश्य उपयोगकर्ताओं के लिए सहज कोड को निर्दिष्ट करना है, बजाय इसके संरचनात्मक गुणों के विश्लेषण के। लेकिन एन्कोडिंग दोनों मामलों में समान है।
मानक के सटीक समय के बिना भी, एनालॉग सिग्नल का एक डिकोडर अभी भी इसे हमारे द्वारा सुझाए गए टर्नरी वर्णमाला में अनुवाद कर सकता है, ताकि टर्नरी कोड की उपरोक्त समझ अभी भी मान्य होगी।
कोड: मूल अंक
यह उत्तर मानक ITU-R M.1677-1 , दिनांकित 2009 (संदर्भ के लिए जेसन C के लिए धन्यवाद) पर आधारित है। मैं शब्दावली का उपयोग करेगा dot
और dash
की तुलना में, बल्कि dit
और dah
, के रूप में यह इस मानक द्वारा प्रयुक्त शब्दावली है।
इससे पहले कि हम मोर्स कोड पर चर्चा करना शुरू करें, हमें इस बात पर सहमत होना होगा कि एक कोड क्या है। इस प्रश्न पर कठिन चर्चाओं को स्पष्ट रूप से इसकी आवश्यकता है।
मौलिक रूप से, सूचना को प्रेषित या अन्यथा संसाधित करने के लिए प्रतिनिधित्व करने की आवश्यकता होती है। एक कोड एक प्रणाली है जो प्रतिनिधित्व की एक प्रणाली से दूसरे में सूचना का अनुवाद करने के लिए एक प्रणाली है । यह एक बहुत ही सामान्य परिभाषा है। हमें सावधान रहना चाहिए कि एक प्रतिनिधित्व की अवधारणा को भ्रमित न करें , और एक कोड से एक प्रतिनिधित्व ( स्रोत ) से दूसरे ( लक्ष्य ) को।
एक प्रतिनिधित्व कई रूप ले सकता है, जैसे कि चर विद्युत वोल्टेज, कागज पर रंगीन डॉट्स, पात्रों के स्ट्रिंग, अंक, 0 और 1 के बाइनरी स्ट्रिंग्स, आदि। यह एनालॉग और औपचारिक (या तार्किक, या अमूर्त) प्रतिनिधित्व के बीच अंतर करना महत्वपूर्ण है ।
एक एनालॉग / भौतिक प्रतिनिधित्व एक ड्राइंग, एक अलग वोल्टेज स्तर, एक आकृति (एक पत्र के लिए) है।
एक तार्किक / औपचारिक / अमूर्त प्रतिनिधित्व अमूर्त रेखांकन, प्रतीकों के तार, या अन्य गणितीय संस्थाओं के साथ एक गणितीय प्रतिनिधित्व है।
यद्यपि कुछ जानकारी मूल रूप से अनुरूप हो सकती है, हम आमतौर पर इसे एक तार्किक प्रतिनिधित्व में बदल देते हैं ताकि गणितीय साधनों या लोगों द्वारा इसके प्रसंस्करण को ठीक से परिभाषित किया जा सके।
इसके विपरीत, हम भौतिक उपकरणों, जैसे कंप्यूटर या ट्रांसमीटरों का उपयोग करके तार्किक प्रतिनिधित्व के साथ काम कर रहे हैं, हमें तार्किक प्रतिनिधित्व को एक अनुरूप रूप देने की आवश्यकता है।
इस विश्लेषण के उद्देश्य के लिए, केवल एक ही एनालॉग रूप जिसे हम मानते हैं, का उपयोग ट्रांसमिशन के लिए किया जाता है, जैसा कि मानक में वर्णित है। लेकिन फिर भी, हम इस बात पर विचार करेंगे कि पहला चरण इस एनालॉग प्रतिनिधित्व को एक समान रूप से संरचित तार्किक प्रतिनिधित्व के प्रत्यक्ष कार्यान्वयन के रूप में व्याख्या करना है, जिस पर हम अपने विश्लेषण का निर्माण करते हैं कि मोर्स कोड किस तरह का हो सकता है। कोड सिद्धांत तार्किक अभ्यावेदन के विश्लेषण के आधार पर ज्ञान का एक गणितीय निकाय है।
हालाँकि हम अंत में चर्चा में अनुरूप / तार्किक परिवर्तन पर वापस आएंगे।
कोड: परिभाषाएँ
हमारा तार्किक दृष्टिकोण यह है कि कोड का उपयोग किसी स्रोत वर्णमाला पर लक्षित वर्णमाला T पर स्रोत स्ट्रिंग का अनुवाद करने के लिए किया जाता है । यह अक्सर ऐसा होता है कि दोनों अक्षर समान होते हैं, आमतौर पर बाइनरी, जब उद्देश्य सूचना के प्रतिनिधित्व के लिए कुछ अतिरिक्त संपत्ति जोड़ना होता है, जैसे कि यह त्रुटियों (त्रुटि का पता लगाने और सुधार) के लिए अधिक प्रतिरोधी बनाता है, या प्रतिनिधित्व को छोटा करके अतिरेक (दोषरहित कोड संपीड़न) को हटाना और संभवतः कुछ जानकारी (हानिपूर्ण संपीड़न) के सावधानीपूर्वक नियंत्रित नुकसान के साथ।एसटी
हालांकि, मोर्स कोड का उद्देश्य एक बड़ी वर्णमाला पर तार का प्रतिनिधित्व करने का एक तरीका प्रदान करना है, एक बहुत छोटे वर्णमाला (वास्तव में बाइनरी) के आधार पर तार में, एक मध्यवर्ती वर्णमाला लगभग बाइनरी (डॉट्स और डैश) का उपयोग करके मानव के लिए बेहतर तरीके से उपयोग किया जाता है। धारणा और जोड़ तोड़ की क्षमता। इसे चर-लंबाई कोड कहा जाता है
:
एसटीसी: एस→ टी*एसटीसीएस*टी*
सी( s ) ∈ टी*s ∈ एस
सीएस*टी*टी*एस*
w
यह आसानी से दिखाया गया है कि अद्वितीय डिकोडिबिलिटी और प्रीफ़िक्स प्रॉपर्टी कोड की संरचना के तहत बंद हैं।
ध्यान दें कि एक समरूपता के रूप में परिभाषा का अर्थ है कि कोडवर्ड के बीच कोई विशेष अलगाव नहीं है। यह उनकी संरचना है, जैसे कि उपसर्ग संपत्ति, जो उन्हें स्पष्ट रूप से पहचानने की अनुमति देती है।
वास्तव में, अगर ऐसे अलगाव के प्रतीक थे, तो उन्हें लक्ष्य वर्णमाला का हिस्सा होना होगा, क्योंकि उन्हें लक्ष्य वर्णमाला से स्ट्रिंग को डिकोड करना आवश्यक होगा। तब विभाजक को पूर्ववर्ती कोड शब्द से जोड़कर चर-लंबाई कोड के सैद्धांतिक मॉडल पर वापस लौटना काफी सरल होगा। यदि वह प्रासंगिक कठिनाई (उदाहरण के लिए कई विभाजकों के लिए) बढ़ाने के लिए थे, तो यह केवल एक संकेत होगा कि कोड स्पष्ट से अधिक जटिल है। यह ऊपर वर्णित सैद्धांतिक मॉडल से चिपके रहने का एक अच्छा कारण है।
मोर्स कोड
मोर्स कोड मानक में तीन स्तरों पर वर्णित है:
३। यह 57 अक्षरों (27 अक्षर, 10 अंक, 20 सिंबल और पॉन्चुएशन) का उपयोग करते हुए प्राकृतिक भाषा पाठ का एक एन्कोडिंग प्रदान करने का इरादा है, और वर्ण स्ट्रिंग को शब्दों में काटने के लिए एक अंतर-शब्द स्थान है। इंटर-वर्ड स्पेस का उपयोग एक विशेष चरित्र की तरह किया जाता है, जिसे दूसरों के साथ मिलाया जा सकता है, जिसे मैं नोट करूंगा SEP
।
२। इन सभी पात्रों को उत्तराधिकार के रूप में कूटबद्ध किया जाना हैdash
और dot
, एक अंतर-पत्र अंतरिक्ष, जो मैं ध्यान दें जाएगा का उपयोग कर sep
, अलग करने के लिए dash
और dot
अगले पत्र के उन लोगों से एक पत्र के।
१। dash
और dot
, साथ हीsep
लंबाई ठीक कुछ स्वीकार किए जाते हैं इकाई के रूप में परिभाषित के साथ संकेत या संकेत (बुलाया रिक्ति) के अभाव के रूप में एन्कोड किया जाना है। विशेष रूप से, dash
और dot
एक पत्र एन्कोडिंग एक अंतर-तत्व अंतरिक्ष से अलग किया जाना चाहिए, कि मैं ध्यान दें जाएगा σ
।
यह पहले से ही कुछ निष्कर्षों के लिए कहता है।
संचरित और अनुरूप रूप में प्राप्त किया जाने वाला संदेश लंबाई इकाइयों का एक उत्तराधिकार है (अंतरिक्ष की लंबाई या समय की लंबाई) का , जैसे कि अनुलग्नक 1, भाग I, भाग में निर्दिष्ट प्रत्येक इकाई की पूरी अवधि के लिए एक संकेत बंद है। मानक के 2 :
2 Spacing and length of the signals
2.1 A dash is equal to three dots.
2.2 The space between the signals forming the same letter is equal to one dot.
2.3 The space between two letters is equal to three dots.
2.4 The space between two words is equal to seven dots.
यह स्पष्ट रूप से एक एनालॉग एन्कोडिंग है जिसे बिट स्ट्रीम के रूप में जाना जाता है, जिसे तार्किक रूप से 0
एन्स की एक स्ट्रिंग द्वारा बाइनरी नोटेशन में दर्शाया जा सकता है।1
एनालॉग ऑफ और ऑन के लिए खड़ा है ।
एनालॉग प्रतिनिधित्व से संबंधित मुद्दों को सार करने के लिए, हम इस प्रकार विचार कर सकते हैं कि मोर्स कोड संदेश बिट स्ट्रिंग्स के रूप में प्रेषित किए जाते हैं, जिन्हें हम 0
और के साथ नोट करेंगे 1
।
इसलिए मानक से उपरोक्त अंश को तार्किक रूप से व्यक्त किया जा सकता है:
- ०। ए
dot
द्वारा दर्शाया गया है 1
।
- १। ए
dash
द्वारा दर्शाया गया है 111
।
- २। एक अंतर-तत्व स्थान
σ
द्वारा दर्शाया गया है 0
।
- ३। एक अंतर-पत्र स्थान
sep
द्वारा दर्शाया गया है 000
।
- ४। एक अंतर-शब्द अंतरिक्ष
SEP
द्वारा दर्शाया गया है0000000
।
तो हम मोर्स कोड को इन 5 प्रतीकों को एनकोड करने के लिए बाइनरी में 5 कोड शब्दों का उपयोग करते हुए देख सकते हैं। इस तथ्य को छोड़कर कि यह काफी नहीं है कि प्रणाली का वर्णन कैसे किया जाता है, इसके लिए कुछ और है, और यह सबसे सुविधाजनक तरीका नहीं है जिसे एक भोले या गणितीय दृष्टिकोण से सोचा जा सकता है।
ध्यान दें कि यह विवरण आम आदमी के लिए है, न कि कोड सिद्धांत विशेषज्ञों के लिए। उस कारण से यह आंतरिक संरचना की तुलना में दृश्यमान उपस्थिति का वर्णन करता है जो इसे सही ठहराता है। कोड के गुणों पर जोर देने के लिए गणितीय रूप से अधिक संरचित, हालांकि इस एक के साथ संगत अन्य विवरणों को शामिल करने का कोई कारण नहीं है।
लेकिन पहले, हमें ध्यान देना चाहिए कि कोड के पूर्ण विवरण में प्रतिनिधित्व के 3 स्तर शामिल हैं, तुरंत पहचानने योग्य:
- ३। पाठ, सहित वर्णों की एक स्ट्रिंग से बना है
SEP
।
- २। एक स्ट्रिंग के रूप में एक अक्षर स्ट्रिंग की एन्कोडिंग
dot
, dash
औरsep
।
- १। इन तीनों के स्तर 2 स्ट्रिंग की एन्कोडिंग
symbols
बाइनरी स्ट्रिंग के रूप ।
हम संभवतः क्या प्रतीकों के रूप में चर्चा कर सकते हैं क्या में एन्कोड किया गया है, लेकिन यह यह प्रतिनिधित्व के इन तीन स्तर हैं कि मोर्स कोड का एक अनिवार्य पहलू है, शीर्ष पर पात्रों के साथ, dot
है और dash
बीच में es, और बिट्स0
और 1
निचले भाग में ।
इसका तात्पर्य है कि आवश्यक रूप से दो कोड हैं, एक स्तर 3 से स्तर 2 तक, और दूसरा स्तर 2 से स्तर 1 तक।
प्रतिनिधित्व के तीन स्तरों का विश्लेषण
इस 3-स्तरीय कोडिंग प्रणाली का लगातार विश्लेषण करने के लिए, हमें पहले यह विश्लेषण करना चाहिए कि प्रत्येक स्तर पर किस प्रकार की जानकारी प्रासंगिक है।
१। बिट स्ट्रिंग, परिभाषा के अनुसार, और इसके अनुरूप प्रतिनिधित्व की आवश्यकता से, केवल 0
और से बना है 1
।
३। पाठ के स्तर पर, हमें ५ the प्रतीकों और ५ the वर्णों की वर्णमाला और अंतर-शब्द स्थान की आवश्यकता है SEP
। सभी 58 को अंततः एक द्विआधारी एन्कोडिंग होना चाहिए। लेकिन, हालांकि मोर्स कोड मानक इन 57 + 1 वर्णों को निर्दिष्ट करता है, लेकिन यह निर्दिष्ट नहीं करता है कि उन्हें जानकारी को एन्कोड करने के लिए कैसे उपयोग किया जाना चाहिए। यह अंग्रेजी और अन्य प्राकृतिक भाषाओं की भूमिका है। मोर्स कोड 58 प्रतीकों की वर्णमाला के साथ अन्य प्रणाली प्रदान करता है, जिस पर वे कुछ 58-आर्य कोड बना सकते हैं, लेकिन मोर्स कोड स्वयं एक 58-आर्य कोड नहीं है।
२। पर dot
और dash
स्तर, हम सभी की जरूरत है क्रम में कोड करने के लिए 57 वर्ण इन दो प्रतीकों है, यानी की एक स्ट्रिंग के रूप में प्रत्येक के लिए एक codeword प्रदान dot
और dash
, एक साथ कुछ विभाजक के साथ sep
निशान के लिए जब एक पत्र तैयार कर लिया और एक और शुरू। हमें इंटर-वर्ड स्पेस को एन्कोडिंग करने के कुछ साधनों की भी आवश्यकता है SEP
। हम सीधे लेवल 1 पर इसके लिए प्रदान करने का प्रयास कर सकते हैं, लेकिन यह कोड के अन्यथा स्तरीय संरचित संगठन को गड़बड़ कर देगा।
वास्तव में, मानक के वर्णन की सही आलोचना की जा सकती है। लेकिन लेखकों ने सोचा हो सकता है कि उनकी प्रस्तुति औसत उपयोगकर्ता के लिए समझ में आसान होगी। इसके अलावा यह मोर्स कोड के पारंपरिक विवरण का अनुसरण करता है, जो इस तरह के गणितीय विश्लेषण से पहले होता है।
यह कई टिप्पणियों के लिए कहता है:
स्तर 3 पर, पत्र स्तर, अंतर-पत्र स्थान sep
अब सार्थक नहीं है। यह बिल्कुल सामान्य है, क्योंकि कागज पर दो लिखित वर्णों को अलग करने वाले स्थान की तुलना में अक्षरों के ब्रह्मांड में इसका अधिक अर्थ नहीं है। अक्षरों का प्रतिनिधित्व करने वाले कोडवर्ड को पहचानने के लिए स्तर 2 पर यह आवश्यक है, लेकिन यह सब है।
समान रूप से स्तर 2 पर, अंतर-तत्व स्थान σ
अब सार्थक नहीं है। यह की दुनिया में कोई मतलब नहीं है dot
और dash
है, लेकिन का प्रतिनिधित्व बाइनरी कोड शब्द पहचान करने के लिए स्तर 1 से केवल आवश्यक है dot
, dash
। लेकिन स्तर 1 पर, यह बिट से अलग नहीं है 0
।
इसलिए इंटर-एलिमेंट स्पेस σ
अब कुछ खास नहीं है। यह सिर्फ एक उपयोग है0
।
Σ*2→ Σ*1 चर लंबाई कोड ज्ञान का उपयोग कर विश्लेषण किया जा रहा है, विभाजक, कूटशब्द वे पालन में संलग्न हो जाना चाहिए ताकि के रूप में एक सरल स्ट्रिंग समरूपता के रूप में परिभाषित करने के लिए कोड।
dot
→10
dash
→1110
Σ2sep
000
0
dot
dash
00
sep
0
dot
dash
0
के रूप में मानक के लिए आवश्यक। यह हमेशा काम करता है क्योंकि दो अंतर-अक्षर विभाजक एक दूसरे के बाद होने के लिए मानक में कोई प्रावधान नहीं है।
Σ2=dot
dash
sep
सी२ → १: Σ2→ Σ*1
dot
→10
dash
→1110
sep
→00
और हमें यह जानकर आश्चर्य होता है कि कोई भी कोडवर्ड दूसरे का उपसर्ग नहीं है। इसलिए हमारे पास एक उपसर्ग कोड है, जो अस्पष्ट है और डिकोड करना आसान है।
सी३ → २: Σ3→ Σ*2
dot
dash
Σ3dot
dot
dash
dot
च
च→ dot
dot
dash
dot
sep
Σ3SEP
0000000
0
sep
0
dot
dash
SEP
0000
SEP
Σ*2sep
00
SEP
sep
sep
Σ3= { ए , बी , … , जेड, 0 , 1 , ... , 9 , ? , = , … , × , @ , SEP
}सी३ → २: Σ3→ Σ*2
सी३ → २
सीएमओ आर एस ई= सी२ → १∘ सी३ → २
इस प्रकार हम यह निष्कर्ष निकाल सकते हैं कि मोर्स कोड समझा जा सकता है और आसानी से विश्लेषण किया, एक उपसर्ग बाइनरी एक 3 प्रतीकों वर्णमाला {की एन्कोडिंग की संरचना के रूप में dot
, dash
, sep
} एक द्विआधारी वर्णमाला में, और एक उपसर्ग एक 58 प्रतीक वर्णमाला के एन्कोडिंग (57 वर्ण और एक अक्षर) 3 अक्षरों में।
रचना स्वयं 58 प्रतीकों का एक द्विआधारी प्रतिनिधित्व में एक उपसर्ग एन्कोडिंग है।
इस विश्लेषण पर टिप्पणी।
यह स्थापित करना हमेशा मुश्किल होता है कि एक संरचना की एक प्रस्तुति सबसे अच्छी है जो एक साथ आ सकती है। हालांकि ऐसा लगता है कि उपरोक्त विश्लेषण इस उत्तर की शुरुआत में निर्धारित मानदंडों को पूरा करता है: 3-स्तरीय परिभाषा के लिए निकटता, वर्तमान कोडिंग सिद्धांत, सादगी के अनुसार औपचारिक रूप से प्रस्तुत किया गया, और कोड के मुख्य गुणों का सबूत है।
ध्यान दें कि त्रुटि सुधार गुणों की तलाश में बहुत कम बिंदु हैं। मोर्स कोड एक एकल बिट त्रुटि का भी पता नहीं लगा सकता है क्योंकि यह केवल दो dot
को एक में बदल सकता है dash
। हालाँकि, यह केवल स्थानीय त्रुटियों का कारण बनता है।
संपीड़न के संबंध में, टर्नरी एन्कोडिंग को हफ़मैन कोडिंग के एक अनुमानित प्रकार में डॉट्स और डैश की संख्या को कम करने के लिए डिज़ाइन किया गया था । लेकिन दो रचित कोड आसानी से सघन किए जा सकते थे।
अक्षर के आकार के संबंध में, द्विआधारी और 58 प्रतीकों वर्णमाला के लिए कोई विकल्प नहीं है। मध्यवर्ती वर्णमाला में अधिक प्रतीक हो सकते हैं, लेकिन इसका उद्देश्य क्या होगा?
हालांकि, कुछ लोग DET
स्तर 2 पर स्थान को पहचानने के लिए इच्छुक होंगे , इस प्रकार वर्णमाला को चतुष्कोणीय बना देंगे , फिर सीधे स्तर 3 पर इसका उपयोग करते हुए, स्तर 2 में ही एन्कोड किया गया।
DET
0000
सी२ → १सीएमओ आर एस ई
वास्तव में, इस तरह के एक विकल्प द्विआधारी स्ट्रिंग 0000
अस्पष्ट, decodable SEP
या तो के रूप में होगा sep
sep
। अस्पष्टता को एक प्रासंगिक नियम के साथ हल करना होगा जो sep
स्वयं का पालन नहीं कर सकता है, जिससे औपचारिकता अधिक जटिल हो जाती है।
तार्किक परिवर्तन के अनुरूप के महत्व।
यह विश्लेषण इस तथ्य पर बहुत अधिक निर्भर करता है कि समान लंबाई की इकाइयों में ऑन / ऑफ सिग्नल का अपघटन स्पष्ट रूप से एक बाइनरी स्ट्रिंग के एनालॉग प्रतिनिधित्व को इंगित करता है। इसके अलावा, इकाइयों में लंबाई उपरोक्त विश्लेषण के लिए बिल्कुल सही है, जो लगता है कि संभावना से घटित हुआ है (हालांकि यह संभव है)।
हालाँकि, मूल पेटेंट 1647 में एक (बहुत अधिक सरसरी) से , ऐसा नहीं लगता है कि यह सटीक है, जैसे वाक्यों के साथ (पृष्ठ 2 के शीर्ष पर):
शब्दों या अंकों के एक वाक्य में उपयोग किए जाने पर एक विशिष्ट अंक या एक यौगिक संख्या का चिह्न, वर्णों को अलग करने में उपयोग की गई दूरी से अधिक दूरी के वर्णों के बीच पृथक्करण की दूरी या स्थान से युक्त होता है, जो ऐसे किसी भी विशिष्ट की रचना करता है या यौगिक संख्या।
जो लोग बाद में हाथ से भेज रहे थे या कान से प्राप्त कर रहे थे, वे भी सटीक होने की संभावना नहीं थी। दरअसल, उनकी मुट्ठी यानी उनकी टाइमिंग अक्सर पहचानने लायक होती थी। इस दृष्टिकोण का समर्थन इस तथ्य से भी किया जाता है कि लंबाई की दूरी हमेशा सम्मानित नहीं होती है , खासकर जब मोर्स कोड सीखते हैं।
ये स्थितियाँ लघु संकेत (डॉट), मध्यम संकेत (डैश), और लघु, मध्यम और लंबी विराम के रूप में कोड के अनुरूप दृश्य के अनुरूप होती हैं। तार्किक वर्णमाला में प्रत्यक्ष स्थानान्तरण स्वाभाविक रूप से एक क्विनल वर्णमाला देगा, जिसमें 58 प्रतीकों को कोडित किया जाना है। यह निश्चित रूप से मोर्स कोड की 3-स्तरीय प्रस्तुति नहीं है।
हालाँकि, समझ बनाने के लिए (और संभवतः अस्पष्टता से बचने के लिए), इस वर्णमाला का उपयोग बाधा के साथ किया जाना चाहिए कि दो सिग्नल प्रतीक ( dot
या dash
) एक दूसरे का अनुसरण नहीं कर सकते हैं, और यह कि प्रतीक एक दूसरे का अनुसरण नहीं कर सकते हैं। कोड का विश्लेषण और इसके गुणों को और अधिक जटिल बनाया जाएगा, और इसे सरल बनाने का प्राकृतिक तरीका वही होगा जो किया गया था: दो कोडों की संरचना में बदलने के लिए उचित समय का परिचय, ऊपर दिए गए काफी सरल विश्लेषण के लिए अग्रणी ( याद रखें कि इसमें कोड दिखाना उपसर्ग शामिल है)।
इसके अलावा, एनालॉग प्रतिनिधित्व में सटीक समय का पालन करना कड़ाई से आवश्यक नहीं है। चूंकि एनालॉग ट्रांसलेशन के डिकोडर शॉर्ट, मीडियम और लॉन्ग पॉज़ को अलग-अलग कर सकते हैं, जो भी हो, इसे बाइनरी केस में जो किया गया था, उसे सिर्फ नकल करना चाहिए। इसलिए लघु और मध्यम संकेत (आवश्यक रूप से एक विराम के बाद) को तार्किक dot
या के रूप में मान्यता दी जाती है dash
। के रूप में dot
या के अंत को चिह्नित करने के लिए सेवारत के रूप में लघु ठहराव भूल जाते हैं dash
। मध्यम ठहराव के रूप में पहचाने जाते हैं sep
, और लंबे ठहराव sep
उत्तराधिकार में दो के रूप में पहचाने जाते हैं । इसलिए एनालॉग सिग्नल को एक टर्नरी वर्णमाला में दर्शाया गया है, जिसका उपयोग 58 प्रतीकों वर्णमाला को एनकोड करने के लिए पहले किया जा सकता है। हमारे प्रारंभिक विश्लेषण का उपयोग तब भी किया जा सकता है जब समय का सख्ती से सम्मान नहीं किया जाता है।
वैकल्पिक रूप से, संकेत-ठहराव विकल्प का उपयोग इस क्वैश्चन वर्णमाला को एक टर्नरी में बदलने के लिए किया जा सकता है, केवल तीन अवधि को वर्णमाला के प्रतीकों के रूप में रखा जा सकता है, और यह निर्धारित करने के लिए संदर्भ विश्लेषण का उपयोग किया जाता है कि क्या एक दी गई अवधि संकेत या ठहराव है। लेकिन यह विश्लेषण करने के लिए फिर से थोड़ा जटिल है।
यह सिर्फ दिखाता है कि चीजों को देखने के कई तरीके हैं, लेकिन वे आवश्यक रूप से सुविधाजनक नहीं हैं, और सभी कोड कोड का विश्लेषण करने के लिए विकसित किए गए गणितीय उपकरणों के साथ विश्लेषण करने के लिए आसानी से खुद को उधार नहीं दे सकते हैं।
पेटेंट के अधिक संदर्भ इंटरनेट पर पाए जा सकते हैं।
निष्कर्ष
मानक के सटीक समय को देखते हुए, एक अच्छा जवाब मोर्स कोड पर विचार करना प्रतीत होता है क्योंकि इन तीनों प्रतीकों के एक द्विआधारी उपसर्ग एन्कोडिंग के साथ मिलकर एक 3 प्रतीकों वर्णमाला में, 58 वर्णों के एक टर्नरी उपसर्ग एन्कोडिंग की रचना है।
मानक के सटीक समय के बिना, बाइनरी स्तर पर विचार नहीं किया जा सकता है। तब तार्किक डिकोडिंग का एनालॉग स्वाभाविक रूप से dot
और
के मध्यवर्ती वर्णमाला के स्तर पर होता है dash
। हालांकि, लॉजिकल डिकोडर का एनालॉग पिछले 3 प्रतीकों वर्णमाला को डिकोड कर सकता है, इस प्रकार हमारे विश्लेषण की प्रयोज्यता को संरक्षित करता है।