EBCDIC कोड गोल्फ (जन्मदिन मुबारक हो, सिस्टम / 360!)


11

बहुत जल्द यह 50 साल होने जा रहा है क्योंकि आईबीएम ने अपने सिस्टम / 360 कंप्यूटर के परिवार का अनावरण किया । ये EBCDIC वर्ण सेट का उपयोग करने वाले पहले व्यक्ति थे ।

अवसर को चिह्नित करने के लिए, आइए देखें कि EBCDIC कोड पृष्ठ 037 से "साधारण" टेक्स्ट को परिवर्तित करने में सक्षम सबसे छोटा प्रोग्राम कौन लिख सकता है। हम विकिपीडिया से एक अनुवाद तालिका का उपयोग कर रहे हैं जो CP037 को ISO-8855-1 के सुपरसेट पर मैप करता है। :

EBCDIC037_to_Latin1 = [
    0x00,0x01,0x02,0x03,0x9c,0x09,0x86,0x7f,0x97,0x8d,0x8e,0x0b,0x0c,0x0d,0x0e,0x0f,
    0x10,0x11,0x12,0x13,0x9d,0x85,0x08,0x87,0x18,0x19,0x92,0x8f,0x1c,0x1d,0x1e,0x1f,
    0x80,0x81,0x82,0x83,0x84,0x0a,0x17,0x1b,0x88,0x89,0x8a,0x8b,0x8c,0x05,0x06,0x07,
    0x90,0x91,0x16,0x93,0x94,0x95,0x96,0x04,0x98,0x99,0x9a,0x9b,0x14,0x15,0x9e,0x1a,
    0x20,0xa0,0xe2,0xe4,0xe0,0xe1,0xe3,0xe5,0xe7,0xf1,0xa2,0x2e,0x3c,0x28,0x2b,0x7c,
    0x26,0xe9,0xea,0xeb,0xe8,0xed,0xee,0xef,0xec,0xdf,0x21,0x24,0x2a,0x29,0x3b,0xac,
    0x2d,0x2f,0xc2,0xc4,0xc0,0xc1,0xc3,0xc5,0xc7,0xd1,0xa6,0x2c,0x25,0x5f,0x3e,0x3f,
    0xf8,0xc9,0xca,0xcb,0xc8,0xcd,0xce,0xcf,0xcc,0x60,0x3a,0x23,0x40,0x27,0x3d,0x22,
    0xd8,0x61,0x62,0x63,0x64,0x65,0x66,0x67,0x68,0x69,0xab,0xbb,0xf0,0xfd,0xfe,0xb1,
    0xb0,0x6a,0x6b,0x6c,0x6d,0x6e,0x6f,0x70,0x71,0x72,0xaa,0xba,0xe6,0xb8,0xc6,0xa4,
    0xb5,0x7e,0x73,0x74,0x75,0x76,0x77,0x78,0x79,0x7a,0xa1,0xbf,0xd0,0xdd,0xde,0xae,
    0x5e,0xa3,0xa5,0xb7,0xa9,0xa7,0xb6,0xbc,0xbd,0xbe,0x5b,0x5d,0xaf,0xa8,0xb4,0xd7,
    0x7b,0x41,0x42,0x43,0x44,0x45,0x46,0x47,0x48,0x49,0xad,0xf4,0xf6,0xf2,0xf3,0xf5,
    0x7d,0x4a,0x4b,0x4c,0x4d,0x4e,0x4f,0x50,0x51,0x52,0xb9,0xfb,0xfc,0xf9,0xfa,0xff,
    0x5c,0xf7,0x53,0x54,0x55,0x56,0x57,0x58,0x59,0x5a,0xb2,0xd4,0xd6,0xd2,0xd3,0xd5,
    0x30,0x31,0x32,0x33,0x34,0x35,0x36,0x37,0x38,0x39,0xb3,0xdb,0xdc,0xd9,0xda,0x9f];

नियम:

  1. आपके प्रोग्राम को दो इनपुट लेने चाहिए: (ए) एक टेक्स्ट स्ट्रिंग, और (बी) एक फ्लैग जो ऑपरेशन करने का संकेत देता है।

  2. इस ध्वज के आधार पर, आपके प्रोग्राम को या तो टेक्स्ट के प्रत्येक बाइट को संबंधित EBCDIC वर्ण में बदलना चाहिए, या इसके विपरीत।

  3. इनपुट किसी भी समझदार स्रोतों (जैसे, कमांड लाइन तर्क, स्टड, कीबोर्ड इनपुट) से प्राप्त किया जा सकता है, लेकिन आपके प्रोग्राम में हार्ड-कोड नहीं होना चाहिए।

  4. आउटपुट को स्क्रीन पर प्रदर्शित किया जाना चाहिए (जैसे, stdout document.write) , या फ़ाइल / पाइपलाइन के लिए लिखा गया है।

  5. किसी भी अंतर्निहित या बाहरी एन्कोडिंग रूपांतरण कार्यों ( iconv, आदि) का उपयोग न करें ।

  6. यह एक चुनौती है, इसलिए सबसे छोटा उत्तर (सबसे कम बाइट्स) जीतेगा।

उदाहरण:

(नोट: ये उदाहरण UTF-8 एन्कोडिंग का उपयोग करने के लिए कॉन्फ़िगर किए गए टर्मिनल में निर्मित किए गए थे। सिस्टम कैसे कॉन्फ़िगर किया गया है, इसके आधार पर आप अलग-अलग परिणाम देख सकते हैं। हेक्स समतुल्य केवल संदर्भ के लिए दिखाए जाते हैं, और आपको अपने कोड द्वारा उत्पन्न नहीं करना पड़ता है। ।)

Input: "HELLO WORLD", convert to EBCDIC
Output: "ÈÅÓÓÖ@æÖÙÓÄ" (0xc8c5d3d3d640e6d6d9d3c4)

Input: "ÈÅÓÓÖ@æÖÙÓÄ", convert from EBCDIC
Output: "HELLO WORLD"

Input: "lower case mostly ends up as gremlins", convert to EBCDIC
Output "" <-- unprintable in utf-8
(0x9396a68599408381a285409496a2a393a840859584a240a4974081a24087998594938995a2)

# 5 उदाहरण के लिए मेरे पास एक बेस 64-एन्कोडेड स्ट्रिंग नहीं हो सकती है और s.decode('base64')मुझे अपना लुक-अप टेबल प्राप्त करना है?
क्लाउडीयू

"साधारण" पाठ क्या है? ASCII? UTF-8? एक देशी स्ट्रिंग प्रकार?
intx13

क्या हम नियंत्रण कोड भी परिवर्तित कर रहे हैं? या सिर्फ मुद्रण योग्य वर्ण? यदि हां, तो किन नियमों से?
intx13

@ intx13, अनुवाद तालिका प्रश्न में है।
पीटर टेलर

@ कलौइडु बिल्कुल ठीक होगा
r3mainer

जवाबों:


7

बैश + ट्रे, 240 बाइट्स

Hexdump

00000000  58 3d 27 9c 09 86 7f 97  8d 8e 0b 2d 13 9d 85 08  |X='........-....|
00000010  87 18 19 92 8f 1c 2d 1f  80 2d 84 0a 17 1b 88 2d  |......-..-.....-|
00000020  8c 05 06 07 90 91 16 93  2d 96 04 98 2d 9b 14 15  |........-...-...|
00000030  9e 1a 20 a0 e2 e4 e0 e1  e3 e5 e7 f1 a2 2e 3c 28  |.. ...........<(|
00000040  2b 7c 26 e9 ea eb e8 ed  ee ef ec df 21 24 2a 29  |+|&.........!$*)|
00000050  3b ac 5c 2d 2f c2 c4 c0  c1 c3 c5 c7 d1 a6 2c 25  |;.\-/.........,%|
00000060  5f 3e 3f f8 c9 ca cb c8  cd ce cf cc 60 3a 23 40  |_>?.........`:#@|
00000070  27 5c 27 27 3d 22 d8 61  2d 69 ab bb f0 fd fe b1  |'\''=".a-i......|
00000080  b0 6a 2d 72 aa ba e6 b8  c6 a4 b5 7e 73 2d 7a a1  |.j-r.......~s-z.|
00000090  bf d0 dd de ae 5e a3 a5  b7 a9 a7 b6 bc bd be 5b  |.....^.........[|
000000a0  5d af a8 b4 d7 7b 41 2d  49 ad f4 f6 f2 f3 f5 7d  |]....{A-I......}|
000000b0  4a 2d 52 b9 fb fc f9 fa  ff 5c 5c f7 53 2d 5a b2  |J-R......\\.S-Z.|
000000c0  d4 d6 d2 d3 d5 30 2d 39  b3 db dc d9 da 9f 27 3b  |.....0-9......';|
000000d0  5b 20 24 31 20 5d 26 26  74 72 20 04 2d ff 20 22  |[ $1 ]&&tr .-. "|
000000e0  24 58 22 7c 7c 74 72 20  22 24 58 22 20 04 2d ff  |$X"||tr "$X" .-.|

बल्कि तुच्छ समाधान। STDIN से पढ़ता है, STDOUT पर प्रिंट करता है।

कैसे इस्तेमाल करे

  • स्क्रिप्ट को बचाने और इसे निष्पादन योग्य बनाने के लिए, इन कमांडों को चलाएं:

    base64 -d <<< WD0nnAmGf5eNjgstE52FCIcYGZKPHC0fgC2EChcbiC2MBQYHkJEWky2WBJgtmxQVnhogoOLk4OHj5efxoi48KCt8Junq6+jt7u/s3yEkKik7rFwtL8LEwMHDxcfRpiwlXz4/+MnKy8jNzs/MYDojQCdcJyc9IthhLWmru/D9/rGwai1yqrrmuMaktX5zLXqhv9Dd3q5eo6W3qae2vL2+W12vqLTXe0EtSa309vLz9X1KLVK5+/z5+v9cXPdTLVqy1NbS09UwLTmz29zZ2p8nO1sgJDEgXSYmdHIgBC3/ICIkWCJ8fHRyICIkWCIgBC3/ > ebcdic.sh
    chmod +x ebcdic.sh
    
  • EBCDIC में बदलना (सांकेतिक शब्दों में बदलना), सादा कमांड निष्पादित करें:

    ./ebcdic.sh
    
  • EBCDIC (डिकोड) से परिवर्तित करने के लिए, कोई भी पहला तर्क निर्दिष्ट करें:

    ./ebcdic.sh -d
    

अच्छा विचार है, लेकिन मैं इसे डार्विन या डेबियन में काम नहीं कर सकता। आप इसे किस सिस्टम पर चला रहे हैं?
r3mainer

मैं एन्कोडिंग और डिकोडिंग मिलाया। मेरे पास वास्तव में पहले संस्करण में दिशा सही थी (जो लुकअप टेबल के व्युत्क्रम का उपयोग करती है), लेकिन मैं किसी तरह चर के आसपास दोहरे उद्धरण चिह्नों को हटाने में कामयाब रहा। फिक्स्ड।
डेनिस

अब काम कर रहे :-)
r3mainer
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.