क्या GNU सेड (विंडोज के लिए) यूनिकोड को संभाल सकता है? यदि हां, तो क्या यह कोड-पेज / लोकल इश्यू है, या स्विच है?


10

मैं ग्नू SED का उपयोग अब कुछ वर्षों से कर रहा हूँ। यह मुझे कभी-कभी थोड़ा बाहर निकालता है, लेकिन यह एक अच्छा काम करता है ... सिंगल-बाइट चार सेट के लिए!
मैं अब और फिर जीएनयू एसईडी को यूनिकोड-जागरूक होने के संदर्भ में नोटिस करता हूं, लेकिन मैंने जो सबसे अधिक देखा है वह इसका "बाइनरी" मोड है .. और बाइनरी यूनिकोड नहीं है।
क्या जीएसईडी कोडकोड रिज़ॉल्यूशन पर एक यूनिकोड पाठ फ़ाइल को संसाधित कर सकता है, जिसमें शामिल है और विशेष रूप से \ r \ n (विंडोज़) ... और यदि यह कर सकता है, तो क्या यह यूटीएफ -8, यूटीएफ -16, या क्या उम्मीद करता है? और SED एन्कोडिंग का पता कैसे लगाता है?


1
आमतौर पर यूनिकोड को \ uXXXX विकल्प के साथ निर्दिष्ट किया जाता है। इस जापान के आदमी के संकलन आकाश
मिखाइल

जवाबों:


1

मुझे sed के बारे में एक टन नहीं पता है, लेकिन कुछ कठिन Googling के बाद यह LANG पर्यावरण चर के माध्यम से विभिन्न प्रकार के कोड पृष्ठों के लिए समर्थन लगता है। मेरा मानना ​​है कि UTF-8 वास्तव में LANG की अनुपस्थिति में डिफ़ॉल्ट है। मुझे नहीं पता कि विंडोज पोर्ट की स्थापना कैसे की जाती है। मेरे पास एक मजबूत संदेह है कि sed इनपुट स्ट्रीम पर कोई भी डिटेक्शन प्रोसेसिंग नहीं करता है।

स्रोत: /programming/67410/why-does-sed-fail-with-international-characters-and-how-to-fix http://omgili.com/mailinglist/cygwin/cygwin/com /20100520123926GA1432onderneming10xs4allnl.html

आप यहां बताए अनुसार भागने वाले पात्रों को भी आज़मा सकते हैं: http://forums.whirlpool.net.au/forum-replies-archive.cfm/841095.html जो कि बहुत बोझिल लगता है।


@ मैथ्यू: धन्यवाद। ऐसा लगने लगा है कि यह समस्या SED.exe के साथ झूठ नहीं हो सकती है, लेकिन जिस तरह से विंडोज अपने cmd.exe कंसोल में कोड-पेज को बहुत अच्छी तरह से हैंडल नहीं करता है। शायद यह इसके पॉवरशेल में काम करता है, लेकिन अगर मुझे वहां जाना है, तो मैं इसके बजाय अजगर पर ध्यान केंद्रित करूंगा। जहाँ तक मैं देख सकता हूँ, विंडोज का अपना गौरव और आनंद, UTF-16 (कोड-पेज 1200, msdn.microsoft.com/en-us/library/dd317756%28VS.85%29.aspx ) केवल प्रबंधित अनुप्रयोगों के लिए उपलब्ध है , जो कुछ भी मतलब है, लेकिन यह निश्चित रूप से कंसोल में काम नहीं करता है .. UTF-8 और वापस में कनवर्ट करें? बिल्कुल नहीं! अजगर यहाँ मैं आता हूँ। (या 'निक्स और बैश)
पीटर।

मुझे अच्छा लगता है। मैं उलझन में हूँ कि cmd.exe समस्या कैसे पैदा कर रहा है और पायथन इसे कैसे हल करता है (पायथन के प्रसिद्ध जादू शक्तियों के अलावा ) ( xkcd.com/353 ), लेकिन मैं योनि को समझने का नाटक नहीं कर रहा हूँ cmd.exe की। आप सौभाग्यशाली हों!
वेनेसा फिप्स

@fred: पढ़ें: .NET।
हैलो'१

2
मैंने समस्या हल कर ली है ... मैंने एमएस को लगभग 6 महीने पहले पूरी तरह से गिरा दिया है, और अब उबंटू का उपयोग करता हूं .. यह रेशम की तरह चिकनी है ... (और मैं पीछे नहीं देख रहा हूं ...
पीटरो
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.