एक स्ट्रिंग को उल्टा कैसे करें जिसमें जटिल इमोजीज हैं?

Question 1

इनपुट:

Hello world👩‍🦰👩‍👩‍👦‍👦

वांछित आउटपुट:

👩‍👩‍👦‍👦👩‍🦰dlrow olleH

मैंने कई तरीकों की कोशिश की लेकिन किसी ने भी मुझे सही जवाब नहीं दिया।

यह बुरी तरह से विफल रहा:

const text = 'Hello world👩‍🦰👩‍👩‍👦‍👦';

const reversed = text.split('').reverse().join('');

console.log(reversed);

स्निपेट का विस्तार करें

यह थोड़े काम करता है लेकिन यह 👩‍👩‍👦‍👦4 अलग-अलग इमोजी में टूट जाता है:

const text = 'Hello world👩‍🦰👩‍👩‍👦‍👦';

const reversed = [...text].reverse().join('');

console.log(reversed);

स्निपेट का विस्तार करें

मैंने इस सवाल का हर उत्तर देने की कोशिश की लेकिन उनमें से कोई भी काम नहीं करता है।

क्या वांछित आउटपुट प्राप्त करने का कोई तरीका है?

Question 2

यदि आप कर रहे हैं, उपयोग करने में सक्षम _.split()द्वारा प्रदान समारोह lodash । से 4.0 संस्करण के बाद से, _.split()बंटवारे यूनिकोड emojis में सक्षम है।

.reverse().join('')'वर्णों' को उलटने के लिए मूल का उपयोग करते हुए शून्य-चौड़ाई वाले योजकों वाले इमोजीस के साथ ठीक काम करना चाहिए

function reverse(txt) { return _.split(txt, '').reverse().join(''); }

const text = 'Hello world👩‍🦰👩‍👩‍👦‍👦';
console.log(reverse(text));

<script src="https://cdnjs.cloudflare.com/ajax/libs/lodash.js/4.17.20/lodash.min.js" integrity="sha512-90vH1Z83AJY9DmlWa8WkjkV79yfS2n2Oxhsi2dZbIv0nC4E6m5AbH8Nh156kkM7JePmqD6tcZsfad1ueoaovww==" crossorigin="anonymous"></script>

स्निपेट का विस्तार करें

Question 3

मैंने \u200dचरित्र का उपयोग करने के लिए टीकेओएल का विचार लिया और इसका उपयोग एक छोटी स्क्रिप्ट बनाने के प्रयास में किया।

नोट: सभी रचनाएं एक शून्य चौड़ाई योजक का उपयोग नहीं करती हैं, इसलिए यह अन्य रचना पात्रों के साथ छोटी गाड़ी होगी।

यह पारंपरिक forलूप का उपयोग करता है क्योंकि हम संयुक्त इमोटिकॉन्स खोजने के मामले में कुछ पुनरावृत्तियों को छोड़ देते हैं। forलूप के भीतर यह whileजांचने के लिए एक लूप है कि क्या कोई निम्न \u200dवर्ण है। जब तक एक है हम अगले 2 वर्णों को भी जोड़ते हैं और for2 पुनरावृत्तियों के साथ लूप को आगे बढ़ाते हैं ताकि संयुक्त इमोटिकॉन्स उलट न हों।

किसी भी स्ट्रिंग पर आसानी से उपयोग करने के लिए मैंने इसे स्ट्रिंग ऑब्जेक्ट पर एक नए प्रोटोटाइप फ़ंक्शन के रूप में बनाया।

String.prototype.reverse = function() {
  let textArray = [...this];
  let reverseString = "";

  for (let i = 0; i < textArray.length; i++) {
    let char = textArray[i];
    while (textArray[i + 1] === '\u200d') {
      char += textArray[i + 1] + textArray[i + 2];
      i = i + 2;
    }
    reverseString = char + reverseString;
  }
  return reverseString;
}

const text = "Hello world👩‍🦰👩‍👩‍👦‍👦";

console.log(text.reverse());

//Fun fact, you can chain them to double reverse :)
//console.log(text.reverse().reverse());

स्निपेट का विस्तार करें

Question 4

यूनिकोड पाठ को उलटना कई कारणों से मुश्किल है।

सबसे पहले, प्रोग्रामिंग भाषा के आधार पर, स्ट्रिंग्स को अलग-अलग तरीकों से दर्शाया जाता है, या तो बाइट्स की सूची के रूप में, UTF-16 कोड इकाइयों की एक सूची (16 बिट्स चौड़ी, जिसे अक्सर एपीआई में "वर्ण" कहा जाता है), या ucs4 कोड बिंदुओं के रूप में (4 बाइट्स चौड़ी)।

दूसरा, अलग-अलग एपीआई उस आंतरिक प्रतिनिधित्व को अलग-अलग डिग्री पर दर्शाते हैं। कुछ बाइट्स के अमूर्त पर काम करते हैं, कुछ UTF-16 वर्णों पर, कुछ कोड बिंदुओं पर। जब प्रतिनिधित्व बाइट्स या यूटीएफ -16 वर्णों का उपयोग करता है, तो आमतौर पर एपीआई के कुछ हिस्से होते हैं जो आपको इस प्रतिनिधित्व के तत्वों तक पहुंच प्रदान करते हैं, साथ ही साथ वे भाग जो बाइट्स (यूटीएफ -8 के माध्यम से) से प्राप्त करने के लिए आवश्यक तर्क करते हैं। वास्तविक कोड बिंदुओं के लिए UTF-16 वर्ण।

अक्सर, एपीआई के भाग उस तर्क का प्रदर्शन करते हैं और इस तरह आपको कोड बिंदुओं तक पहुंच प्रदान करते हैं, बाद में जोड़ा गया है, क्योंकि पहले 7 बिट एससीआई थी, फिर थोड़ा बाद में सभी ने सोचा कि 8 बिट्स पर्याप्त थे, विभिन्न कोड पेजों का उपयोग करते हुए, और यहां तक कि बाद में यूनिकोड के लिए 16 बिट्स पर्याप्त थे। एक निश्चित ऊपरी सीमा के बिना पूर्णांक संख्याओं के रूप में कोड बिंदुओं की धारणा ऐतिहासिक रूप से तार्किक रूप से एन्कोडिंग पाठ के लिए चौथी आम चरित्र लंबाई के रूप में जोड़ी गई थी।

एक एपीआई का उपयोग करना जो आपको वास्तविक कोड बिंदुओं तक पहुंच देता है, ऐसा लगता है कि यह ऐसा है। परंतु...

तीसरा, अगले कोड बिंदु या निम्नलिखित कोड बिंदुओं को प्रभावित करने वाले बहुत सारे संशोधक कोड बिंदु हैं। जैसे कि एक डियाक्रिटिक संशोधक निम्नलिखित है जो एक ä, e से ë, & c में बदल जाता है। कोड बिंदुओं को चारों ओर घुमाएं, और अलग-अलग अक्षरों से बना, और बन जाता है। उदाहरण के लिए अपने स्वयं के कोड बिंदु के रूप में ä का प्रत्यक्ष प्रतिनिधित्व है, लेकिन संशोधक का उपयोग करना उतना ही मान्य है।

चौथा, सब कुछ निरंतर प्रवाह में है। इमोजी के बीच बहुत सारे संशोधक भी हैं, जैसा कि उदाहरण में उपयोग किया जाता है, और हर साल अधिक जोड़े जाते हैं। इसलिए, यदि एक एपीआई आपको जानकारी देता है कि क्या कोड बिंदु एक संशोधक है, तो एपीआई का संस्करण यह निर्धारित करेगा कि क्या यह पहले से ही एक विशिष्ट नया संशोधक जानता है।

यूनिकोड एक हैकी ट्रिक प्रदान करता है, हालांकि, जब यह केवल दृश्य उपस्थिति के बारे में है:

लेखन दिशा-निर्देश हैं। उदाहरण के मामले में, बाएं से दाएं लेखन दिशा का उपयोग किया जाता है। बस टेक्स्ट की शुरुआत में राइट-टू-लेफ्ट राइटिंग डायरेक्शन मॉडिफ़ायर जोड़ें और एपीआई / ब्राउज़र के संस्करण के आधार पर, यह सही उलटा दिखेगा to

'\ u202e' को दाएं से बाएं ओवरराइड कहा जाता है, यह दाएं से बाएं मार्कर का सबसे मजबूत संस्करण है।

इस स्पष्टीकरण को w3.org द्वारा देखें

const text = 'Hello world👩‍🦰👩‍👩‍👦‍👦'
console.log('\u202e' + text)

const text = 'Hello world👩‍🦰👩‍👩‍👦‍👦'
let original = document.getElementById('original')
original.appendChild(document.createTextNode(text))
let result = document.getElementById('result')
result.appendChild(document.createTextNode('\u202e' + text))

body {
  font-family: sans-serif
}

<p id="original"></p>
<p id="result"></p>

स्निपेट का विस्तार करें

Question 5

मुझे पता है! मैं RegExp का उपयोग करूंगा। क्या गलत हो सकता था? (उत्तर पाठक के लिए एक अभ्यास के रूप में छोड़ दिया गया।)

const text = 'Hello world👩‍🦰👩‍👩‍👦‍👦';

const reversed = text.match(/.(\u200d.)*/gu).reverse().join('');

console.log(reversed);

स्निपेट का विस्तार करें

Question 6

वैकल्पिक समाधान runesपुस्तकालय, छोटे लेकिन प्रभावी समाधान का उपयोग करना होगा :

https://github.com/dotcypress/runes

const runes = require('runes')

// String.substring
'👨‍👨‍👧‍👧a'.substring(1) => '�‍👨‍👧‍👧a'

// Runes
runes.substr('👨‍👨‍👧‍👧a', 1) => 'a'

runes('12👩‍👩‍👦‍👦3🍕✓').reverse().join(); 
// results in: "✓🍕3👩‍👩‍👦‍👦21"

Question 7

आपको सिर्फ इमोजी से ही परेशानी नहीं है, बल्कि अन्य संयोजन पात्रों के साथ भी है। ये चीजें जो व्यक्तिगत पत्रों की तरह महसूस करती हैं, लेकिन वास्तव में एक या एक से अधिक यूनिकोड वर्ण हैं, जिन्हें "विस्तारित ग्रैफेम क्लस्टर" कहा जाता है।

इन समूहों में एक स्ट्रिंग को तोड़ना मुश्किल है (उदाहरण के लिए इन यूनिकोड डॉक्स को देखें )। मैं इसे स्वयं लागू करने पर भरोसा नहीं करूंगा लेकिन एक मौजूदा पुस्तकालय का उपयोग करूंगा। Google ने मुझे ग्रेपमे-स्प्लिटर लाइब्रेरी की ओर इशारा किया । इस लाइब्रेरी के डॉक्स में कुछ अच्छे उदाहरण हैं जो अधिकांश कार्यान्वयनों की यात्रा करेंगे:

इसका उपयोग करते हुए आपको लिखना चाहिए:

var splitter = new GraphemeSplitter();
var graphemes = splitter.splitGraphemes(string);
var reversed = graphemes.reverse().join('');

ASIDE: भविष्य के दर्शकों के लिए, या उन लोगों के लिए जो खून बह रहा किनारे पर रहना चाहते हैं:

वहाँ एक है प्रस्ताव जावास्क्रिप्ट मानक करने के लिए एक ग्रफीम segmenter जोड़ने के लिए। (यह वास्तव में अन्य सेगमेंटिंग विकल्प भी प्रदान करता है)। यह इस समय स्वीकृति के लिए चरण 3 की समीक्षा में है और वर्तमान में JSC और V8 ( https://github.com/tc39/proposal-intl-seacter/issues/114 देखें ) में लागू किया गया है ।

इस कोड का उपयोग करने की तरह दिखेगा:

var segmenter = new Intl.Segmenter("en", {granularity: "grapheme"})
var segment_iterator = segmenter.segment(string)
var graphemes = []
for (let {segment} of segment_iterator) {
    graphemes.push(segment)
}
var reversed = graphemes.reverse().join('');

अगर आप मुझसे ज्यादा आधुनिक जावास्क्रिप्ट जानते हैं तो आप शायद इसे बना सकते हैं ...

यहां एक कार्यान्वयन है - लेकिन मुझे नहीं पता कि इसकी क्या आवश्यकता है।

नोट: यह एक मजेदार मुद्दा है जो अन्य उत्तरों को अभी तक संबोधित नहीं किया गया है। सेगमेंटेशन उस लोकल पर निर्भर कर सकता है जिसका आप उपयोग कर रहे हैं - न कि केवल स्ट्रिंग में वर्ण।

Question 8

मैंने इसे मज़े के लिए करने का फैसला किया, एक अच्छी चुनौती थी। सुनिश्चित नहीं है कि यह सभी मामलों में सही है, इसलिए अपने जोखिम पर उपयोग करें, लेकिन यहां यह है:

function run() {
    const text = 'Hello world👩‍🦰👩‍👩‍👦‍👦';
    const newText = reverseText(text);
    console.log(newText);
}

function reverseText(text) {
    // first, create an array of characters
    let textArray = [...text];
    let lastCharConnector = false;
    textArray = textArray.reduce((acc, char, index) => {
        if (char.charCodeAt(0) === 8205) {
            const lastChar = acc[acc.length-1];
            if (Array.isArray(lastChar)) {
                lastChar.push(char);
            } else {
                acc[acc.length-1] = [lastChar, char];
            }
            lastCharConnector = true;
        } else if (lastCharConnector) {
            acc[acc.length-1].push(char);
            lastCharConnector = false;
        } else {
            acc.push(char);
            lastCharConnector = false;
        }
        return acc;
    }, []);
    
    console.log('initial text array', textArray);
    textArray = textArray.reverse();
    console.log('reversed text array', textArray);

    textArray = textArray.map((item) => {
        if (Array.isArray(item)) {
            return item.join('');
        } else {
            return item;
        }
    });

    return textArray.join('');
}

run();

स्निपेट का विस्तार करें

Question 9

आप उपयोग कर सकते हैं:

yourstring.split('').reverse().join('')

इसे अपनी स्ट्रिंग को सूची में बदलना चाहिए, इसे उल्टा करना चाहिए फिर इसे फिर से एक स्ट्रिंग बनाना चाहिए।

Question 10

const text = 'हैलो दुनिया👩👩👩👩 = = =👦;';

const उलट = text.split ('')। रिवर्स ()। join ('');

console.log (विपरीत);