लॉरी ओहरड का जवाब जंगली में देखे गए अधिकांश तारों के लिए अच्छी तरह से काम करता है, लेकिन अगर स्ट्रिंग में सरोगेट जोड़ी रेंज में 0 अक्षर, 0xD800 से 0xDFFF तक लोन वर्ण शामिल हैं, तो यह विफल हो जाएगा। उदाहरण के लिए
byteCount(String.fromCharCode(55555))
यह लंबा कार्य सभी तारों को संभालना चाहिए:
function bytes (str) {
var bytes=0, len=str.length, codePoint, next, i;
for (i=0; i < len; i++) {
codePoint = str.charCodeAt(i);
if (codePoint >= 0xD800 && codePoint < 0xE000) {
if (codePoint < 0xDC00 && i + 1 < len) {
next = str.charCodeAt(i + 1);
if (next >= 0xDC00 && next < 0xE000) {
bytes += 4;
i++;
continue;
}
}
}
bytes += (codePoint < 0x80 ? 1 : (codePoint < 0x800 ? 2 : 3));
}
return bytes;
}
उदाहरण के लिए
bytes(String.fromCharCode(55555))
यह सरोगेट जोड़े वाले तारों के आकार की सही गणना करेगा:
bytes(String.fromCharCode(55555, 57000))
परिणामों की तुलना नोड के अंतर्निहित फ़ंक्शन के साथ की जा सकती है Buffer.byteLength
:
Buffer.byteLength(String.fromCharCode(55555), 'utf8')
Buffer.byteLength(String.fromCharCode(55555, 57000), 'utf8')