इस आदमी ने ट्विटर की 140-चरित्र की सीमा को कैसे हैक किया?


36

आज मुझे यह देखकर आश्चर्य हुआ कि एक आदमी ने ट्विटर की 140-चरित्र की सीमा को हैक कर लिया है। संदेश में 930 अक्षर हैं। यह कैसे संभव हो सकता है?

इस ट्वीट का सीधा लिंक यहां है । सुविधा के लिए, मैं नीचे पूर्ण ट्वीट के स्क्रीनशॉट की प्रतिलिपि बना रहा हूं:

यहाँ छवि विवरण दर्ज करें


1
यह एक शांत चाल है, लेकिन इसकी 140 चर की सीमा के लिए एक समाधान नहीं है। वास्तव में इसके बेहतर। क्योंकि लोग सभी बकवास लिखने के बजाय स्पष्ट रूप से बताएंगे कि उन्हें क्या बताने की आवश्यकता है। :)

1
तो दोस्तों, यह उपयोगी जानकारी हो सकती है, संदेश के केंद्र में रूसी में फ्रेज़ है: Твиттим и не ограничиваемся людиии !!!!!! 140 не предел! अंग्रेजी में कौन सी है: मर्यादा के बिना मरोड़ते रहो, लोग !!!!! 140 की सीमा नहीं है! मुझे लगता है कि कुछ रूसी "हैकर्स" हैं? :-)
श्रमिक

ऐसा लगता है कि ट्विटर ने उस बग को ठीक कर दिया है। ट्वीट का सीधा लिंक देखें।
महपर सी। पलुवज़लर 18:11

संक्षिप्त उत्तर: ट्वीट में 140 से कम अक्षर हैं; यह सिर्फ एक एन्कोडिंग समस्या है जो आपके ब्राउज़र को अधिक वर्णों के रूप में प्रदर्शित करने का कारण बन रही है ।
श्रीवत्सआर

ट्विटर द्वारा राज्यों के मुद्दे के नीचे एक टिप्पणी तय की गई है। आज मुझे एक और ट्वीट आया जो काफी हद तक समान है - twitter.com/#//ucucti/status/177524100930084864
चेतन एस।

जवाबों:


41

संदेश में यूनिकोड सरोगेट कोड अंक शामिल हैं जो अनुचित रूप से UTF-8 के रूप में एन्कोड किए गए हैं। इस तरह के अनुचित एन्कोडिंग को CESU-8 भी कहा जाता है । ऐसा प्रतीत होता है कि कुछ ट्विटर इंटरफेस सीईएसयू -8 एनकोडेड सरोगेट कोड पॉइंट्स को कैरेक्टर (140 कैरेक्टर लिमिट के उद्देश्य से) के रूप में स्वीकार करेंगे, लेकिन डिस्प्ले के उद्देश्य से यह यूटीएफ -8 के वैध होने की उम्मीद करते हैं और ये यूटीएफ -8 के वैध नहीं हैं। इसके बजाय यह इन दृश्यों में से प्रत्येक के 3 बाइट्स को प्रदर्शित करता है क्योंकि 3 सी-स्टाइल ऑक्टल एस्केप 4 वर्णों में से प्रत्येक का अनुक्रम है, और प्रत्येक सरोगेट कोड बिंदु 12 वर्णों का उपयोग करके प्रदर्शित किया जा रहा है।

उदाहरण के लिए \ 355 \ 240 \ 265 \ 355 \ 263 \ 220 जब सी-बच गए UTF-8 के रूप में डीकोड किया गया, बिना सरोगेट्स को अस्वीकार किए बिना सामान्य रूप से किया जाएगा, जब यूटीएफ -8 को डिकोड करते समय, सरोगेट जोड़ी U + D835 U + DCD0 को डिकोड किया जाता है। इस सरोगेट जोड़ी को UTF-16 के रूप में मानते हुए, जैसा कि CESU-8 को डिकोड करते समय किया जाएगा, यूनिकोड वर्ण U + 1D4D0 MATHEMATICAL BOLD SCRIPT CAPITAL A (𝓐) का निर्माण करता है।

यदि C- शैली के अष्टकोणीय भाग को डिकोड किया जाता है और फिर परिणाम को CESU-8 के रूप में व्याख्या किया जाता है, तो यह सामने आता है:

Т 𝓐𝓛𝓜𝓐𝓣𝓨 Твиттим и не ограничиваемся «юдиии !!!!!! 140 не предел (!)))) 𝓐𝓛𝓜𝓐𝓣𝓨 де де

यहां यह एक छवि के रूप में है, उन लोगों के लिए जिनके पास यूनिकोड फोंट का पूरा सेट स्थापित नहीं है:

Т 𝓐𝓛𝓜𝓐𝓣𝓨 Твиттим и не ограничиваемся «юдиии !!!!!!  140 не предел (!)))) 𝓐𝓛𝓜𝓐𝓣𝓨 де де


1
वास्तव में 101 अक्षर - अच्छी नौकरी @ mark4o
Jörg

3
ऐसा लगता है कि ट्विटर ने उस बग को ठीक कर दिया है। अब संदेश सिर्फ उसी छवि के रूप में दिखाई देता है जिसे आपने अपने उत्तर में पोस्ट किया था।
मेहपर सी। पलुवज़लर 18:11

मुझे अभी भी स्क्वायर बॉक्स, @ MehperC.Palavuzlar दिखाई देते हैं। क्या यह संभव है कि मेरे पास यूनिकोड चार्ट के पूर्ण सेट के साथ कोई फोंट स्थापित न हो?
Gaia

3

पात्रों का प्रत्येक समूह एक बैकस्लैश के साथ शुरू होता है और उसके बाद तीन नंबर " एस्केप सीक्वेंस " होता है। उनमें से प्रत्येक एक एकल चरित्र का प्रतिनिधित्व करता है। ये आमतौर पर उन अक्षरों के लिए उपयोग किए जाते हैं जो आपके कीबोर्ड पर मौजूद नहीं होते हैं जैसे कि गैर-अंग्रेजी-भाषा के अक्षर और प्रतीक।

मेरा अनुमान है कि पात्रों की गिनती करते समय, ट्विटर इनमें से प्रत्येक समूह को एक ही चरित्र के रूप में गिना रहा है, लेकिन जब उन्हें ब्राउज़र में प्रदर्शित किया जाता है तो यह उन्हें चार के रूप में मुद्रित कर रहा है।

अद्यतन करें:

भागने के कुछ सीक्वेंस उपलब्ध हैं "कंट्रोल कैरेक्टर"। ये कंप्यूटर को कुछ ऐसा करने के लिए कहते हैं जैसे अलर्ट साउंड बजाना या कर्सर को बाएँ या दाएँ या ऊपर या नीचे ले जाना या कर्सर के बाईं ओर के अक्षर को हटाना। हालाँकि उनमें से कोई भी नहीं है जिसका मैंने उल्लेख किया है (पिछले चरित्र को हटाते हुए), उसने शायद ट्विटर को भ्रमित करने के लिए उस चरित्र का उपयोग किया होगा।

दिलचस्प बात यह है कि जब यह सामान्य पात्रों में वापस आया, तो यह काफी दोहरावदार है और कुछ इस तरह दिखता है:

í µ í ³ í µ í ³ › í µ í ³ œ í µ í ³ í µ í ³ £ í µ í ³ ¨ í µ í ³ í µ í ³ › í µ í ³ œ í µ í ³ í µ í ³ £ í µ í ³ ¨ 

अपडेट 2:

उन्होंने जो स्पष्टीकरण दिया, वह था "Пишите в DM, всегда на связи)" जो Google Translate मुझे बताता है "डीएम को लिखें, हमेशा कनेक्शन पर)"। मुझे यकीन नहीं है कि इसका क्या मतलब है या यह कैसे मदद करता है।


1
मैंने इसके बारे में भी सोचा था (यह मेरे दिमाग में आने वाली सबसे उचित व्याख्या है), लेकिन समस्या यह है कि चार (140 * 4 = 560) के 140 से अधिक समूह हैं, जो 930 की गिनती से कम है जिसे मेफर ने कहा था )।
एलेक्स

@ एलेक्स: यह सही है। मैंने पूरे संदेश को एक नए ट्वीट बॉक्स में कॉपी और पेस्ट करने की कोशिश की, लेकिन ट्विटर का कहना है कि यह 140 से अधिक चार्ट है। मैंने TweetDeck में भी प्रयास किया लेकिन फिर से नहीं गया।
मेहपर सी। पलुवज़लर

अच्छी तरह से देखा गया। मैंने अपना उत्तर अपडेट कर दिया है, लेकिन मैं कोई भी सबूत नहीं देख सकता कि अपडेट वास्तव में क्या हुआ है।
लदादादा 15'15

2
@ मेपर आप इसे केवल एक ट्वीट बॉक्स में कॉपी नहीं कर सकते, क्योंकि तब ट्विटर इसे अलग-अलग वर्णों ('\', '3', '5', '5') आदि के रूप में व्याख्या करेगा। आपको एक स्क्रिप्ट बनानी होगी जो "प्रतीकों" को बाइट्स के रूप में भेजता है, पात्रों से बच नहीं।
Tor Valamo

"Пишите в DM, всегда на связи)" का अर्थ है कि वह आपको एक निजी संदेश भेजने के लिए आमंत्रित करता है, वह इसका तुरंत जवाब देगा। मेरा अनुवाद होगा: "डीएम भेजें, मैं हमेशा वहां हूं"।
मैल्कम
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.