बाइनरी और टेक्स्ट डेटा को अलग नहीं किया गया है: वे केवल डेटा हैं । यह उस व्याख्या पर निर्भर करता है जो उन्हें एक या दूसरे बनाती है। यदि आप किसी पाठ संपादक में बाइनरी डेटा (जैसे कि एक छवि फ़ाइल) खोलते हैं, तो इसका कोई मतलब नहीं होगा, क्योंकि यह आपकी चुनी हुई व्याख्या (पाठ के रूप में) में फिट नहीं बैठता है ।
जिसे आप पाठ कहते हैं , वह संभावित फ़ाइल सामग्री का एक सबसेट है: डेटा जो दिए गए वर्ण सेट में पठनीय वर्णों में बदल जाता है।
उदाहरण के लिए, ASCII में , आप देख सकते हैं कि, 128 "अनुमत" मानों में से केवल लगभग आधे अक्षर और संख्याएँ हैं, 30 विराम चिह्न हैं, और बाकी नियंत्रण वर्ण हैं । उत्तरार्द्ध समूह का उपयोग केवल पाठ फ़ाइलों में बहुत अधिक नहीं किया जाता है, और उनके पास वास्तव में कोई अच्छा पाठ प्रतिनिधित्व नहीं है। उनमें से कुछ टैब और न्यूलाइन वर्ण हैं, जहां पाठ संपादकों को पहले से ही उन्हें प्रदर्शित करने में रचनात्मक होने की आवश्यकता है।
कुछ पाठ संपादकों के पास व्हाट्सएप को स्पष्ट रूप से प्रदर्शित करने के विकल्प हैं। फिर वे वास्तव में अपने नियमित स्वरूपण व्यवहार (जो इन पात्रों की व्याख्या भी है ) के अलावा, पात्रों के रूप में तैयार किए जाएंगे ।
शुद्ध ASCII केवल 128 मानों की व्याख्या करता है। इस जानकारी को संग्रहीत करने के लिए उपयोग किए जाने वाले बाइट्स में प्रत्येक में 256 संभावित मान हैं, इसलिए संभव मानों में से आधे को ASCII में अनुमति नहीं है। जैसे कि क्षेत्र-विशिष्ट वर्ण सेटों में उपयोग किया जाता है, जैसे कि लैटिन 1, लेकिन ASCII में, वे अपरिभाषित हैं। उनके पास एक पाठ दर्शक में कोई उपयोगी प्रतिनिधित्व नहीं है जो केवल ASCII को संभाल सकता है।
बाइनरी डेटा को आमतौर पर टेक्स्ट के रूप में व्याख्या नहीं किया जाता है। तो इन फ़ाइलों में, सभी संभावित बाइट मान आमतौर पर पाए जाते हैं। बाकी सब बेकार होगा (और यह एक कारण है कि आप पाठ को बहुत अच्छी तरह से संकुचित कर सकते हैं)। छवि फ़ाइल प्रारूप जटिल हैं, और आप आमतौर पर उन्हें पाठ के रूप में नहीं देखते हैं, इसलिए उन्हें पठनीय होने की आवश्यकता नहीं है।
जैसा कि कोई सामान्य डेटा व्याख्या (वर्ण सेट) नहीं है, जो पठनीय वर्णों के लिए सभी संभावित मानों को मैप करता है, और चूंकि यह बहुत अधिक समझ में नहीं आएगा (जैसा कि यह पठनीय पाठ नहीं है), प्रमुख भागों को अस्पष्ट के रूप में प्रदर्शित किया जाता है।
एक हेक्स संपादक डेटा के लिए एक अलग प्रतिनिधित्व चुनता है: यह प्रत्येक बाइट को दो हेक्साडेसिमल अंकों के रूप में प्रदर्शित करता है । यह सिर्फ एक अलग प्रतिनिधित्व है, और एक आसानी से मानव-पठनीय चरित्र सेट के साथ: सभी 256 संभव बाइट मूल्यों को दो विषम अंकों के रूप में दर्शाया जा सकता है।
चूंकि हेक्स और इसके विपरीत (बाइनरी डेटा / एक हेक्साडेसिमल अंक से बाइनरी डेटा की एक आसान मैपिंग) है, और बाइनरी में प्रति अंक बहुत कम जानकारी शामिल है, हेक्साडेसिमल आम तौर पर बाइनरी को पढ़ने के लिए मनुष्यों के लिए पसंदीदा तरीका है, जब तक कि विशिष्ट न हों। भिन्न प्रतिनिधित्व को प्राथमिकता देने के कारण।
कुछ पाठ संपादकों में एक हेक्स संपादक मोड हो सकता है और कुछ अनुमानी यह निर्धारित करने की कोशिश करते हैं कि क्या फ़ाइल पाठ या द्विआधारी है, और स्वचालित रूप से एक मोड या दूसरे का चयन करें। लेकिन यह सही होना मुश्किल हो सकता है और यह फ़ाइल की एक विशिष्ट संपत्ति नहीं है जो कहती है कि यह एक तरह का है या दूसरा है।
कुछ एफ़टीपी ग्राहक आपको यह निर्दिष्ट करने के लिए कहते हैं कि टेक्स्ट डेटा के लिए कौन सी फ़ाइल अंत का उपयोग किया जाता है । ये प्रोग्राम तब आपके द्वारा कनेक्ट की गई मशीन के OS से मिलान करने के लिए फ़ाइल सामग्री को बदल देंगे, क्योंकि Windows CR/LF
लिनक्स और यूनिक्स (मैक ओएस एक्स सहित) की तुलना में एक अलग लाइन एंडिंग कैरेक्टर अनुक्रम ( ) का उपयोग करता है LF
।