मैंने इस पोस्ट पर कुछ उत्तर देखे और आधार ज्ञान को पूरा करना संभव माना, क्योंकि इसी समस्या को हल करने के लिए C # प्रोग्रामिंग में कई दृष्टिकोण हैं। केवल एक चीज जिस पर विचार किया जाना आवश्यक है, वह है BOM के साथ शुद्ध UTF-8 और UTF-8 के बीच अंतर ।
पिछले सप्ताह में, मेरी नौकरी पर, मुझे एक कार्यक्षमता विकसित करनी होगी जो CSV फ़ाइलों को BOM के साथ और अन्य CSV को शुद्ध UTF-8 (BOM के बिना) के साथ आउटपुट करती है, प्रत्येक CSV फ़ाइल एन्कोडिंग प्रकार को अलग-अलग गैर-मानक API API द्वारा खपाया जाएगा। एपीआई ने बीओएम के साथ यूटीएफ -8 पढ़ा और दूसरा एपीआई बिना बीओएम के पढ़ा। मुझे इस अवधारणा के संदर्भों पर शोध करने की ज़रूरत है, " मेरा दृष्टिकोण बनाने के लिए" यूटीएफ -8 और यूटीएफ -8 के बीच अंतर क्या है बिना बीओएम? "स्टैक ओवरफ्लो चर्चा और यह विकिपीडिया लिंक" बाइट ऑर्डर मार्क "।
अंत में, मेरा C # दोनों UTF-8 एन्कोडिंग प्रकार (BOM और शुद्ध के साथ) के लिए प्रोग्रामिंग करना इस उदाहरण की तरह होना चाहिए:
//for UTF-8 with B.O.M., equals shared by Zanoni (at top)
string result = System.Text.Encoding.UTF8.GetString(byteArray);
//for Pure UTF-8 (without B.O.M.)
string result = (new UTF8Encoding(false)).GetString(byteArray);