लेआउट के लिए हमारे पास हमारे प्रसिद्ध "लोरम इप्सम" पाठ है कि यह कैसा दिखता है।
मैं जिस चीज़ की तलाश कर रहा हूँ, वह कई अलग-अलग एन्कोडिंग्स के साथ पाठ एन्कोडेड फ़ाइलों का एक सेट है, जिसे मैं अपने JUnit परीक्षणों में कुछ तरीकों का परीक्षण करने के लिए उपयोग कर सकता हूं जो पाठ फ़ाइलों को पढ़ते समय चरित्र एन्कोडिंग के साथ काम कर रहे हैं।
उदाहरण:एक के बाद ISO 8859-1
इनकोडिंग परीक्षण फाइल और एक Windows-1252
इनकोडिंग परीक्षण फ़ाइल। विंडोज -1252 को क्षेत्र में अंतर 16 16 - 9 एफ 16 को ट्रिगर करना होगा । दूसरे शब्दों में इसे आईएसओ 8859-1 से अलग करने के लिए इस क्षेत्र का कम से कम एक वर्ण होना चाहिए।
हो सकता है कि परीक्षण-फाइलों का सबसे अच्छा सेट वह हो, जहां प्रत्येक एन्कोडिंग के लिए परीक्षण-फ़ाइल में एक बार उसके सभी अक्षर शामिल हों। लेकिन शायद मैं sth के बारे में पता नहीं कर रहा हूँ - हम सभी को यह एन्कोडिंग सामान पसंद है, है ना? :-)
वहाँ बाहर चरित्र-एन्कोडिंग मुद्दों के लिए परीक्षण-फ़ाइलों का ऐसा सेट है?