यह एक टिप्पणी के रूप में इतना जवाब नहीं होगा।
गुणवत्ता कई चीजों पर निर्भर करती है, जिसमें (जैसा कि हारून ने ऊपर कहा है) 1) भाषा जोड़ी और 2) विषय, लेकिन यह भी 3) जेनेरा और 4) मूल की शैली, और 5) समानांतर पाठ की मात्रा आपके पास है एमटी प्रणाली को प्रशिक्षित करने के लिए।
मंच को सेट करने के लिए, इन दिनों लगभग सभी एमटी समानांतर ग्रंथों पर आधारित है, जो कि दो अलग-अलग भाषाओं में एक पाठ है, जिसमें से एक संभवतः दूसरे का अनुवाद है (या दोनों किसी तीसरी भाषा का अनुवाद है); और संभावित रूप से विशेष शब्दों में समाहित नहीं होने पर बैकऑफ़ के रूप में शब्दकोशों (संभवतः रूपात्मक प्रक्रियाओं द्वारा सहायता प्राप्त) का उपयोग करना।
इसके अलावा, जैसा कि दूसरों ने कहा है, एक एमटी प्रणाली किसी भी तरह से उन ग्रंथों को नहीं समझती है जो यह अनुवाद कर रहा है; यह सिर्फ वर्णों के तारों को देखता है, और वर्णों से बने शब्दों का अनुक्रम करता है, और इससे पहले ग्रंथों में इसी तरह के तार और दृश्यों की तलाश होती है। (ठीक है, यह उससे थोड़ा अधिक जटिल है, और कम्प्यूटेशनल सिस्टम में शब्दार्थों को प्राप्त करने का प्रयास किया गया है, लेकिन अब यह ज्यादातर तार है।)
1) भाषाएं बदलती हैं। कुछ भाषाओं में बहुत सारी आकारिकी होती है, जिसका अर्थ है कि वे एक ही शब्द के साथ ऐसी चीजें करते हैं जो अन्य भाषाएं कई शब्दों के साथ करती हैं। एक सरल उदाहरण स्पेनिश 'कैंटेरमोस' = अंग्रेजी "हम गाएंगे" होगा। और एक भाषा ऐसी चीजें कर सकती है जो दूसरी भाषा के साथ भी परेशान नहीं करती है, जैसे कि स्पेनिश में अनौपचारिक / औपचारिक (ट्यू / usted) भेद, जो अंग्रेजी के बराबर नहीं है। या एक भाषा आकृति विज्ञान के साथ ऐसी चीजें कर सकती है जो दूसरी भाषा शब्द क्रम से करती है। या स्क्रिप्ट जो भाषा का उपयोग करती है वह शब्द सीमाएं (चीनी, और कुछ अन्य) को भी चिह्नित नहीं कर सकती है। दोनों भाषाओं में जितनी अधिक भिन्नता होगी, एमटी प्रणाली के लिए उनके बीच अनुवाद करना उतना ही कठिन होगा। सांख्यिकीय एमटी में पहला प्रयोग फ्रेंच और अंग्रेजी के बीच किया गया था,
2) विषय: यदि आपके पास बाइबिल में समानांतर पाठ हैं (जो लगभग किसी भी लिखित भाषाओं की जोड़ी के लिए सही है), और आप अपने एमटी सिस्टम को उन लोगों से दूर करते हैं, तो यह उम्मीद न करें कि यह इंजीनियरिंग ग्रंथों पर अच्छा काम करेगा। (खैर, बाइबल एमटी प्रणालियों के प्रशिक्षण के मानकों के अनुसार पाठ की अपेक्षाकृत छोटी मात्रा है, लेकिन :-) दिखावा करते हैं।) बाइबिल की शब्दावली इंजीनियरिंग ग्रंथों से बहुत अलग है, और इसलिए विभिन्न व्याकरणिक की आवृत्ति है निर्माण। (व्याकरण मूल रूप से समान है, लेकिन अंग्रेजी में, उदाहरण के लिए, आपको वैज्ञानिक और इंजीनियरिंग ग्रंथों में बहुत अधिक निष्क्रिय आवाज और अधिक यौगिक संज्ञाएं मिलती हैं।)
3) जेनेरा: यदि आपका समानांतर पाठ सभी घोषणात्मक है (जैसे ट्रैक्टर मैनुअल, कहते हैं), तो डायलॉग पर परिणामस्वरूप एमटी सिस्टम का उपयोग करने की कोशिश करने से आपको अच्छे परिणाम नहीं मिलेंगे।
4) स्टाइल: थिंक हिलेरी बनाम डोनाल्ड; erudite बनाम लोकप्रिय। एक पर प्रशिक्षण दूसरे पर अच्छा परिणाम नहीं मिलेगा। इसी तरह वयस्क स्तर के उपन्यासों पर एमटी प्रणाली का प्रशिक्षण और बच्चों की पुस्तकों पर इसका उपयोग करना।
5) भाषा युग्म: अंग्रेजी में बहुत सारे ग्रंथ हैं, और किसी अन्य भाषा में ग्रंथों को खोजने की संभावना है जो किसी दिए गए अंग्रेजी पाठ के समानांतर हैं, रूसी और इग्बो में समानांतर पाठ खोजने की संभावना से बहुत अधिक हैं। (कहा कि, भारत की भाषाओं की तरह इसके अपवाद भी हो सकते हैं।) सकल सामान्यीकरण के रूप में, इस तरह के समांतर ग्रंथों में आपको एमटी प्रणाली को प्रशिक्षित करना होगा, बेहतर परिणाम।
संक्षेप में, भाषा जटिल है (यही कारण है कि मैं इसे प्यार करता हूं - मैं एक भाषाविद् हूं)। तो यह कोई आश्चर्य की बात नहीं है कि एमटी सिस्टम हमेशा अच्छी तरह से काम नहीं करते हैं।
BTW, मानव अनुवादक हमेशा या तो इतनी अच्छी तरह से नहीं करते हैं। एक या दो दशक पहले, मुझे अंग्रेजी में मानव अनुवादकों के दस्तावेजों का अनुवाद मिल रहा था, एमटी सिस्टम के लिए प्रशिक्षण सामग्री के रूप में इस्तेमाल किया जाना था। अनुवादों में से कुछ को समझना मुश्किल था, और कुछ मामलों में जहां हमें दो (या अधिक) मानव अनुवादकों से अनुवाद मिला, यह विश्वास करना कठिन था कि अनुवादक उसी दस्तावेजों को पढ़ रहे थे।
और अंत में, वहाँ (लगभग) सिर्फ एक सही अनुवाद नहीं है; एक मार्ग का अनुवाद करने के कई तरीके हैं, जो कम या ज्यादा अच्छे हो सकते हैं, जो आप चाहते हैं कि सुविधाओं (व्याकरणिक शुद्धता, शैली, उपयोग की संगतता, ...) पर निर्भर करता है। "सटीकता" का कोई आसान उपाय नहीं है।