मुझे एक शब्द में शब्दांश का पता लगाने के लिए एक काफी कुशल तरीका खोजने की आवश्यकता है। उदाहरण के लिए,
अदृश्य -> in-vi-sib-le
कुछ नियम नियम हैं जिनका उपयोग किया जा सकता है:
वी सीवी वीसी सीवीसी सीसीवी सीसीसीवी सीवीसीसी
* जहाँ V एक स्वर है और C एक व्यंजन है। उदाहरण के लिए,
उच्चारण (5 Pro-nun-ci-a-tion; CV-CVC-CV-V-CVC)
मैंने कुछ तरीकों की कोशिश की है, जिनमें से रेगेक्स का उपयोग कर रहे थे (जो सिलेबल्स गिनने के लिए केवल तभी मदद करता है) या हार्ड कोडेड रूल डेफिनिशन (एक ब्रूट फोर्स अप्रोच जो बहुत अक्षम साबित होती है) और अंत में एक परिमित स्टेट ऑटोमेटा (जो किया था) का उपयोग कर रहा है उपयोगी कुछ भी परिणाम नहीं)।
मेरे आवेदन का उद्देश्य किसी दिए गए भाषा में सभी शब्दांशों का शब्दकोश बनाना है। इस शब्दकोश का उपयोग बाद में वर्तनी जांच अनुप्रयोगों (बायेसियन क्लासिफायर का उपयोग करके) और भाषण संश्लेषण के लिए पाठ के लिए किया जाएगा।
मैं सराहना करूंगा अगर कोई मुझे अपने पिछले दृष्टिकोणों के अलावा इस समस्या को हल करने के लिए वैकल्पिक तरीके से सुझाव दे सके।
मैं जावा में काम करता हूं, लेकिन C / C ++, C #, पायथन, पर्ल ... में कोई भी टिप मेरे लिए काम करेगा।