यहाँ स्केल में लिखा गया थोड़ा अधिक परिष्कृत शब्द आधारित एल्गोरिथ्म है , जो मनमाने ढंग से लंबाई के शब्द अनुक्रमों की संभावनाओं को ध्यान में रखता है। (यह मूल असंतुष्ट प्रेस एल्गोरिथ्म नहीं है ।)
एल्गोरिथ्म इस प्रकार है। प्रत्येक चरण में एक यादृच्छिक स्थिति में शुरू होने वाले पाठ का एक आधा हिस्सा चुनें, उस आधे में उत्पन्न होने वाले आउटपुट शब्दों की सबसे लंबी पूंछ अनुक्रम की खोज करें (यह 0 शब्द हो सकता है) और अगले शब्द को आउटपुट करें।
import io._, collection.mutable.ArrayBuffer, util.Random
import java.io.FileInputStream
val lines = new BufferedSource(new FileInputStream("markov.txt")) getLines
val wordregex = "\\b[a-zA-Z]+\\b|[.,?!]".r
val words = lines flatMap (wordregex findAllIn _) toArray
val rollingwords = words ++ words.slice(0, words.length / 2)
val rnd = new Random()
val outwords = new ArrayBuffer[String]()
for (i <- 1 to 1000) {
val startposition = rnd nextInt (words.length * 2 / 3)
val half = rollingwords slice (startposition, startposition + words.length / 3)
var newword = ""; var n = 0; var index = 0
while (index >= 0 && n < half.length && n < outwords.length) {
index = half.indexOfSlice(outwords.takeRight(n))
if (index >= 0 && index < half.length - n) {
newword = half(index + n)
}
n = n + 1
}
outwords += newword
}
println(outwords.foldLeft("")(_ + " " + _))
यहाँ मार्कोव श्रृंखला पर विकिपीडिया लेख से उत्पन्न एक नमूना आउटपुट है:
आज के स्थिर वितरण अद्वितीय नहीं होंगे I संभाव्यताएं kararar स्थिति को संतुष्ट करती हैं ताकि संक्रमण संभावना वितरण को केवल मैपिंग का प्रतिनिधित्व किया जा सके यदि इकाई सिस्टम पर पैरामीटर, n को अद्वितीय बनाने के लिए, उस में मैं स्थिर वितरण या अदृश्य माप में अगर यह क्यू के लिए स्थिर वितरण को संतुष्ट करता है।
वैसे, अगर आप का उपयोग "[a-zA-Z .,!?]".r
के रूप में wordregex
आप अच्छी तरह से पत्र आधारित अलग प्रेस उत्पन्न करने के लिए इस का उपयोग कर सकते हैं:
इस अंजीर या अवधियों में जब एक बैकग्रॉबिटी पेटर स्टेट को स्टोकहेयर के साथ कई अलग-अलग स्थिति में ले जाता है यदि एम आई पिमाट्रांसि की चिकित्सा कक्षा होती है, तो यह पता चलता है कि सिस्टम राज्य द्वारा nnn जरूरत की जरूरत गलत है, फिर सभी कार्य को सीमित कर देता है।
यह शब्दजाल फ़ाइल जैसी बड़ी टेक्स्ट फ़ाइल के साथ वास्तव में दिलचस्प है । अब पत्र आधारित पहले से ही काफी अच्छा है:
अन्य दिशा एल्गोरिथ्म खुशी से त्रुटियों, और एक असामान्य होगा; LISP मैक प्री-इंटरनेट एक्सेस वर्कस्टेशन के आसपास निर्मित दशकों के साथ "आउट ऑफ प्रॉम्स, और मेटा-लोकेशन हैक के लिए यह शॉर्टहैंड रहा है। यह मृत हो सकता है। प्रतियोगियों का एक उपाय, एक लोकप्रिय संकलक का दूसरा बार बार अंत, और जोंक था। एक नेटवर्क से नेट, esp पर सामना किया। आमतौर पर `ग्राहक और यह कागज पर वापस चाड। कई अद्वितीय गुणों में था।
वर्डबेड काफी मनोरंजक हो जाता है:
यह तब से बताया गया है। केवल एक चीज की उम्मीद है कि एक संसाधन रिसाव एन। एक अर्ध-पौराणिक भाषा एक असंगत में निर्माण करती है क्योंकि यह पहली जगह में समायोजित नहीं हो सकती है। यदि आप एक चंचल में एक कंप्यूटर दर्ज करते हैं और एक वास्तविक कंप्यूटर प्राप्त करते हैं! छोटा सा भूत। टॉकिंग कहने के लिए सरकस्टिक निमंत्रण। छोटी केबल को वास्तविक प्रोग्रामिंग के लिए दोषी ठहराया गया था। पास्कल दस साल बाद, लेकिन हमारे उत्पाद का अधिकांश हिस्सा उतना ही आधुनिक नहीं है। इस बात पर कुछ विवाद है कि क्या यह प्रविष्टि हर किसी की माँ है।