उदाहरण के लिए, हिब्रू में उत्पत्ति के पहले कई छंदों को लें:
ֵֵֵָָ֣֣שִׁ֖שִׁ֖ ֵֵֵֵֵָָּּ א אלֵהֵיֱ אַשָּׁת הַשָּׁמְיְ וָאִםת הָאָֽרֵ
ו הְאָ֗רֶץ הָיָ֥ת ה תּ֙הוָ וָבֹ֔הוְחֹ֖שֶׁךְ וּ עּל־פְּנֵ֣י תְה֑וֹם וְר֣וּחַ אללָהִ֔ים מְרַחֶ֖פֶת עַל־פְּנֵ֥י הַמָּֽיִם׃יָ
ו יֹאמֶר אֱלִ֖הםיְ יִ֣ה֑י א֑וֹר וִי הַֽי־אֽוֹרֹּ֥
अधिक जानकारी के लिए
ו יֹקְרָ֨א אַלִ֤הםי׀ ָ לַאוֹר֔ יְו֙ וְלַחֹ֖שֶׁךְ קָ֣רָא לָ֑יְלָה וַֽיְהִי־עֶ֥רֶב וַֽיְהִי־בֹ֖קֹ֖ר י֥וִּוִּ
(ऐसा (פ)
किसी कारण से ब्लॉकचोट में ठीक से प्रारूपित नहीं होता है, लेकिन यह मेरी पाठ फ़ाइल में होता है।)
अब, मैं मानक 27 अक्षर हिब्रू वर्णमाला के अलावा सभी पात्रों के इस पाठ पट्टी करना चाहते हैं אבגדהוזחטיכךלמםנןסעפףצץקרשת
पंक्ति विराम (जो स्क्रिप्ट संपादक स्वचालित रूप से के रूप में पार्स करता है, के साथ साथ \n
) और लाइन और पैराग्राफ टूटता है ( :
और (פ)
या (ס)
)। आप कई लाइनों पर ध्यान देंगे कि हाइफ़न हैं - जिन्हें एक स्थान से बदला जाना चाहिए। कुछ पंक्तियों में यह भी शामिल है |
- जिन्हें एकल के साथ प्रतिस्थापित किया जाना चाहिए । जब किया जाता है, तो यह दिखना चाहिए:
उत्तर कोरिया के शासक ने उत्तर दिया
उत्तर कोरियाई लोग उत्तर कोरिया के उत्तर कोरिया के उत्तर अफ्रीका के क्षेत्र में जाने के लिए
ויאמר אלהים יהי אור ויהי אורר
अब तक की यात्रा के लिए איייא הוויכ הווויי
ויקרא אלהים לאור יוו ולחשך קרא לילה ויהי ערב ויהי בקר יום אחד׃ (פ)
मैं पहली बार में कुछ सरल करने की कोशिश की - हिब्रू वर्णमाला सेट प्लस ,
(
और )
एक सूची, स्थापित करने के लिए x
इनपुट स्ट्रिंग की लंबाई है, तो तार का हर किरदार के लिए बार-बार करते हैं: अगर यह सूची में है, तो से संलग्न आउटपुट; अगर यह एक है -
, उत्पादन में संलग्न ; यदि यह एक है
\
और अगला एक है n
, \n
तो आउटपुट में जोड़ें ; और यदि एक पंक्ति में दो स्थान हैं, तो दूसरा हटाएं।
मैंने आउटपुट को लॉग इन किया और कुछ अस्पष्ट हो गया:
(*אאית א ים ת ם ת ץץץץץץץץ ה הה הה ללללי ם ים ת ללללי םםםםםאאר ים י ר ייייררררררא ים תתתתתר ייייב ל ים ין ר ין א ים אאא ם א ה ייייב ייייר ם דד (פ)*)
जो बिना किसी स्वर के पारित होने के हर अक्षर को लगता है, इस घटना में दोहराया गया है कि निम्नलिखित अक्षर हैं। (रिपीट पर मेरी गलती - रिपीट लूप को खराब तरीके से लिखा गया है।) लेकिन यह उन कंसोनेंट्स पर छोड़ देता है जिनमें स्वर भी होते हैं जो मुझे आश्चर्यचकित करते हैं।
इसलिए मैंने एक परीक्षण किया:
set charNum to ASCII number "בְּ"
log charNum
set charNum to ASCII number "ב"
log charNum
-->result: (*63*) (*63*)
हालांकि टेक्स्ट एडिटर में, स्वर और पिछले अक्षर पर अलग-अलग अक्षर होते हैं, स्क्रिप्ट एडिटर इसे इस तरह नहीं देखता है, और ב, और ב को एक ही अक्षर के रूप में देखता है। और फिर भी, जब यह मेरी सूची से तुलना करता है, तो यह चरित्र को नहीं पहचानता है और इसे छोड़ देता है।
तो मैं किसी भी संभावित पत्र और स्वर संयोजन के लिए एक-लूप न करते हुए अक्षरों से स्वर और उसी तरह कैसे छीन सकता हूं?
return
फ़ंक्शन फ़ाइलों को संपादित करने की अनुमति देता है?