पिनयिन कॉम्बिनेशन


13

एक फ़ंक्शन बनाएं जो तर्क के रूप में एक पिनयिन शब्दांश की एक स्ट्रिंग लेता है, और संयोजन का सही रिटर्न मौजूद है, अन्यथा गलत।

"Ü" के लिए "v" का उपयोग करें।

यहां संयोजनों की पूरी सूची दी गई है। http://www.pinyin.info/rules/initials_finals.html

उदाहरण

f("bu") == true
f("zheng") == true
f("nv") == true
f("ri") == true
f("cei") == false
f("ia") == false
f("kian") == false
f("qa") == false

कृपया, चरित्र गणना को कम करने के लिए वेबपेज को स्क्रैप करने या इनपुट विधि फ़ाइलों को पढ़ने जैसी चीजें न करें। (यदि आप करते हैं, तो डेटा की लंबाई को वर्ण गणना की ओर गिना जाएगा) इस कोड गोल्फ का एक उद्देश्य यह देखना है कि नियमों को कैसे सरल बनाया जा सकता है। सबसे छोटा कोड जीतता है।


क्या कुछ पसंद है nar? : P
JiminP

1
एक उदाहरण के रूप में, एक नोट के रूप में, मेरा मानना nviहै कि कभी भी एक मान्य संयोजन नहीं है।
रिनटुन

यदि लिंक किया गया पृष्ठ पहले से ही कहता है »  एर इस तालिका से हटा दिया गया है« तो क्या इसे भी शामिल नहीं किया जाना चाहिए? (आखिरकार, यह एक संख्या थी, अगर मुझे सही से याद है;;)
जॉय

जवाबों:


4

जावास्क्रिप्ट 1.6, 503 496 477 अक्षर

function g(s){return/^([bfmpw]?o|[yjqx]ua?n|[ln]ve?|ei?|y[aio]ng|w?[ae]ng?|w?ai?|wei|y?ao|y?ou|y[ai]n?|yu?e|[^aeiou]+u)$/.test(s)|(((k=6*("ccsszzdflmnprtbghkjqx".indexOf(s[0])+(f=s[1]=='h')))|(r="a.e.ai.ei.ao.ou.an.ang.en.eng.ong.ua.uo.uai.ui.uan.uang.un.i.ia.ie.iao.iu.ian.iang.in.ing.iong.u.ue".split('.').indexOf(s.slice(f+1))))<0?0:k>84?r>17^k<108:parseInt("009m2f00b8jb009m2f00b7r3009m2n00b8jj1dwcfz0000rtfjba4f1xgbnjfj01rz1uyfb1009nn61b37cv1uyfa5".slice(k,k+6),36)>>r&1)}

आसानी से थोड़ा अधिक (कुछ पंक्तियों में कोड को तोड़ने में किसी भी त्रुटि को छोड़कर)

function _g(s)
{
  f = s[1] == 'h'
  k = "ccsszzdfghjklmnpqrtxb".indexOf(s[0]) * 6
  k += 6 * f
  return /^(weng|[bfmp]?o|[yjqx]ua?n|[ln]ve?|[ae]i?|y[aeiu]|y[aio]ng|[ae]ng?|wang?|wai?|we[in]|w[ou]|y?ao|y?ou?|y[ai]n|yue)$/.test(s) | 
         !!(k >= 0 && (1 << "a.e.ai.ei.ao.ou.an.ang.en.eng.ong.u.ua.uo.uai.ui.uan.uang.un.i.ia.ie.iao.iu.ian.iang.in.ing.iong.u.ue".split('.').indexOf(s.slice(f + 1)) & parseInt("00j85300mh2v00j85300mgan00j85b00mh332rsovz0002cp00b8jj00b8jjqmlts000b8jjv2mkfz3uwo3jv203jz3pwvelqmlts000jbaq2m6ewvqmlts03pwvdp".slice(k, k + 6), 36)))
}

शून्य-प्रारंभिक मामलों और कुछ एक-नापसंद को नियमित अभिव्यक्ति के साथ परीक्षण किया जाता है। उसके बाद, तालिका 6-अंकों, बेस -36 नंबरों की एक (संक्षिप्त) श्रृंखला के रूप में एनकोड की जाती है, एक प्रारंभिक ध्वनि। लुकअप फिर indexOfसही बिट का चयन करने के लिए एक जोड़ी कॉल और एक शिफ्ट का उपयोग करता है ।

संयोजनों की तालिका में सभी कोशिकाओं के खिलाफ परीक्षण किया गया (भरी हुई कोशिकाओं को सच के लिए परीक्षण किया गया, खाली कोशिकाओं को झूठे के लिए परीक्षण किया गया)।

संपादित करें: बेस -36 लुक के कुछ 36 वर्णों की तुलना जी, के- h, j-, q- और z- के बाद से की गई है, जिनमें सच / गलत के घने ब्लॉक हैं।

संपादित करें: एक अनावश्यक से बचने के लिए बिट टेस्ट को पुनर्व्यवस्थित किया !!और रेगेक्स को अधिक संकुचित कर दिया।


आपको एक की आवश्यकता क्यों है !!? मुझे यकीन नहीं है कि मैं समझता हूं कि आपको कभी दोहरे की आवश्यकता क्यों नहीं होगी ...
पीटर ओल्सन

इसके साथ, रिटर्न 0 या 1 है; इसके बिना "सत्य" को गैर-शून्य के रूप में लौटा दिया जाता है, लेकिन जरूरी नहीं कि 1. मेरी परीक्षण स्क्रिप्ट मान्य हो रही है, if (g(s) == (validList.indexOf(s) >= 0)जिसके साथ गलत है 16 == true; मैंने इसे "वास्तव में सही मायने में" क्या मतलब है के दृष्टिकोण से बहस की और बात को छोड़ दिया। या तो मामले में, मैंने बाद में आज के लिए एक नियोजित परिवर्तन किया है जो कि (कम या ज्यादा) के साथ !!बदलकर दूर करेगा ताकि वापसी 1 है और मैं दो वर्णों से दाढ़ी बनाता हूं। 1<<r&*parseInt(parseInt>>r)&1
डॉकमैक्स

1

PHP, 548 वर्ण

दी, यह संभव नहीं है कि इष्टतम है, लेकिन मैंने वैध पिन्यिन संयोजनों से मेल खाने के लिए एक रेगेक्स लिखा है। चर के साथ दोहराए गए पदार्थों को प्रतिस्थापित करके वर्णों को कम करना।

कोड

<?php $a='?|e(i|ng?)';$b='|o(u|ng)|u';$c='|a?n)?|i(a[on]';$d='(a(ng?|o|i)';$e='|ng?)';$f='(i|ng)?';echo(preg_match("/^([bpm](a(i|o$e$a|u|o|i(e|a[on]$e?)|[pm]ou|m(e|iu)|f(a(ng?)?|ou$a|u)|d$d$a?$b(o|i$c?|e|u)?)|[dtnl]$d?|e$f$b(o$c|e)?)|[jqxy](i(a(o$e?|e|u|o?ng|n)|u(e|a?n))|([zcs]h?|r)i|[nl](ve?|i(n|ang?|u))|[dl]ia|[dt](ing|ui)|[dn]en|diu|([gkh]|[zcs]h?)(e(ng?)|a(o|ng?|i)?|ou|u(o|i|a?n)?)|r(e(ng?)?|a(o$e$b(a?n?|o|i)?)|[gkh](ei|ong|u(a$f))|[zcs]hua$f|([zcs]|[zc]h)ong|(z|[zs]h)ei|a(i|o$e?|ou$a?|w(u|a(i$e?|o|e(i$e))$/",$argv[1]))?"true":"false";

प्रयोग

> php pinyin.php bu
> true
> php pinyin.php cei
> false

1

एफ #, 681 वर्ण

type l=Y|J|Q|X|W|F|B|P|M|N|L|T|D|Z|K|H|Zh|G|Sh|Ch|C|S|R|Iong|Vn|Van|Ia|Iu|In|Iang|Ve|V|Ian|Iao|Ie|Ing|I|Ei|A|Ai|An|Ang|Eng|U|Ao|E|Ou|Uo|Uan|Un|Ui|En|Ong|Ua|Uang|Uai|Ueng|O
let v x=x.GetHashCode()
let n x=J.GetType().GetNestedType("Tags").GetFields().GetValue(v x).ToString().Substring(6).ToLower();
let(^)a b=List.collect(fun x->List.map(fun z-> n x+ n z)b)a
let(-)a b=[v a..v b]
let(&)a b=a@b
let(!)a=[v a]
[<EntryPoint>]
let main a=
 printf"%b"(List.exists(fun x->x=a.[0])(Y-X^Iong-I& !W^Ei-Ui@Ua-O& !F^Ei-A@An-U@ !Ou&(F-N@D-Sh)^ !En&F-M^ !O&B-M^ !In&N-L^Iu-Un& !D^Ia-Iu&B-D^Ian-Ao& !M^E-Ou&Ch-S^A-Ong&T-Sh^Ei-Ui&N-G^ !Ong&K-Ch^Ua-Uai& !R^An-Ua&(Sh-R@ !Z@ !Zh)^ !I&["lia";"pou";"mui"]))
 0

प्रारंभिक व्यंजन सही (Y, W आदि) के बिना शब्दांश नहीं मिलते हैं।


1

एपीएल (डायलॉग एक्सटेंडेड) , 475 बाइट्स

s←⊢⊆⍨' '≠⊢
a b c2097144 131064 1957895
f←{(⊂⍵)∊(12v),(s'yi ya ye yao you yan yang yin ying yong yu yue yuan yun wu wa wo wai wei wan wang wen weng nv lv nve lve'),(,⊤(a-8)1966080 393208 1966064 2096720 1966072 1048568a a 2056184a 131048a 7288b 7280 106488b 7280b 0 1958911 73735c c 352263c 24583 1859591c,57)/,('bpmfdtnlgkhzcs',s'zh ch sh r j q x')∘.,v'aoe',s'ai ei ao ou an ang en eng ong u ua uo uai ui uan uang un ueng i ia ie iao iu ian iang in ing iong u ue uan un'}

इसे ऑनलाइन आज़माएं!

गोल्फ का काम जारी है।

Ungolfed

s←{⍵⊆⍨' '≠⍵}
cons'b p m f d t n l g k h z c s zh ch sh r j q x'
vwls'a o e ai ei ao ou an ang en eng ong u ua uo uai ui uan uang un ueng i ia ie iao iu ian iang in ing iong u ue uan un'
tabcon∘.,vwl
bin←,⊤2097136 1966080 393208 1966064 2096720 1966072 1048568 2097144 2097144 2056184 2097144 131048 2097144 7288 131064 7280 106488 131064 7280 131064 0 1958911 73735 1957895 1957895 352263 1957895 24583 1859591 1957895 7 7 7 7 7
all'aoe',(12vwl),(s'yi ya ye yao you yan yang yin ying yong yu yue yuan yun wu wa wo wai wei wan wang wen weng nv lv nve lve'),bin/,tab
f←{(⊂⍵)∊all}

इसे ऑनलाइन आज़माएं!

सहायक कार्य sस्थान-सीमांकित स्ट्रिंग को खोल देता है:

{⍵⊆⍨' '≠⍵}    monadic function taking a string
    ' '≠⍵       0s at spaces, 1s elsewhere
 ⍵⊆⍨            Partition (split at 0s)

मैं पहले संभव प्रारंभिक और अंतिम तार को शब्दांश में संग्रहीत करता हूं, फिर tabदूसरी सूची के प्रत्येक स्ट्रिंग के साथ पहली सूची से प्रत्येक स्ट्रिंग के संघनन युक्त एक तालिका बनाते हैं ।

अगला, मैं बाइनरी डेटा को पूर्णांकों की सूची के रूप में संग्रहीत करता हूं। पूर्णांकों में से कुछ को दोहराया जाता है और इसलिए इसे चर में संग्रहित किया जा सकता है, जो कुछ स्थानों को खत्म करने की भी अनुमति देता है।

प्रत्येक पूर्णांक बाइनरी में डिकोड किया जाता है, और तालिका की एक पंक्ति का प्रतिनिधित्व करता है। संख्या में प्रत्येक बिट यह दर्शाता है कि उस पंक्ति में एक निश्चित शब्दांश एक मान्य शब्दांश है, जिसमें MSB पहले कॉलम का प्रतिनिधित्व करता है। सभी अमान्य सिलेबल्स को टेबल से हटा दिया जाता है।

हम तालिका को सूची में समतल करते हैं, एक विशेष मामले के रूप में प्रारंभिक व्यंजन के साथ रूपों पर जोड़ते हैं, और अंत में जांचें कि क्या हमारा इनपुट सूची में है।

संभावित आगे गोल्फ क्षमता:

  • बेस 64 या बेस 255 एनकोडिंग लिखें
  • संख्याओं को छोटा करने के लिए स्तंभों और पंक्तियों को फिर से व्यवस्थित करें।

पायथन सहायक स्क्रिप्ट और टेस्ट-केस जनरेटर: इसे ऑनलाइन आज़माएं!

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.