पैराग्राफ को पैच करें


32

पैच द इमेज की भावना में , यहां एक समान चुनौती है लेकिन पाठ के साथ।

चुनौती

बिट रोट ने आपके कीमती पाठ को प्रभावित किया है! ASCII वर्णों से बने एक पैराग्राफ को देखते हुए, इसमें एक आयताकार छेद के साथ, आपके कार्यक्रम को उपयुक्त पाठ के साथ छेद में भरने की कोशिश करनी चाहिए, ताकि पैराग्राफ यथासंभव सर्वोत्तम रूप से मिश्रित हो।

आगे की परिभाषाएँ

  • छेद हमेशा आयताकार होगा, और यह कई लाइनों को फैला सकता है।
  • केवल एक ही छेद होगा।
  • ध्यान दें कि छेद आवश्यक रूप से शब्द सीमाओं पर नहीं पड़ता है (वास्तव में, यह आमतौर पर नहीं होगा)।
  • छेद इनपुट पैराग्राफ के 25% से अधिक होगा, लेकिन "सामान्य" टेक्स्ट के "अंत" को ओवरलैप या विस्तारित कर सकता है (नीचे यूक्लिड या बेजर उदाहरण देखें)।
  • चूंकि छेद ढूंढना इस चुनौती का मुख्य बिंदु नहीं है, यह #आसान पहचान के लिए अनुमति देने के लिए केवल हैश के निशान से बना होगा ।
  • इनपुट पैराग्राफ में किसी अन्य स्थान पर हैश मार्क नहीं होगा।
  • आपका कोड नीचे दिए गए उदाहरणों में "सामान्य" पाठ का उपयोग नहीं कर सकता है - यह केवल उस छेद के साथ पाठ को प्राप्त और संसाधित करेगा।
  • इनपुट सिंगल मल्टी-लाइन स्ट्रिंग के रूप में हो सकता है, एक स्ट्रिंग के एक सरणी के रूप में (एक तत्व प्रति पंक्ति), एक फ़ाइल के रूप में, आदि - आपकी पसंद जो आपकी भाषा के लिए सबसे सुविधाजनक है।
  • यदि वांछित है, तो छेद के निर्देशांक का विवरण देने वाला एक वैकल्पिक अतिरिक्त इनपुट लिया जा सकता है (उदाहरण के लिए, निर्देशांक या पसंद का एक प्रकार)।
  • कृपया अपने सबमिशन में अपने एल्गोरिदम का वर्णन करें।

मतदान

मतदाताओं को एंट्रीज को जज करने के लिए कहा जाता है कि टेक्स्ट होल में एल्गोरिदम कितनी अच्छी तरह से भरता है। कुछ सुझावों में निम्नलिखित शामिल हैं:

  • क्या क्षेत्र में भरा रिक्त स्थान और विराम चिह्न के बाकी हिस्सों के रूप में अनुमानित वितरण से मेल खाता है?
  • क्या क्षेत्र में भरा हुआ दोषपूर्ण वाक्य रचना का परिचय देता है? (जैसे, एक पंक्ति में दो स्थान, एक प्रश्न चिह्न के बाद की अवधि, एक गलत अनुक्रम जैसे , ,, आदि।
  • यदि आप अपनी आँखें निचोड़ लेते हैं (इसलिए आप वास्तव में पाठ नहीं पढ़ रहे हैं), तो क्या आप देख सकते हैं कि छेद कहाँ हुआ करता था?
  • यदि छेद के बाहर कोई CamelCase शब्द नहीं हैं, तो क्या छेद में कोई भी शामिल है? यदि छेद के बाहर कोई पूंजीकृत पत्र नहीं हैं, तो क्या छेद में कोई भी शामिल है? यदि छेद के बाहर बड़े अक्षरों का एक बहुत कुछ है, तो क्या छेद में एक आनुपातिक राशि होती है?

वैधता मानदंड

प्रस्तुत करने के लिए वैध माना जाने के लिए, उसे छेद के बाहर पैराग्राफ (अनुगामी रिक्त स्थान सहित) के किसी भी पाठ को नहीं बदलना चाहिए। बहुत अंत में एक एकल अनुगामी न्यूलाइन वैकल्पिक है।

परीक्षण के मामलों

कोड कोड में प्रारूप मूल पैराग्राफ होता है, जिसके बाद उसी पैराग्राफ में छेद होता है। छेद वाले पैराग्राफ का उपयोग इनपुट के लिए किया जाएगा।

1 (छवि को पैच करें)

In a popular image editing software there is a feature, that patches (The term
used in image processing is inpainting as @minxomat pointed out.) a selected
area of an image, based on the information outside of that patch. And it does a
quite good job, considering it is just a program. As a human, you can sometimes
see that something is wrong, but if you squeeze your eyes or just take a short
glance, the patch seems to fill in the gap quite well.

In a popular image editing software there is a feature, that patches (The term
used in image processing is inpainting as @minxomat pointed out.) a selected
area of an image, #############information outside of that patch. And it does a
quite good job, co#############is just a program. As a human, you can sometimes
see that something#############t if you squeeze your eyes or just take a short
glance, the patch seems to fill in the gap quite well.

2 (गेट्सबर्ग एड्रेस)

But, in a larger sense, we can not dedicate, we can not consecrate, we can not
hallow this ground. The brave men, living and dead, who struggled here, have
consecrated it, far above our poor power to add or detract. The world will
little note, nor long remember what we say here, but it can never forget what
they did here. It is for us the living, rather, to be dedicated here to the
unfinished work which they who fought here have thus far so nobly advanced. It
is rather for us to be here dedicated to the great task remaining before us-
that from these honored dead we take increased devotion to that cause for which
they gave the last full measure of devotion-that we here highly resolve that
these dead shall not have died in vain-that this nation, under God, shall have
a new birth of freedom-and that government of the people, by the people, for
the people, shall not perish from the earth.

But, in a larger sense, we can not dedicate, we can not consecrate, we can not
hallow this ground. The brave men, living and dead, who struggled here, have
consecrated it, far above our poor power to add or detract. The world will
little note, nor long remember what we say here, but it can never forget what
they did here. It is for us the living, rather, to be dedicated here to the
unfinished work which they who fought here h######################advanced. It
is rather for us to be here dedicated to the######################before us-
that from these honored dead we take increas######################use for which
they gave the last full measure of devotion-######################solve that
these dead shall not have died in vain-that ######################, shall have
a new birth of freedom-and that government of the people, by the people, for
the people, shall not perish from the earth.

3 (लोरम इप्सम)

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do
eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim
ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut
aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit
in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur
sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt
mollit anim id est laborum.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do
eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim
ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut
aliquip ex ea commodo conse################irure dolor in reprehenderit
in voluptate velit esse cil################giat nulla pariatur. Excepteur
sint occaecat cupidatat non################in culpa qui officia deserunt
mollit anim id est laborum.

4 (जाबेरवॉकी)

'Twas brillig, and the slithy toves
Did gyre and gimble in the wabe;
All mimsy were the borogoves,
And the mome raths outgrabe.

'Twas brillig, and the slithy toves
Did gyre a######### in the wabe;
All mimsy #########borogoves,
And the mome raths outgrabe.

5 (पाइथागोरस प्रमेय का यूक्लिड प्रमाण)

1.Let ACB be a right-angled triangle with right angle CAB.
2.On each of the sides BC, AB, and CA, squares are drawn,
CBDE, BAGF, and ACIH, in that order. The construction of
squares requires the immediately preceding theorems in Euclid,
and depends upon the parallel postulate. [footnote 14]
3.From A, draw a line parallel to BD and CE. It will
perpendicularly intersect BC and DE at K and L, respectively.
4.Join CF and AD, to form the triangles BCF and BDA.
5.Angles CAB and BAG are both right angles; therefore C, A,
and G are collinear. Similarly for B, A, and H.
6.Angles CBD and FBA are both right angles; therefore angle ABD
equals angle FBC, since both are the sum of a right angle and angle ABC.
7.Since AB is equal to FB and BD is equal to BC, triangle ABD
must be congruent to triangle FBC.
8.Since A-K-L is a straight line, parallel to BD, then rectangle
BDLK has twice the area of triangle ABD because they share the base
BD and have the same altitude BK, i.e., a line normal to their common
base, connecting the parallel lines BD and AL. (lemma 2)
9.Since C is collinear with A and G, square BAGF must be twice in area
to triangle FBC.
10.Therefore, rectangle BDLK must have the same area as square BAGF = AB^2.
11.Similarly, it can be shown that rectangle CKLE must have the same
area as square ACIH = AC^2.
12.Adding these two results, AB^2 + AC^2 = BD × BK + KL × KC
13.Since BD = KL, BD × BK + KL × KC = BD(BK + KC) = BD × BC
14.Therefore, AB^2 + AC^2 = BC^2, since CBDE is a square.

1.Let ACB be a right-angled triangle with right angle CAB.
2.On each of the sides BC, AB, and CA, squares are drawn,
CBDE, BAGF, and ACIH, in that order. The construction of
squares requires the immediately preceding theorems in Euclid,
and depends upon the parallel postulate. [footnote 14]
3.From A, draw a line parallel to BD and CE. It will
perpendicularly intersect BC and DE at K and L, respectively.
4.Join CF and AD, to form the triangles BCF and BDA.
5.Angles CAB and BAG are both right angles; therefore C, A,
and G are #############milarly for B, A, and H.
6.Angles C#############e both right angles; therefore angle ABD
equals ang############# both are the sum of a right angle and angle ABC.
7.Since AB#############FB and BD is equal to BC, triangle ABD
must be co#############iangle FBC.
8.Since A-#############ight line, parallel to BD, then rectangle
BDLK has t############# of triangle ABD because they share the base
BD and hav#############titude BK, i.e., a line normal to their common
base, conn#############rallel lines BD and AL. (lemma 2)
9.Since C #############with A and G, square BAGF must be twice in area
to triangl#############
10.Therefo############# BDLK must have the same area as square BAGF = AB^2.
11.Similar############# shown that rectangle CKLE must have the same
area as square ACIH = AC^2.
12.Adding these two results, AB^2 + AC^2 = BD × BK + KL × KC
13.Since BD = KL, BD × BK + KL × KC = BD(BK + KC) = BD × BC
14.Therefore, AB^2 + AC^2 = BC^2, since CBDE is a square.

6 (Badger, Badger, Badger by weebl)

Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Mushroom, mushroom, a-
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Mushroom, mushroom, a-
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Mush-mushroom, a
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Argh! Snake, a snake!
Snaaake! A snaaaake, oooh its a snake!

Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Mushroom, mushroom, a-
Badger##################badger, badger,
badger##################badger, badger
Mushro##################
Badger##################badger, badger,
badger##################badger, badger
Mush-mushroom, a
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Argh! Snake, a snake!
Snaaake! A snaaaake, oooh its a snake!

क्या मैं मान सकता हूं कि छेद कम से कम तीन वर्ण चौड़ा है
रोहन झुनझुनवाला

@ रोहन झुनझुनवाला ज़रूर पाठ के आकार को देखते हुए, यह काफी सुरक्षित धारणा है।
AdmBorkBork

Gettysburg उदाहरण में स्पष्ट रूप से उन्हें डैश शामिल हैं, जो सादा आसियासी नहीं हैं। केवल इस बात की ओर इशारा करते हुए कि आपने अपनी टिप्पणियों में किसी एक उत्तर में कहा था कि आप सादे एस्की परीक्षण मामलों का उपयोग करेंगे।
सुपरजेडी २२४

@ SuperJedi224 धन्यवाद - निश्चित।
AdmBorkBork

जवाबों:


15

अजगर २

मुझे पता है कि @atlasologist पहले से ही पायथन 2 में एक समाधान पोस्ट कर चुके हैं, लेकिन मेरे काम करने का तरीका थोड़ा अलग है। यह सभी छेदों के ऊपर से नीचे तक, बाएं से दाएं, 5 वर्णों को पीछे और ऊपर के वर्ण को देखकर, और उन वर्णों को ढूंढने में काम करता है जहां ये मैच होते हैं। यदि कई वर्ण पाए जाते हैं, तो यह सबसे आम चुनता है। यदि कोई पात्र नहीं पाया जाता है, तो यह उपरोक्त वर्ण प्रतिबंध को हटा देता है। यदि अभी भी कोई वर्ण नहीं मिला है, तो यह वर्णों की मात्रा को कम कर देता है जो इसे दिखता है, और दोहराता है।

def fix(paragraph, holeChar = "#"):
    lines = paragraph.split("\n")
    maxLineWidth = max(map(len, lines))
    lines = [list(line + " " * (maxLineWidth - len(line))) for line in lines]
    holes = filter(lambda pos: lines[pos[0]][pos[1]] == holeChar, [[y, x] for x in range(maxLineWidth) for y in range(len(lines))])

    n = 0
    for hole in holes:
        for i in range(min(hole[1], 5), 0, -1):
            currCh = lines[hole[0]][hole[1]]
            over = lines[hole[0] - 1][hole[1]]
            left = lines[hole[0]][hole[1] - i : hole[1]]

            same = []
            almost = []
            for y, line in enumerate(lines):
                for x, ch in enumerate(line):
                    if ch == holeChar:
                        continue
                    if ch == left[-1] == " ":
                        continue
                    chOver = lines[y - 1][x]
                    chLeft = lines[y][x - i : x]
                    if chOver == over and chLeft == left:
                        same.append(ch)
                    if chLeft == left:
                        almost.append(ch)
            sortFunc = lambda x, lst: lst.count(x) / (paragraph.count(x) + 10) + lst.count(x)
            if same:
                newCh = sorted(same, key=lambda x: sortFunc(x, same))[-1]
            elif almost:
                newCh = sorted(almost, key=lambda x: sortFunc(x, almost))[-1]
            else:
                continue
            lines[hole[0]][hole[1]] = newCh
            break


    return "\n".join(map("".join, lines))

यहाँ बेजर, बेजर, बेजर का परिणाम है:

Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger 
Mushroom, mushroom, a-                 
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger 
Mushroom, mushroom, a- b               
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger 
Mush-mushroom, a                       
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger 
Argh! Snake, a snake!                  
Snaaake! A snaaaake, oooh its a snake! 

यहाँ सबूत से परिणाम है:

1.Let ACB be a right-angled triangle with right angle CAB.                 
2.On each of the sides BC, AB, and CA, squares are drawn,                  
CBDE, BAGF, and ACIH, in that order. The construction of                   
squares requires the immediately preceding theorems in Euclid,             
and depends upon the parallel postulate. [footnote 14]                     
3.From A, draw a line parallel to BD and CE. It will                       
perpendicularly intersect BC and DE at K and L, respectively.              
4.Join CF and AD, to form the triangles BCF and BDA.                       
5.Angles CAB and BAG are both right angles; therefore C, A,                
and G are the same areamilarly for B, A, and H.                            
6.Angles CAB and CA, sqe both right angles; therefore angle ABD            
equals angle ABD becaus both are the sum of a right angle and angle ABC.   
7.Since ABD because theFB and BD is equal to BC, triangle ABD              
must be construction ofiangle FBC.                                         
8.Since A-angle ABD becight line, parallel to BD, then rectangle           
BDLK has the same area  of triangle ABD because they share the base        
BD and have the base thtitude BK, i.e., a line normal to their common      
base, conngle and G, sqrallel lines BD and AL. (lemma 2)                   
9.Since C = BD × BK + with A and G, square BAGF must be twice in area     
to triangle FBC. (lemma                                                    
10.Therefore angle and  BDLK must have the same area as square BAGF = AB^2.
11.Similarly for B, A,  shown that rectangle CKLE must have the same       
area as square ACIH = AC^2.                                                
12.Adding these two results, AB^2 + AC^2 = BD × BK + KL × KC             
13.Since BD = KL, BD × BK + KL × KC = BD(BK + KC) = BD × BC             
14.Therefore, AB^2 + AC^2 = BC^2, since CBDE is a square.

और Jabberwocky का परिणाम:

'Twas brillig, and the slithy toves
Did gyre and the mo in the wabe;   
All mimsy toves, anborogoves,      
And the mome raths outgrabe.       

5
वह बेजर एक बहुत प्रभावशाली है, और Jabberwocky ऐसा लगता है कि यह कानूनी कविता हो सकती है। अच्छा काम।
AdmBorkBork

6

अजगर २

यह एक बहुत ही सीधा-सीधा समाधान है। यह शब्दों से बना एक नमूना स्ट्रिंग बनाता है जो औसत शब्द लंबाई A- ( A/ 2) और A+ ( A/ 2) के बीच होता है, फिर यह नमूने से पैच क्षेत्र में अग्रणी और अनुगामी अंतरिक्ष ट्रिम किए गए स्थान को लागू करता है। यह कैपिटलाइज़ेशन को हैंडल नहीं करता है, और मुझे यकीन है कि वहाँ एक क्यूरबॉल टेस्ट केस है जो इसे तोड़ देगा, लेकिन यह उदाहरणों पर ठीक करता है। सभी परीक्षण चलाने के लिए नीचे दिया गया लिंक देखें।

मैंने अच्छे उपाय के लिए कोड में एक पैच भी डाला।

def patch(paragraph):
    sample = [x.split() for x in paragraph if x.count('#') < 1]
    length = max([x.count('#') for x in paragraph if x.find('#')])
    s = sum(####################
    sample,[####################
    ])      ####################
    avg=sum(####################
    len(w)  ####################
    for w in####################
    s)//len(s)
    avg_range = range(avg-(avg//2),avg+(avg//2))
    sample = filter(lambda x:len(x) in avg_range, s)
    height=0
    for line in paragraph:
        if line.find('#'):height+=1
        print line.replace('#'*length,' '.join(sample)[(height-1)*length:height*length].strip())
    print '\n'

लोरम इप्सम, मूल तो गढ़ा:

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do
eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim
ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut
aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit
in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur
sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt
mollit anim id est laborum.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do
eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim
ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut
aliquip ex ea commodo conseore dolore magnairure dolor in reprehenderit
in voluptate velit esse cilenim minim quisgiat nulla pariatur. Excepteur
sint occaecat cupidatat nonnisi mollit aniin culpa qui officia deserunt
mollit anim id est laborum.

कोशिश करो


3
हेहे mushroger...
AdmBorkBork

खैर, यह आपके कोड को एक दिलचस्प तरीके से पैच नहीं करता है।
mbomb007

@ mbomb007 #कोड में अन्य वर्णों के कारण है।
एटलसोलॉजिस्ट

@atlasologist भले ही आप उन्हें कुछ और की तरह बदल दें @, दिलचस्प कुछ भी नहीं।
mbomb007

4

जावा शेक्सपियर

किसे मानक अंग्रेजी सम्मेलनों की समझ चाहिए? बस अपना बना लो! जैसे बार्ड को अपनी बात कहने की अनुमति थी। यह बॉट कट ऑफ शब्दों को सही करने के बारे में ज्यादा चिंता नहीं करता है, वह वास्तव में सिर्फ यादृच्छिक शब्द सम्मिलित करता है। परिणाम कुछ सुंदर कविता है। एक बोनस सुविधा के रूप में बार्ड एक उच्च कैलिबर का है और कई छेदों को संभाल सकता है बशर्ते कि वे एक ही आकार के हों!


नमूना इनपुट

 निष्पक्ष प्राणियों से हम वृद्धि की इच्छा करते हैं,
  जिससे सुंदरता के गुलाब कभी न मरें,
  लेकिन जैसा कि राइपर को समय कम हो जाना चाहिए,
  उनकी निविदा ############ उनकी स्मृति को सहन करती है:
  लेकिन तू ############# अपनी चमकदार आँखें,
  आत्मनिर्भर ईंधन के साथ फीड थस्ट ############# अमे,
  अकाल बनाना जहाँ बहुतायत निहित है,
  तेरा तेरा दुश्मन, तेरा मीठा आत्म भी क्रूर:
  उस कला को अब दुनिया का ताजा आभूषण कहा जाता है,
  और केवल भयंकर झरने के लिए झुंड,
  आपकी अपनी कली के भीतर आपकी सामग्री,
  और टेंडर चुरल मेकस्ट ############ डिंग था:
    दुनिया पर दया करो, वरना # ############ हो,
    दुनिया के कारण खाने के लिए, बी ############ और आप।


                     2
  जब चालीस सर्दियाँ तेरे माथे को घेरेगी,
  और तेरा सौंदर्य के क्षेत्र में गहरी खाई खोदो,
  तेरा यौवन गर्व गर्व अब तक,
  आयोजित एक छोटे से खरपतवार का खरपतवार होगा:  
  तब पूछा जा रहा है, जहां तुम्हारा सारा सौंदर्य निहित है,
  जहाँ तेरी रसीली दिनों का सारा खजाना;
  अपनी गहरी धँसी आँखों के भीतर कहने के लिए,
  एक सब खाने वाली शर्म थी, और थकाऊ प्रशंसा।
  आपकी सुंदरता के उपयोग के लिए कितनी अधिक प्रशंसा की हकदार थी,
  यदि आप उत्तर दे सकते हैं 'मेरा यह निष्पक्ष बच्चा है
  मेरी गिनती करोगे, और मेरे पुराने बहाने बनाओगे '
  उत्तराधिकार से उनकी सुंदरता साबित होती है।
    जब तुम पुराने हो, तब यह नया बना था।
    और जब आप इसे ठंडा महसूस करते हैं तो अपना खून गर्म देखें।


                     3
  अपने गिलास में देखो और चेहरा बताओ
  अब समय आ गया है कि चेहरे को एक और रूप दिया जाए,
  जिसकी ताजा मरम्मत अगर अब आप नहीं करेंगे,
  तू दुनिया को बेगुनाह करता है, कुछ माँ को बेपर्दा करता है।
  कहाँ के लिए वह इतनी निष्पक्ष है जिसका गर्भ है
  अपने पति के तिरस्कार का तिरस्कार करती है?
  या वह कौन है जो कब्र का शौकीन हो,
  पोस्टपैरिटी को रोकने के लिए उसके आत्म-प्रेम का?  
  तू अपनी माँ का गिलास और वह तुझ में है
  अपने प्राइम के प्यारे अप्रैल को वापस बुलाती है,
  इसलिए तू अपने युग की खिड़कियों से देख,
  ########### के बावजूद आपका सुनहरा समय है।
    लेकिन अगर th ############# को नहीं होने का अपमान किया जाए
    Die singl ############ छवि आपके साथ मर जाती है।

सुंदर उत्पादन

 निष्पक्ष प्राणियों से हम वृद्धि की इच्छा करते हैं,
  जिससे सुंदरता के गुलाब कभी न मरें,
  लेकिन जैसा कि राइपर को समय कम हो जाना चाहिए,
  उनकी निविदा को उनकी स्मृति को सहन करना चाहिए:
  लेकिन तुम सब अपनी चमकती हुई आंखें मलते हो,
  फीड'स्ट वें प्रोविंग या एम-एफ़ विथ सेल्फ-फ्यूल फ्यूल,
  अकाल बनाना जहाँ बहुतायत निहित है,
  तेरा तेरा दुश्मन, तेरा मीठा आत्म भी क्रूर:
  उस कला को अब दुनिया का ताजा आभूषण कहा जाता है,
  और केवल भयंकर झरने के लिए झुंड,
  आपकी अपनी कली के भीतर आपकी सामग्री,
  और निविदा churl mak'st वह था मेरे डिंग:
    दुनिया पर दया करो, वरना हो सकता है,
    दुनिया का नियत समय खाने के लिए, अपनी और इसलिए बीटी।


                     2
  जब चालीस सर्दियाँ तेरे माथे को घेरेगी,
  और तेरा सौंदर्य के क्षेत्र में गहरी खाई खोदो,
  तेरा यौवन गर्व गर्व अब तक,
  आयोजित एक छोटे से खरपतवार का खरपतवार होगा:  
  तब पूछा जा रहा है, जहां तुम्हारा सारा सौंदर्य निहित है,
  जहाँ तेरी रसीली दिनों का सारा खजाना;
  अपनी गहरी धँसी आँखों के भीतर कहने के लिए,
  एक सब खाने वाली शर्म थी, और थकाऊ प्रशंसा।
  आपकी सुंदरता के उपयोग के लिए कितनी अधिक प्रशंसा की हकदार थी,
  यदि आप उत्तर दे सकते हैं 'मेरा यह निष्पक्ष बच्चा है
  मेरी गिनती करोगे, और मेरे पुराने बहाने बनाओगे '
  उत्तराधिकार से उनकी सुंदरता साबित होती है।
    जब तुम पुराने हो, तब यह नया बना था।
    और जब आप इसे ठंडा महसूस करते हैं तो अपना खून गर्म देखें।


                     3
  अपने गिलास में देखो और चेहरा बताओ
  अब समय आ गया है कि चेहरे को एक और रूप दिया जाए,
  जिसकी ताजा मरम्मत अगर अब आप नहीं करेंगे,
  तू दुनिया को बेगुनाह करता है, कुछ माँ को बेपर्दा करता है।
  कहाँ के लिए वह इतनी निष्पक्ष है जिसका गर्भ है
  अपने पति के तिरस्कार का तिरस्कार करती है?
  या वह कौन है जो कब्र का शौकीन हो,
  पोस्टपैरिटी को रोकने के लिए उसके आत्म-प्रेम का?  
  तू अपनी माँ का गिलास और वह तुझ में है
  अपने प्राइम के प्यारे अप्रैल को वापस बुलाती है,
  इसलिए तू अपने युग की खिड़कियों से देख,
  देखो के बावजूद तेरा सुनहरा समय है।
    लेकिन जब वें हो, mbered नहीं होने के लिए,
    मरो singl मरम्मत छवि तुम्हारे साथ मर जाता है।

अगर मैं ऐसा कहूं तो अंतिम दो पंक्तियाँ गहरी काव्यात्मक हैं। यह Gettysburg पते पर भी शानदार प्रदर्शन करता है।

But, in a larger sense, we can not dedicate, we can not consecrate, we can not
hallow this ground. The brave men, living and dead, who struggled here, have
consecrated it, far above our poor power to add or detract. The world will
little note, nor long remember what we say here, but it can never forget what
they did here. It is for us the living, rather, to be dedicated here to the
unfinished work which they who fought here h to of rather us of advanced. It
is rather for us to be here dedicated to the who be it, vain who before us 
that from these honored dead we take increas be dead the the what use for which
they gave the last full measure of devotion  dead government The solve that
these dead shall not have died in vain that  the take nor world , shall have
a new birth of freedom and that government of the people, by the people, for
the people, shall not perish from the earth.


चलो देखते हैं कि शेक्सपियर टिक क्या करता है। यहाँ कोड है। अनिवार्य रूप से वह इनपुट से शब्दावली आधार बनाने का प्रयास करता है। फिर वह इन शब्दों का उपयोग करता है और उन्हें बेतरतीब ढंग से छेद में रखता है (यह सुनिश्चित करता है कि यह अच्छी तरह से फिट बैठता है)। वह नियतात्मक है क्योंकि वह यादृच्छिकता के लिए एक निश्चित बीज का उपयोग करता है।

package stuff;

import java.io.File;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Iterator;
import java.util.Random;
import java.util.Scanner;
import java.util.Stack;

/**
 *
 * @author rohan
 */
public class PatchTheParagraph {

    /**
     * @param args the command line arguments
     */
    public static void main(String[] args) {
Scanner in = new Scanner(System.in);
System.out.println("File Name :");
        String[] text = getWordsFromFile(in.nextLine());
System.out.println("==ORIGINAL==");
        for(String s:text){
    System.out.println(s);
}
                    int lengthOfHole= 0;
        int rows = 0;
            for(String s: text){
                s = s.replaceAll("[^#]", "");

//      System.out.println(s);
                if(s.length()>0){
                    lengthOfHole = s.length();
                rows++;
                }
            }
            ArrayList<String> words = new ArrayList<>();
            words.add("I");
            for(String s:text){
                String[] w = s.replaceAll("#", " ").split(" ");
for(String a :w){
    words.add(a);
            }

            }
                        Iterator<String> j = words.iterator();
            while(j.hasNext()){
                String o;
                if((o = j.next()).equals("")){
                    j.remove();
                }
            }
            System.out.println(words);
            Stack<String> out = new Stack<>();
            String hashRow = "";
            for(int i = 0;i<lengthOfHole;i++){
                hashRow+="#";
            }

        for(int i = 0;i<rows;i++){
            int length = lengthOfHole-1; 
            String outPut = " ";
            while(length>2){
String wordAttempt = words.get(getRandom(words.size()-1));
while(wordAttempt.length()>length-1){
 wordAttempt = words.get(getRandom(words.size()-1));
}           
length -= wordAttempt.length()+1;
            outPut+=wordAttempt;
                outPut+=" ";
            }
        out.push(outPut);
    }
System.out.println("==PATCHED==");
        for(String s : text){
            if(s.contains(hashRow)){
                System.out.println(s.replaceAll(hashRow,out.pop()));
            }else{
                System.out.println(s);
            }
        }
                                    }
public static final Random r = new Random(42);
    public static int getRandom(int max){
    return (int) (max*r.nextDouble());
}
    /**
     *
     * @param fileName is the path to the file or just the name if it is local
     * @return the number of lines in fileName
     */
    public static int getLengthOfFile(String fileName) {
        int length = 0;
        try {
            File textFile = new File(fileName);
            Scanner sc = new Scanner(textFile);
            while (sc.hasNextLine()) {
                sc.nextLine();
                length++;
            }
        } catch (Exception e) {
System.err.println(e);
        }
        return length;
    }

    /**
     *
     * @param fileName is the path to the file or just the name if it is local
     * @return an array of Strings where each string is one line from the file
     * fileName.
     */
    public static String[] getWordsFromFile(String fileName) {
        int lengthOfFile = getLengthOfFile(fileName);
        String[] wordBank = new String[lengthOfFile];
        int i = 0;
        try {
            File textFile = new File(fileName);
            Scanner sc = new Scanner(textFile);
            for (i = 0; i < lengthOfFile; i++) {
                wordBank[i] = sc.nextLine();
            }
            return wordBank;
        } catch (Exception e) {
            System.err.println(e);
            System.exit(55);
        }
        return null;
    }
}


शेक्सपियर की अधिकांश कविता सार्वजनिक डोमेन है।


टिप्पणियाँ विस्तारित चर्चा के लिए नहीं हैं; इस वार्तालाप को बातचीत में स्थानांतरित कर दिया गया है ।
डेनिस

3

पायथन 2.7

एक अलग दृष्टिकोण के साथ एक और पायथन समाधान। मेरा कार्यक्रम पाठ को मार्कोव श्रृंखला के रूप में देखता है , जहां प्रत्येक अक्षर एक निश्चित संभावना के साथ दूसरे अक्षर का अनुसरण करता है। तो पहला कदम संभावनाओं की तालिका का निर्माण करना है। अगला कदम पैच के लिए उस संभावनाओं को लागू करना है।

एक नमूना पाठ सहित पूरा कोड नीचे है। क्योंकि एक उदाहरण में यूनिकोड वर्ण का उपयोग किया गया था, मैंने उस उदाहरण के साथ संगतता के लिए एक स्पष्ट कोडपेज (utf-8) शामिल किया।

#!/usr/bin/env python
# -*- coding: utf-8 -*-

from collections import defaultdict
import numpy

texts = [
"""'Twas brillig, and the slithy toves
Did gyre a######### in the wabe;
All mimsy #########borogoves,
And the mome raths outgrabe."""
]

class Patcher:
    def __init__(self):
        self.mapper = defaultdict(lambda: defaultdict(int))

    def add_mapping(self, from_value, to_value):
        self.mapper[from_value][to_value] += 1

    def get_patch(self, from_value):
        if from_value in self.mapper:
            sum_freq = sum(self.mapper[from_value].values())
            return numpy.random.choice(
                self.mapper[from_value].keys(),
                p = numpy.array(
                    self.mapper[from_value].values(),dtype=numpy.float64) / sum_freq)
        else:
            return None

def add_text_mappings(text_string, patcher = Patcher(), ignore_characters = ''):
    previous_letter = text_string[0]
    for letter in text_string[1:]:
        if not letter in ignore_characters:
            patcher.add_mapping(previous_letter, letter)
            previous_letter = letter
    patcher.add_mapping(text_string[-1], '\n')

def patch_text(text_string, patcher, patch_characters = '#'):
    result = previous_letter = text_string[0]
    for letter in text_string[1:]:
        if letter in patch_characters:
            result += patcher.get_patch(previous_letter)
        else:
            result += letter
        previous_letter = result[-1]
    return result

def main():
    for text in texts:
        patcher = Patcher()
        add_text_mappings(text, patcher, '#')
        print patch_text(text, patcher, '#')
        print "\n"

if __name__ == '__main__':
    main()

लोरम इप्सम के लिए नमूना उत्पादन:

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do
eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim
ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut
aliquip ex ea commodo conse Exe eut ccadamairure dolor in reprehenderit
in voluptate velit esse cilore indipserexepgiat nulla pariatur. Excepteur
sint occaecat cupidatat non upir alostat adin culpa qui officia deserunt
mollit anim id est laborum.

Jabberwocky में एक अतिरिक्त काव्य पंक्ति:

'Twas brillig, and the slithy toves
Did gyre and me the in the wabe;
All mimsy was
An inborogoves,
And the mome raths outgrabe.

किस उदाहरण के पाठ में यूनिकोड है? वे सभी सीधे ASCII होना चाहिए। कृपया मुझे बताएं, और मैं इसे सही करूंगा।
AdmBorkBork

Python ने पहले पाठ में PEP 263 का उल्लेख करते हुए mınxoma about के बारे में शिकायत की ।
agtoever

आह - एहसास भी नहीं हुआ। मैंने संपादित किया है कि सीधे ASCII हो। मुझे बताने के लिए धन्यवाद!
AdmBorkBork

2

सी # 5 बड़े पैमाने पर हमेशा की तरह

मैंने इसे एक साथ फेंक दिया, यह थोड़ा गड़बड़ है, लेकिन यह कुछ समय के कुछ ठीक परिणाम पैदा करता है। यह एक ज्यादातर नियतात्मक एल्गोरिथ्म है, लेकिन कुछ (निश्चित-बीज) यादृच्छिकता के साथ इसे समान अंतराल के लिए एक ही स्ट्रिंग का उत्पादन करने से बचने के लिए जोड़ा गया। यह अंतराल के दोनों ओर रिक्त स्थान के स्तंभ होने से बचने के लिए कुछ प्रयास करने के लिए जाता है।

यह इनपुट को शब्दों में बदलकर काम करता है और विराम चिह्न (विराम चिह्न मैन्युअल रूप से दर्ज की गई सूची से आता है, क्योंकि मुझे काम करने के लिए परेशान नहीं किया जा सकता है यदि यूनिकोड मेरे लिए ऐसा कर सकता है), ताकि यह शब्दों से पहले रिक्त स्थान डाल सके, और इससे पहले नहीं। विराम चिह्न, क्योंकि यह काफी विशिष्ट है। यह विशिष्ट व्हाट्सएप पर विभाजित होता है। मार्कोव चेन (मुझे लगता है) की नस में, यह गिनता है कि प्रत्येक टोकन कितनी बार एक दूसरे के टोकन का अनुसरण करता है , और फिर इसके लिए संभावनाओं की गणना नहीं करता है (मुझे लगता है कि क्योंकि दस्तावेज़ बहुत छोटे हैं, हम चीजों के प्रति पूर्वाग्रह करना बेहतर करेंगे। हम बहुत कुछ देखते हैं जहां हम कर सकते हैं)। फिर हम चौड़ाई और बाईं ओर के 'आंशिक' शब्दों को छोड़कर, लागत के साथ गणना की जा रही है -fabness(last, cur) * len(cur_with_space), जहां fabnessसमय की संख्या का curपालन ​​किया है के साथ एक चौड़ाई पहली खोज करते हैं,lastउत्पन्न स्ट्रिंग में प्रत्येक संलग्न टोकन के लिए। स्वाभाविक रूप से, हम लागत को कम करने की कोशिश करते हैं। क्योंकि हम हमेशा दस्तावेज़ में पाए गए शब्दों और विराम चिह्न के साथ अंतर को नहीं भर सकते हैं, यह कुछ राज्यों से 'विशेष' टोकन की संख्या पर भी विचार करता है, जिसमें दोनों तरफ आंशिक तार शामिल हैं, जिसे हम मनमाने ढंग से बढ़ी लागत के साथ पूर्वाग्रह करते हैं।

यदि बीएफएस एक समाधान खोजने में विफल रहता है, तो हम भोलेपन से एक यादृच्छिक क्रिया विशेषण लेने की कोशिश करते हैं, या केवल स्थान भरने के लिए रिक्त स्थान सम्मिलित करते हैं।

परिणाम

सभी 6 यहां देखे जा सकते हैं: https://gist.github.com/anonymous/5277db726d3f9bdd950b173b19fec82a

यूक्लिड टेस्ट-केस बहुत अच्छा नहीं चला ...

छवि को पैच करें

In a popular image editing software there is a feature, that patches (The term
used in image processing is inpainting as @minxomat pointed out.) a selected
area of an image, that patches information outside of that patch. And it does a
quite good job, co the patch a is just a program. As a human, you can sometimes
see that something In a short it if you squeeze your eyes or just take a short
glance, the patch seems to fill in the gap quite well.

Jabberwocky

'Twas brillig, and the slithy toves
Did gyre and the in in the wabe;
All mimsy the mome borogoves,
And the mome raths outgrabe.

बिज्जू

Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Mushroom, mushroom, a-
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Mushroom, badger, badger
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Mush-mushroom, a
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Argh! Snake, a snake!
Snaaake! A snaaaake, oooh its a snake!

_ मुझे खुशी है कि यह कैसे निकला ... यह सौभाग्य है कि "बेजर, बेजर," फिट बैठता है, या किसी ने भी ऐसा नहीं किया होगा

कोड

इसे लेकर चलें

csc ParaPatch.cs
ParaPatch.exe infile outfile

इसमें काफी कुछ है। केवल दूर से दिलचस्प बिट Fillविधि है। मैं हीप कार्यान्वयन को शामिल करता हूं, क्योंकि .NET में एक (WHY MS WHY ?!) क्यों नहीं है।

using System;
using System.Collections.Generic;
using System.Linq;

namespace ParaPatch
{
    class Program
    {
        private static string[] Filler = new string[] { "may", "will", "maybe", "rather", "perhaps", "reliably", "nineword?", "definitely", "elevenword?", "inexplicably" }; // adverbs
        private static char[] Breaking = new char[] { ' ', '\n', '\r', '\t' };
        private static char[] Punctuation = new char[] { ',', '.', '{', '}', '(', ')', '/', '?', ':', ';', '\'', '\\', '"', ',', '!', '-', '+', '[', ']', '£', '$', '%', '^', '—' };

        private static IEnumerable<string> TokenizeStream(System.IO.StreamReader reader)
        {
            System.Text.StringBuilder sb = new System.Text.StringBuilder();

            HashSet<char> breaking = new HashSet<char>(Breaking);
            HashSet<char> punctuation = new HashSet<char>(Punctuation);

            while (!reader.EndOfStream)
            {
                int ci = reader.Read();
                if (ci == -1) // sanity
                    break;

                char c = (char)ci;

                if (breaking.Contains(c))
                {
                    if (sb.Length > 0)
                        yield return sb.ToString();
                    sb.Clear();
                }
                else if (punctuation.Contains(c))
                {
                    if (sb.Length > 0)
                        yield return sb.ToString();
                    yield return ""+c;
                    sb.Clear();
                }
                else
                {

                    sb.Append(c);
                }
            }

            if (sb.Length > 0)
                yield return sb.ToString();
        }

        private enum DocTokenTypes
        {
            Known,
            LeftPartial,
            RightPartial,
            Unknown,
        }

        private class DocToken
        {
            public DocTokenTypes TokenType { get; private set; }
            public string StringPart { get; private set; }
            public int Length { get; private set; }

            public DocToken(DocTokenTypes tokenType, string stringPart, int length)
            {
                TokenType = tokenType;
                StringPart = stringPart;
                Length = length;
            }
        }

        private static IEnumerable<DocToken> DocumentTokens(IEnumerable<string> tokens)
        {
            foreach (string token in tokens)
            {
                if (token.Contains("#"))
                {
                    int l = token.IndexOf("#");
                    int r = token.LastIndexOf("#");

                    if (l > 0)
                        yield return new DocToken(DocTokenTypes.LeftPartial, token.Substring(0, l), l);

                    yield return new DocToken(DocTokenTypes.Unknown, null, r - l + 1);

                    if (r < token.Length - 1)
                        yield return new DocToken(DocTokenTypes.RightPartial, token.Substring(r + 1), token.Length - r - 1);
                }
                else
                    yield return new DocToken(DocTokenTypes.Known, token, token.Length);
            }
        }

        private class State : IComparable<State>
        {
            // missing readonly params already... maybe C#6 isn't so bad
            public int Remaining { get; private set; }
            public int Position { get; private set; }
            public State Prev { get; private set; }
            public string Token { get; private set; }
            public double H { get; private set; }
            public double Fabness { get; private set; }
            public string FullFilling { get; private set; }

            public State(int remaining, int position, Program.State prev, double fabness, double h, string token, string toAdd)
            {
                Remaining = remaining;
                Position = position;
                Prev = prev;
                H = h;
                Fabness = fabness;
                Token = token;

                FullFilling = prev != null ? prev.FullFilling + toAdd : toAdd;
            }

            public int CompareTo(State other)
            {
                return H.CompareTo(other.H);
            }
        }

        public static void Main(string[] args)
        {
            if (args.Length < 2)
                args = new string[] { "test.txt", "testout.txt" };

            List<DocToken> document;
            using (System.IO.StreamReader reader = new System.IO.StreamReader(args[0], System.Text.Encoding.UTF8))
            {
                document = DocumentTokens(TokenizeStream(reader)).ToList();
            }

            foreach (DocToken cur in document)
            {
                Console.WriteLine(cur.StringPart + " " + cur.TokenType);
            }

            // these are small docs, don't bother with more than 1 ply
            Dictionary<string, Dictionary<string, int>> FollowCounts = new Dictionary<string, Dictionary<string, int>>();
            Dictionary<string, Dictionary<string, int>> PreceedCounts = new Dictionary<string, Dictionary<string, int>>(); // mirror (might be useful)

            HashSet<string> knowns = new HashSet<string>(); // useful to have lying around

            // build counts
            DocToken last = null;
            foreach (DocToken cur in document)
            {
                if (cur.TokenType == DocTokenTypes.Known)
                {
                    knowns.Add(cur.StringPart);
                }

                if (last != null && last.TokenType == DocTokenTypes.Known && cur.TokenType == DocTokenTypes.Known)
                {
                    {
                        Dictionary<string, int> ltable;
                        if (!FollowCounts.TryGetValue(last.StringPart, out ltable))
                        {
                            FollowCounts.Add(last.StringPart, ltable = new Dictionary<string, int>());
                        }

                        int count;
                        if (!ltable.TryGetValue(cur.StringPart, out count))
                        {
                            count = 0;
                        }
                        ltable[cur.StringPart] = count + 1;
                    }


                    {
                        Dictionary<string, int> ctable;
                        if (!PreceedCounts.TryGetValue(cur.StringPart, out ctable))
                        {
                            PreceedCounts.Add(cur.StringPart, ctable = new Dictionary<string, int>());
                        }

                        int count;
                        if (!ctable.TryGetValue(last.StringPart, out count))
                        {
                            count = 0;
                        }
                        ctable[last.StringPart] = count + 1;
                    }
                }

                last = cur;
            }

            // build probability grid (none of this efficient table filling dynamic programming nonsense, A* all the way!)
            // hmm... can't be bothered
            Dictionary<string, Dictionary<string, double>> fabTable = new Dictionary<string, Dictionary<string, double>>();
            foreach (var k in FollowCounts)
            {
                Dictionary<string, double> t = new Dictionary<string, double>();

                // very naive
                foreach (var k2 in k.Value)
                {
                    t.Add(k2.Key, (double)k2.Value);
                }

                fabTable.Add(k.Key, t);
            }

            string[] knarr = knowns.ToArray();
            Random rnd = new Random("ParaPatch".GetHashCode());

            List<string> fillings = new List<string>();
            for (int i = 0; i < document.Count; i++)
            {
                if (document[i].TokenType == DocTokenTypes.Unknown)
                {
                    // shuffle knarr
                    for (int j = 0; j < knarr.Length; j++)
                    {
                        string t = knarr[j];
                        int o = rnd.Next(knarr.Length);
                        knarr[j] = knarr[o];
                        knarr[o] = t;
                    }

                    fillings.Add(Fill(document, fabTable, knarr, i));
                    Console.WriteLine(fillings.Last());
                }
            }

            string filling = string.Join("", fillings);

            int fi = 0;

            using (System.IO.StreamWriter writer = new System.IO.StreamWriter(args[1]))
            using (System.IO.StreamReader reader = new System.IO.StreamReader(args[0]))
            {
                while (!reader.EndOfStream)
                {
                    int ci = reader.Read();
                    if (ci == -1)
                        break;

                    char c = (char)ci;
                    c = c == '#' ? filling[fi++] : c;

                    writer.Write(c);
                    Console.Write(c);
                }
            }

//            using (System.IO.StreamWriter writer = new System.IO.StreamWriter(args[1], false, System.Text.Encoding.UTF8))
//            using (System.IO.StreamReader reader = new System.IO.StreamReader(args[0]))
//            {
//                foreach (char cc in reader.ReadToEnd())
//                {
//                    char c = cc;
//                    c = c == '#' ? filling[fi++] : c;
//                    
//                    writer.Write(c);
//                    Console.Write(c);
//                }
//            }

            if (args[0] == "test.txt")
                Console.ReadKey(true);
        }

        private static string Fill(List<DocToken> document, Dictionary<string, Dictionary<string, double>> fabTable, string[] knowns, int unknownIndex)
        {
            HashSet<char> breaking = new HashSet<char>(Breaking);
            HashSet<char> punctuation = new HashSet<char>(Punctuation);

            Heap<State> due = new Heap<Program.State>(knowns.Length);

            Func<string, string, double> fabness = (prev, next) =>
            {
                Dictionary<string, double> table;
                if (!fabTable.TryGetValue(prev, out table))
                    return 0; // not fab
                double fab;
                if (!table.TryGetValue(next, out fab))
                    return 0; // not fab
                return fab; // yes fab
            };

            DocToken mostLeft = unknownIndex > 2 ? document[unknownIndex - 2] : null;
            DocToken left = unknownIndex > 1 ? document[unknownIndex - 1] : null;
            DocToken unknown = document[unknownIndex];
            DocToken right = unknownIndex < document.Count - 2 ? document[unknownIndex + 1] : null;
            DocToken mostRight = unknownIndex < document.Count - 3 ? document[unknownIndex + 2] : null;

            // sum of empty space and partials' lengths
            int spaceSize = document[unknownIndex].Length
                + (left != null && left.TokenType == DocTokenTypes.LeftPartial ? left.Length : 0)
                + (right != null && right.TokenType == DocTokenTypes.RightPartial ? right.Length : 0);

            int l = left != null && left.TokenType == DocTokenTypes.LeftPartial ? left.Length : 0;
            int r = l + unknown.Length;

            string defaultPrev =
                left != null && left.TokenType == DocTokenTypes.Known ? left.StringPart :
                mostLeft != null && mostLeft.TokenType == DocTokenTypes.Known ? mostLeft.StringPart :
                "";

            string defaultLast =
                right != null && right.TokenType == DocTokenTypes.Known ? right.StringPart :
                mostRight != null && mostRight.TokenType == DocTokenTypes.Known ? mostRight.StringPart :
                "";

            Func<string, string> topAndTail = str =>
            {
                return str.Substring(l, r - l);
            };

            Func<State, string, double, bool> tryMove = (State prev, string token, double specialFabness) => 
            {
                bool isPunctionuation = token.Length == 1 && punctuation.Contains(token[0]);
                string addStr = isPunctionuation || prev == null ? token : " " + token;
                int addLen = addStr.Length;

                int newRemaining = prev != null ? prev.Remaining - addLen : spaceSize - addLen;
                int oldPosition = prev != null ? prev.Position : 0;
                int newPosition = oldPosition + addLen;

                // check length
                if (newRemaining < 0)
                    return false;

                // check start
                if (oldPosition < l) // implies left is LeftPartial
                {
                    int s = oldPosition;
                    int e = newPosition > l ? l : newPosition;
                    int len = e - s;
                    if (addStr.Substring(0, len) != left.StringPart.Substring(s, len))
                        return false; // doesn't match LeftPartial
                }

                // check end
                if (newPosition > r) // implies right is RightPartial
                {
                    int s = oldPosition > r ? oldPosition : r;
                    int e = newPosition;
                    int len = e - s;
                    if (addStr.Substring(s - oldPosition, len) != right.StringPart.Substring(s - r, len))
                        return false; // doesn't match RightPartial
                }

                if (newRemaining == 0)
                {
                    // could try to do something here (need to change H)
                }

                string prevToken = prev != null ? prev.Token : defaultPrev;
                bool isLastunctionuation = prevToken.Length == 1 && punctuation.Contains(prevToken[0]);

                if (isLastunctionuation && isPunctionuation) // I hate this check, it's too aggresive to be realistic
                    specialFabness -= 50;

                double fab = fabness(prevToken, token);

                if (fab < 1 && (token == prevToken))
                    fab = -1; // bias against unrecognised repeats

                double newFabness = (prev != null ? prev.Fabness : 0.0)
                    - specialFabness // ... whatever this is
                    - fab * addLen; // how probabilistic

                double h = newFabness; // no h for now

                State newState = new Program.State(newRemaining, newPosition, prev, newFabness, h, token, addStr);

//                Console.WriteLine((prev != null ? prev.Fabness : 0) + "\t" + specialFabness);
//                Console.WriteLine(newFabness + "\t" + h + "\t" + due.Count + "\t" + fab + "*" + addLen + "\t" + newState.FullFilling);

                due.Add(newState);
                return true;
            };

            // just try everything everything
            foreach (string t in knowns)
                tryMove(null, t, 0);

            if (left != null && left.TokenType == DocTokenTypes.LeftPartial)
                tryMove(null, left.StringPart, -1);

            while (!due.Empty)
            {
                State next = due.RemoveMin();

                if (next.Remaining == 0)
                {
                    // we have a winner!!
                    return topAndTail(next.FullFilling);
                }

                // just try everything
                foreach (string t in knowns)
                    tryMove(next, t, 0);
                if (right != null && right.TokenType == DocTokenTypes.RightPartial)
                    tryMove(next, right.StringPart, -5); // big bias
            }

            // make this a tad less stupid, non?
            return Filler.FirstOrDefault(f => f.Length == unknown.Length) ?? new String(' ', unknown.Length); // oh dear...
        }
    }

    //
    // Ultilities
    //

    public class Heap<T> : System.Collections.IEnumerable where T : IComparable<T>
    {
        // arr is treated as offset by 1, all idxes stored need to be -1'd to get index in arr
        private T[] arr;
        private int end = 0;

        private void s(int idx, T val)
        {
            arr[idx - 1] = val;
        }

        private T g(int idx)
        {
            return arr[idx - 1];
        }

        public Heap(int isize)
        {
            if (isize < 1)
                throw new ArgumentException("Cannot be less than 1", "isize");

            arr = new T[isize];
        }

        private int up(int idx)
        {
            return idx / 2;
        }

        private int downLeft(int idx)
        {
            return idx * 2;
        }

        private int downRight(int idx)
        {
            return idx * 2 + 1;
        }

        private void swap(int a, int b)
        {
            T t = g(a);
            s(a, g(b));
            s(b, t);
        }

        private void moveUp(int idx, T t)
        {
        again:
            if (idx == 1)
            {
                s(1, t);
                return; // at end
            }

            int nextUp = up(idx);
            T n = g(nextUp);
            if (n.CompareTo(t) > 0)
            {
                s(idx, n);
                idx = nextUp;
                goto again;
            }
            else
            {
                s(idx, t);
            }
        }

        private void moveDown(int idx, T t)
        {
        again:
            int nextLeft = downLeft(idx);
            int nextRight = downRight(idx);

            if (nextLeft > end)
            {
                s(idx, t);
                return; // at end
            }
            else if (nextLeft == end)
            { // only need to check left
                T l = g(nextLeft);

                if (l.CompareTo(t) < 0)
                {
                    s(idx, l);
                    idx = nextLeft;
                    goto again;
                }
                else
                {
                    s(idx, t);
                }
            }
            else
            { // check both
                T l = g(nextLeft);
                T r = g(nextRight);

                if (l.CompareTo(r) < 0)
                { // left smaller (favour going right if we can)
                    if (l.CompareTo(t) < 0)
                    {
                        s(idx, l);
                        idx = nextLeft;
                        goto again;
                    }
                    else
                    {
                        s(idx, t);
                    }
                }
                else
                { // right smaller or same
                    if (r.CompareTo(t) < 0)
                    {
                        s(idx, r);
                        idx = nextRight;
                        goto again;
                    }
                    else
                    {
                        s(idx, t);
                    }
                }
            }
        }

        public void Clear()
        {
            end = 0;
        }

        public void Trim()
        {
            if (end == 0)
                arr = new T[1]; // don't /ever/ make arr len 0
            else
            {
                T[] narr = new T[end];
                for (int i = 0; i < end; i++)
                    narr[i] = arr[i];
                arr = narr;
            }
        }

        private void doubleSize()
        {
            T[] narr = new T[arr.Length * 2];
            for (int i = 0; i < end; i++)
                narr[i] = arr[i];
            arr = narr;
        }

        public void Add(T item)
        {
            if (end == arr.Length)
            {
                // resize
                doubleSize();
            }

            end++;
            moveUp(end, item);
        }

        public T RemoveMin()
        {
            if (end < 1)
                throw new Exception("No items, mate.");

            T min = g(1);

            end--;
            if (end > 0)
                moveDown(1, g(end + 1));

            return min;
        }

        public bool Empty
        {
            get
            {
                return end == 0;
            }
        }

        public int Count
        {
            get
            {
                return end;
            }
        }

        System.Collections.IEnumerator System.Collections.IEnumerable.GetEnumerator()
        {
            return GetEnumerator();
        }

        public IEnumerator<T> GetEnumerator()
        {
            return (IEnumerator<T>)arr.GetEnumerator();
        }
    }
}
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.