नदियों से बचना


48

पृष्ठभूमि

टाइपोग्राफी में, नदियां पाठ के एक खंड में दृश्य अंतराल हैं, जो रिक्त स्थान के संयोग संरेखण के कारण होती हैं। ये विशेष रूप से कष्टप्रद हैं क्योंकि आपका मस्तिष्क उन्हें परिधीय दृष्टि में अधिक आसानी से उठाता है, जो लगातार आपकी आंखों को विचलित करता है।

एक उदाहरण के रूप में, पाठ के निम्नलिखित ब्लॉक को लें, लाइनें ऐसी टूटीं कि लाइन की चौड़ाई 82 वर्णों से अधिक न हो :

Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eismod tempor
incididunt ut labore et dolore maga aliqua. Ut enim ad minim veniam, quis nostrud
exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute
irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla
pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui
officia deserunt mollit anim id est laborum. Lorem ipsum dolor sit amet,
consectetur adipisicing elit, sed do eismod tempor incididunt ut labore et dolore
maga aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris
nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in
voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint
occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id
est laborum.

नीचे दाहिने भाग में छह पंक्तियों में फैली एक नदी है, जिसे मैंने निम्नलिखित ब्लॉक में हाइलाइट किया है:

Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eismod tempor
incididunt ut labore et dolore maga aliqua. Ut enim ad minim veniam, quis nostrud
exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute
irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla
pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui
officia deserunt mollit anim id est laborum. Lorem█ipsum dolor sit amet,
consectetur adipisicing elit, sed do eismod tempor█incididunt ut labore et dolore
maga aliqua. Ut enim ad minim veniam, quis nostrud█exercitation ullamco laboris
nisi ut aliquip ex ea commodo consequat. Duis aute█irure dolor in reprehenderit in
voluptate velit esse cillum dolore eu fugiat nulla█pariatur. Excepteur sint
occaecat cupidatat non proident, sunt in culpa qui█officia deserunt mollit anim id
est laborum.

हम थोड़ा अलग कॉलम चौड़ाई चुनकर इसे कम कर सकते हैं। उदाहरण के लिए, यदि हम 78 अक्षरों से अधिक रेखाओं का उपयोग करके एक ही पाठ को लेआउट करते हैं , तो दो पंक्तियों से अधिक लंबी कोई नदी नहीं है:

Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eismod tempor
incididunt ut labore et dolore maga aliqua. Ut enim ad minim veniam, quis
nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore
eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt
in culpa qui officia deserunt mollit anim id est laborum. Lorem ipsum dolor
sit amet, consectetur adipisicing elit, sed do eismod tempor incididunt ut
labore et dolore maga aliqua. Ut enim ad minim veniam, quis nostrud
exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis
aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu
fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in
culpa qui officia deserunt mollit anim id est laborum.

ध्यान दें कि इस प्रश्न के उद्देश्य के लिए हम केवल मोनोपोज़ किए गए फोंट पर विचार कर रहे हैं, जैसे कि नदियाँ केवल रिक्त स्थान के ऊर्ध्वाधर स्तंभ हैं। एक नदी की लंबाई पंक्तियों की संख्या है जो इसे फैलाती है।

एक तरफ: यदि आप आनुपातिक फोंट में नदी का पता लगाने में दिलचस्प हैं, तो नेटवर्क के आसपास कुछ दिलचस्प पोस्ट हैं

चुनौती

आपको मुद्रण योग्य ASCII वर्ण (कोड बिंदु 0x20 से 0x7E तक) की एक स्ट्रिंग दी गई है - अर्थात एक पंक्ति। 70 और 90 अक्षरों (समावेशी) के बीच की रेखा चौड़ाई के साथ, इस पाठ को प्रिंट करें, जैसे कि अधिकतम पाठ में किसी भी नदी लंबाई कम से कम हो। यदि एक ही (न्यूनतम) अधिकतम नदी की लंबाई के साथ कई पाठ चौड़ाई हैं, तो संकीर्ण चौड़ाई चुनें। 78 अक्षरों वाला उपरोक्त उदाहरण उस पाठ के लिए सही आउटपुट है।

लाइनों को तोड़ने के लिए, आपको अंतरिक्ष के पात्रों (0x20) को लाइन ब्रेक से बदलना चाहिए, जैसे कि परिणामी लाइनों में यथासंभव अधिक वर्ण हों, लेकिन चुने हुए पाठ की चौड़ाई से अधिक नहीं। ध्यान दें कि परिणामी लाइन ब्रेक स्वयं उस गणना का हिस्सा नहीं है। एक उदाहरण के रूप में, ऊपर के अंतिम ब्लॉक में, Lorem[...]tempor78 वर्ण हैं, जो पाठ की चौड़ाई भी है।

आप मान सकते हैं कि इनपुट में लगातार स्थान नहीं होंगे, और अग्रणी या अनुगामी स्थान नहीं होंगे। आप यह भी मान सकते हैं कि किसी भी शब्द (गैर-रिक्त स्थान का लगातार प्रतिस्थापन) में 70 से अधिक वर्ण नहीं होंगे।

आप प्रोग्राम या फ़ंक्शन लिख सकते हैं, STDIN, कमांड-लाइन तर्क या फ़ंक्शन तर्क के माध्यम से इनपुट ले सकते हैं और परिणाम को STDOUT में प्रिंट कर सकते हैं।

यह कोड गोल्फ है, इसलिए सबसे छोटा उत्तर (बाइट्स में) जीतता है।


मुझे लगता है कि आपके 78 और 82 कॉलम रैप उदाहरणों में, अंतिम और दूसरी-से-अंतिम लाइनें गलत हैं। 82 उदाहरण में, अंतिम तोड़ने के बीच होना चाहिए आईडी और स्था , और 78 उदाहरण में यह के बीच होना चाहिए में और प्रमाद । या मुझ से कुछ गलत हो रहा है?
क्रिस्टियन लुपस्कु

@ ऑप्टिमाइज़र टाई ब्रेक पाठ की लंबाई है, नदी की लंबाई नहीं।
FryAmTheEggman

मुझे लगता है कि यह एक आधिकारिक नदी के रूप में नहीं गिना जाता है, लेकिन उदाहरण में 78 अक्षर अधिकतम लंबाई है, शीर्ष-ईश बाएं-ईश क्षेत्र में एक बहुत लंबी विकर्ण नदी लगती है
मार्कसवेयर

क्या हम इस तरह के मामलों पर विचार करते हैं जैसा कि नदियाँ जारी हैं?
ऑप्टिमाइज़र

बड़ी चुनौती! एचएम, अगला एक अचेतन पत्रों को आकार देने वाली (विशुद्ध रूप से ऊर्ध्वाधर नहीं) नदियों के बारे में हो सकता है;
टोबियास किन्ज़लर

जवाबों:


7

सीजेएम, 116 106 99 84 77 72 बाइट्स

l:X;93,72>{:D;OOXS/{S+_2$+,D<{+}{@@);a+\}?}/a+}%{z'K*S/:!0a/1fb$W=}$0=N*

सिंगल लाइन इनपुट लेता है और STDOUT को सही आउटपुट प्रिंट करता है।

अद्यतन : छँटाई लूप में ही सभी गणना करके एक बहुत सुधार किया और निरर्थक छोरों को हटा दिया। नदी की लंबाई गणना में एक बग भी तय किया।

स्पष्टीकरण जल्द ही (मैं इसे आगे भी गोल्फ के बाद)

इसे यहाँ आज़माएँ


@Optimizer आप ARGV से इनपुट का उपयोग कर सकते हैं, लेकिन फिर आप हर बार के ea~बजाय कर सकते हैं X। दो बाइट बचाता है।
मार्टिन एंडर

12

रूबी 162 160 158 152 160 157 ( डेमो )

i=gets+' '
(69..s=r=89).map{|c|w=i.scan(/(.{1,#{c}}\S) /).flatten
m=(0..c).map{|i|w.map{|l|l[i]}+[?x]}.join.scan(/ +/).map(&:size).max
m<s&&(s=m;r=w)}
puts r

अन-गोल्फ संस्करण:

input = gets+' '

result = ''

(69..smallest_max=89).each{|w|
  #split text into words of at most w characters
  wrap = (input+' ').scan(/(.{1,#{w}}\S) /).flatten

  #transpose lines and find biggest "river"
  max_crt_river = (0..99).map{|i| wrap.map{|l|l[i]} }.flatten.join.scan(/ +/).max_by(&:size).size

  if max_crt_river < smallest_max
    smallest_max = max_crt_river
    result = wrap.join ?\n
  end
}
puts result

@ मार्टिनबटनर %r{...}मुझे स्ट्रिंग प्रक्षेप का उपयोग करने की अनुमति देता है। मैंने अभी-अभी कोशिश की है 21.times, लेकिन सड़क के नीचे इसके कुछ और निहितार्थ हैं, और मैं एक छोटे समाधान तक पहुंचने में कामयाब नहीं हुआ हूं।
क्रिस्टियन लुपस्कू

@ MartinBüttner आप सही हैं, यह काम करता है ! मैंने अपना उत्तर संपादित कर दिया है। धन्यवाद!
क्रिस्टियन लुपस्कु


@ जोशपब्रॉन बहुत अच्छी तरह से देखा जाता है! मैंने अब इसे ठीक कर दिया।
क्रिस्टियान लुपस्कू

8

एपीएल (105)

{∊{1↓∊⍵,3⊃⎕TC}¨⊃G/⍨V=⌊/V←{⌈/≢¨⊂⍨¨↓⍉2≠⌿+\↑≢¨¨⍵}¨G←(K⊂⍨' '=K←' ',⍵)∘{×⍴⍺:(⊂z/⍺),⍵∇⍨⍺/⍨~z←⍵>+\≢¨⍺⋄⍺}¨70+⍳21}

स्पष्टीकरण:

  • (K⊂⍨' '=K←' ',⍵): सामने एक स्थान जोड़ें , फिर रिक्त स्थान पर विभाजित करें। प्रत्येक शब्द उस स्थान को बरकरार रखता है जिसके साथ वह शुरू होता है।
  • ∘{... }¨70+⍳21: उस मान के साथ, श्रेणी में प्रत्येक संख्या के लिए [71, 91]: (जिस तरह से शब्दों को विभाजित किया जाता है, प्रत्येक 'लाइन' अंत में एक अतिरिक्त स्थान के साथ समाप्त होती है, जिसे बाद में हटा दिया जाएगा। सीमा द्वारा स्थानांतरित कर दिया जाता है। अतिरिक्त स्थान की भरपाई करने के लिए।)
    • ×⍴⍺:: अगर अभी भी शब्द बाकी हैं,
      • z←⍵>+\≢¨⍺: प्रत्येक शब्द के लिए लंबाई प्राप्त करें, और प्रति शब्द, लंबाई की कुल रनिंग की गणना करें। 1उन सभी शब्दों को चिह्नित करें जिन्हें अगली पंक्ति को भरने के लिए लिया जा सकता है, और इसे इसमें संग्रहीत करें z
      • (⊂z/⍺),⍵∇⍨⍺⍨~z: उन शब्दों को लें, और फिर प्रक्रिया करें कि सूची से क्या बचा है।
    • ⋄⍺: यदि नहीं, तो लौटें (जो अब खाली है)।
  • G←: G(प्रत्येक संभावित लाइन लंबाई के लिए एक) लाइनों की सूची की दुकान ।
  • V←{... }¨G: प्रत्येक संभावना के लिए, सबसे लंबी नदी की लंबाई की गणना करें और इसमें स्टोर करें V:
    • +\↑≢¨¨⍵: प्रत्येक शब्द की लंबाई (फिर से) प्राप्त करें, और लंबाई से एक मैट्रिक्स बनाएं। मैट्रिक्स की पंक्तियों पर प्रत्येक पंक्ति के लिए चल रहे कुल की गणना करें। (इस प्रकार, प्रत्येक पंक्ति की शुरुआत में अतिरिक्त स्थान को नजरअंदाज कर दिया जाता है।)
    • 2≠⌿: मैट्रिक्स के प्रत्येक कॉलम के लिए, देखें कि उस बिंदु पर लाइन की वर्तमान लंबाई उसके बाद लाइन से मेल नहीं खाती है या नहीं। यदि हां, तो वहाँ नहीं एक नदी वहाँ।
    • ⊂⍨¨↓⍉: मैट्रिक्स के प्रत्येक कॉलम को स्वयं ( 1एस पर) विभाजित करें । यह सूचियों की एक सूची देता है, जहां प्रत्येक नदी के लिए नदी [1, 0, 0, ...]की लंबाई के आधार पर एक सूची होगी । अगर नदी नहीं है, तो सूची होगी [1]
    • ⌈/≢¨: प्रत्येक नदी की लंबाई प्राप्त करें, और उस का अधिकतम मूल्य प्राप्त करें।
  • ⊃G/⍨V=⌊/V: से G, पहले आइटम का चयन करें, जिसके लिए सबसे लंबी नदी की लंबाई सभी वस्तुओं के लिए न्यूनतम के बराबर है।
  • {1↓∊⍵,3⊃⎕TC}¨: प्रत्येक पंक्ति के लिए, सभी शब्दों को एक साथ जोड़ दें, मुट्ठी की वस्तु (शुरुआत से अतिरिक्त स्थान) को हटा दें, और अंत में एक नई पंक्ति जोड़ें।
  • : सभी लाइनों को एक साथ जोड़ दें।

यह 200 बाइट्स है, न कि 105.
user11153

3
@ user11153 मैंने एन्कोडिंग के रूप में UTF-8 निर्दिष्ट नहीं किया है। APL वर्ण सेट एक एकल कोडपेज (और उस कोडपेज में मौजूद है ) में फिट बैठता है , यानी एक मौजूदा एन्कोडिंग है, जिसके द्वारा उन वर्णों में से प्रत्येक एक बाइट में फिट बैठता है, और इसलिए 105 पूरी तरह से ठीक है।
मार्टिन एंडर

जानकार अच्छा लगा! :)
user11153

8

बैश + कोरुटिल्स, 236 157 बाइट्स

एक अलग दृष्टिकोण के साथ संपादित - पहले की तुलना में थोड़ा कम:

a=(`for i in {71..91};{
for((b=1;b++<i;));{
fold -s$i<<<$@|cut -b$b|uniq -c|sort -nr|grep -m1 "[0-9]  "
}|sort -nr|sed q
}|nl -v71|sort -nk2`)
fold -s$a<<<$@

कमांड लाइन से इनपुट स्ट्रिंग पढ़ता है।

3 नेस्टेड प्रकारों के साथ, मुझे लगता है कि इसके लिए बड़े-ओ समय की जटिलता क्या है, लेकिन मैं अपनी मशीन पर 10 सेकंड के अंदर उदाहरण पूरा करता हूं।


3

पायथन, 314 बाइट्स

SP3000, grc और FryAmTheEggman के लिए बहुत धन्यवाद:

b=range;x=len
def p(i):
 l=[];z=''
 for n in t:
  if x(z)+x(n)<=i:z+=n+' '
  else:l+=[z];z=n+' '
 return l+[z]*(z!=l[x(l)-1])
t=input().split();q=[]
for i in b(70,91):l=p(i);q+=[max(sum(x(l[k+1])>j<x(l[k])and l[k][j]is' '==l[k+1][j]for k in b(x(l)-1))for j in b(i))]
print(*p(q.index(min(q))+70),sep='\n')

2
पी-थॉन की तरह अधिक
ऑप्टिमाइज़र

3

जावास्क्रिप्ट (ईएस 6) 194 202

पुनरावर्ती बना दिया, तो शायद Iterative समाधान

F=s=>{
  for(m=1e6,b=' ',n=70;n<91;n++)
    l=b+'x'.repeat(n),x=r=q='',
    (s+l).split(b).map(w=>
      (t=l,l+=b+w)[n]&&(
        l=w,r=r?[...t].map((c,p)=>x<(v=c>b?0:-~r[p])?x=v:v,q+=t+'\n'):[]
      )
    ),x<m&&(o=q,m=x);
  alert(o)
}

व्याख्या की

F=s=> {
  m = 1e9; // global max river length, start at high value
  for(n=70; n < 91; n++) // loop on line length
  {
    l=' '+'x'.repeat(n), // a too long first word, to force a split and start
    x=0, // current max river length
    q='', // current line splitted text
    r=0, // current river length for each column (start 0 to mark first loop)
    (s+l) // add a too long word to force a last split. Last and first row will not be managed
    .split(' ').map(w=> // repeat for each word 
      (
        t=l, // current partial row in t (first one will be dropped)
        (l += ' '+w)[n] // add word to partial row and check if too long
        &&
        (
          l = w, // start a new partial row with current word
          r=r? // update array r if not at first loop
          ( 
            q+=t+'\n', // current row + newline added to complete text 
            [...t].map((c,p)=>( // for each char c at position p in row t
              v = c != ' ' 
                ? 0 // if c is not space, reset river length at 0
                : -~r[p], // if c is space, increment river length
              x<v ? x=v : v // if current > max, update max
            ))
          ):[]  
        )  
      )
    )
    x < m && ( // if current max less than global max, save current text and current max
      o = q,
      m = x
    )
  }
  console.log(o,m)
}

FireFox / FireBug कंसोल में टेस्ट करें

F('Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eismod tempor incididunt ut labore et dolore maga aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum. Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eismod tempor incididunt ut labore et dolore maga aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.')

उत्पादन

Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eismod tempor
incididunt ut labore et dolore maga aliqua. Ut enim ad minim veniam, quis
nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore
eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt
in culpa qui officia deserunt mollit anim id est laborum. Lorem ipsum dolor
sit amet, consectetur adipisicing elit, sed do eismod tempor incididunt ut
labore et dolore maga aliqua. Ut enim ad minim veniam, quis nostrud
exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis
aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu
fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in
culpa qui officia deserunt mollit anim id est laborum.

3

पायथन 3, 329 बाइट्स

import re,itertools as s
def b(t,n):
 l=0;o=""
 for i in t.split():
  if l+len(i)>n:o=o[:-1]+'\n';l=0
  l+=len(i)+1;o+=i+' '
 return o
t=input();o={}
for n in range(90,69,-1):o[max([len(max(re.findall('\s+',x),default='')) for x in ["".join(i) for i in s.zip_longest(*b(t,n).split('\n'),fillvalue='')]])]=n
print(b(t,o[min(o)]))

Ungolfed संस्करण:

# Iterates over words until length > n, then replaces ' ' with '\n'
def b(t,n):
    l = 0
    o = ""
    for i in t.split():
        if l + len(i) > n:
            o = o[:-1] + '\n'
            l = 0
        l += len(i) + 1
        o += i + ' '
    return o

t = input()
o = {}
# range from 90 to 70, to add to dict in right order
for n in range(90,69,-1):
    # break text at length n and split text into lines
    temp = b(t,n).split('\n')
    # convert columns into rows
    temp = itertools.zip_longest(*temp, fillvalue='')
    # convert the char tuples to strings
    temp = ["".join(i) for i in temp]
    # findall runs of spaces, get longest run and get length
    temp = [len(max(re.findall('\s+',x),default='')) for x in temp]
    # add max river length as dict key, with line length as value
    o[max(temp)] = n

print(b(t,o[min(o)]))
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.