विकिपीडिया: दर्शन!


26

कई geeks विकिपीडिया पर सबसे अधिक पृष्ठों (95% मुझे लगता है) को जानते हैं कि अंततः इस तरह से दर्शन हो सकते हैं:

पहले गैर-इटैलिक या कोष्ठक लिंक पर क्लिक करें जो कि एक अन्य सामान्य लेख के लिए है: (यानी फ़ाइल नहीं: या विशेष :, लेकिन चीजें जैसे विकिपीडिया: ठीक हैं) और उस पर दोहराएं जब तक आप दर्शन को हिट नहीं करते।

स्क्रिप्ट होनी चाहिए:

  • पहले पेज को इनपुट के रूप में लें
  • इसे प्राप्त होने वाले प्रत्येक लेख का नाम प्रिंट करें
  • और दर्शन के लिए इसे लेने के लिए कितने लेख छपे, और अगर ऐसा नहीं कहा तो।

आप 1000 अंकों के साथ शुरू करते हैं, और कोड में प्रत्येक वर्ण के लिए एक खो देते हैं, इसके लिए बोनस अंक:

लूपिंग लेखों का पता लगाना और रोकना: +50

लूपिंग लेखों का पता लगाना और अनुरोध करना कि क्या उपयोगकर्ता को लेख के अगले लिंक पर जाना चाहिए: +170

पूर्व-चेक पर कमांड-लाइन arg या समान: +140 के लिए डिफ़ॉल्ट के लिए अनुमति देना

उच्चतम स्कोर जीतता है।


7
+1, बड़ी चुनौती! पी: इस कोष्ठक का पता लगाने मुश्किल है
दरवाज़े

1
मुझे लग रहा है कि यह कुछ बेहतर परिभाषा का उपयोग कर सकता है, लेकिन मुझे यकीन नहीं है कि अभी तक कैसे।
इज़्ज़ी

3
टाइप किए गए प्रत्येक वर्ण के लिए एक बिंदु खो दें। हम्म। महान, मुझे मिल गया, मैं सिर्फ पात्रों को कॉपी-पेस्ट करूंगा! कोई अंक नहीं खोया!
जस्टिन

5
कृपया जवाब बदलने के बाद नियमों को पहले से ही पोस्ट नहीं किया गया है; यह काफी असभ्य है और आम तौर पर यहाँ समुदाय में ...
दूरबीन

जवाबों:


8

रूबी, 1000 - 303 299 337 - 50 373 - 170 382 - 170 - 140 379 - 170 - 140 चर = 697 701 713 797 928 931

मुझे यकीन है कि कई सुधार किए जाने हैं।

(इसके लिए नोकगिरी की आवश्यकता है)

require'open-uri'
require'nokogiri'
x="/wiki/"+gets.chomp
r=[n=i=0]
until x=~/\/Philosophy/
d=Nokogiri.HTML open"http://en.wikipedia.org#{x}"
x=d.css('p a').select{|a|t=a.xpath('preceding::text()').map(&:text)*'';t.count('(')==t.count(')')&&a.attr('href')=~/^.wiki[^:]+$/}[i].attr'href'
i=0
puts r.index(x)?"#{$><<'i=';i=($*[0]||gets).to_i;''}": r.push(x)[-1][6..-1]
n+=1
end
p n

उदाहरण रन:

c:\a\ruby>wikipedia_crawl_philosophy
Latin (note: this is my input)
Classical_antiquity
History
Umbrella_term
Terminology
Word
Linguistics
Science
Knowledge
Fact
Proof_(truth)
Argument
Logic
Reasoning
Consciousness
Quality_(philosophy)
Property_(philosophy)
Modern_philosophy
Philosophy
18

एक नमूना जहां मुझे एक अलग लिंक पर जाना था

c:\a\ruby>wikipedia_crawl_philosophy
Snow
Precipitation_(meteorology)
Meteorology
Atmospheric_physics
Synoptic_scale_meteorology
i=2 // I put the 0-indexed number of the link I wanted to go to (so, the third link)

Weather
Atmosphere
Gas
State_of_matter#The_four_fundamental_states
Physics
Natural_science
Sciences
Knowledge
Fact
Proof_(truth)
Argument
Logic
Reasoning
Consciousness
Quality_(philosophy)
Property_(philosophy)
Modern_philosophy
Philosophy
25

ट्रिक्स मैं इस्तेमाल किया:

  • मैंने चयनकर्ता p aका उपयोग केवल गैर-इटैलिक लिंक प्राप्त करने के लिए किया , क्योंकि वास्तविक लेख में सभी लिंक जो इटैलिक नहीं हैं, वे हमेशा विकिपीडिया में पैरा तत्वों में होते हैं।

हम्म् ... शायद मैं भाषा के साथ आने वाले किसी भी
पुस्तकालय को अस्वीकार कर दूं

@ user1825860 यह वास्तव में एक पुस्तकालय नहीं है जो भाषा के साथ आता है; यह एक रत्न है। मैंने अपना उत्तर संपादित किया। लेकिन वास्तव में, आप इसे पहले से ही कठिन चुनौती लेना चाहते हैं और हमें HTML पार्सिंग लाइब्रेरी का भी उपयोग नहीं करने के लिए मजबूर करते हैं? : पी
दरवाज़े

मैं इसे अस्वीकार नहीं कर रहा हूं, लेकिन आप अंक खो देते हैं: P
अल्फामोडर

आपको पहली पोस्ट को फिर से पढ़ना चाहिए और तदनुसार संपादित करना चाहिए: P
अल्फामोडर

2
@ user1825860 जवाब देने के बाद कृपया नियमों में बदलाव न करें; कि काफी अशिष्ट है ...
दरवाज़े

5

"BASH " - (यदि गलत नहीं है: 1000 - 397 + 170 + 140 = 913 अंक)
"BASH" - (यदि गलत नहीं है: 1000 - 386 + 170 + 140 = 924 अंक)

"बैश" - (यदि गलत नहीं है: 1000 - 381 + 170 + 140 = 929 अंक)

BASH इस उद्देश्य से उद्धरण में है क्योंकि यह * निक्स के गोले में इस्तेमाल होने वाले औजारों का मिश्रण है, लेकिन इसे बश लिपि में लपेटा गया है।

1 संपादित करें:

  • http://इसे curlडिफॉल्ट के रूप में हटा दिया गया ।
  • बदल दिया href=करने के लिए एंकर पर मैच f=के रूप में <a>किसी भी अन्य नहीं है सामान्य विशेषताओं में समाप्त होने वाले f। (यह कस्टम टैग की संभावना है। अब तक कोई नहीं देखा है।)
  • के !Philबजाय नहीं मिला पर बाहर निकलें संदेश सेट करें NoPhil। यह एक थोड़ा विचित्र रूप में एक भी कह सकते हैं जैसे है !, 0, N, !Pया इसी तरह की।
  • क्वर्क दो: -sको curlतीन और बाइट्स से कम करने के लिए हटाया जा सकता है, लेकिन यह एक गन्दा आउटपुट प्राप्त करेगा। यकीन नहीं होता कि यह एक मुद्दा है।
  • इस पृष्ठ पर नवीनीकृत सहायता

Quirks का उपयोग करते हुए, कोड 379 बाइट्स, 931 अंक पर समाप्त होगा।

मैं भी लागू कर सकता है @plannapus मिलान (उम्मीद) के उपयोग नेविगेशन बॉक्स जोड़कर (p|ul).*?<(\1)छह बाइट्स जोड़ने (छह अंक घटाकर)।

2 संपादित करें:

काउंटर के ${#c[@]}बजाय जुदाई की प्रिंट डिग्री का उपयोग करना $i

Quirks का उपयोग करते हुए, कोड 374 बाइट्स, 936 अंकों पर समाप्त होगा।


मैं Cthulhu को बुलाता हूं और regexp + bash / shell / * nix solution के लिए जाता हूं।

चोरी हो गया:

  • @Doorknob of Snow<p> से ट्रिक का उपयोग करना ।

कार्यान्वित:

  • लूप का पता लगाएं और पूछें कि क्या अगला लिंक लिया जाना चाहिए।
  • वैकल्पिक रूप से विकल्प के रूप में डुप्लिकेट पर अगला लिंक चुनें।

आवश्यकताएँ:

  • bash वी।?
  • grepसाथ -P(PCRE) समर्थन करते हैं।
  • sed
  • curl
  • cut

उपयोग:

script PATH [OPTIONS]

Print separation of article from ``PATH'' to ``Philosophy'' on Wikipedia.
Degrees of separation, if found, is printed as last line. 
If not found last line yields ``!Phil''.

PATH    
     Absolute path to starting article, e.g: /wiki/Word 
OPTIONS
     y   Automatically select next link if already visited.
     n   (Or other) Quit if next link already visited.
BUGS
     1. On previous visit; "next link" is not checked. Thus if next link
     has already been visited we get eternal loop. Not sure if this
     disqualify +170 points.
     2. Sure there are.

इनलाइन कोड। फाइल करने के लिए कॉपी करें। chmod +x filename./script /wiki/…बैश शेल से चलाएं ।

u=($1);c=($1);while ! [[ "$u" =~ /Philosophy$ ]];do echo "$u";u=($(curl -s "en.wikipedia.org$u"|tr '\n' ' '|grep -Po '<p>.*?</p>'|sed 's/>[^<]*([^)]*)//g'|grep -o '<a [^>]*f="/wiki/[^":]*"'|cut -d\" -f2));for x in "${c[@]}";do if [ "$x" = "$u" ];then [ $2 ] &&s=$2||read -p "${u[0]}?" s;[ $s = y ] &&u[0]=${u[1]}||{ echo "!Phil";exit;} fi;done;c=("${c[@]}" "$u");done;echo ${#c[@]};

विस्तारित और समझाया गया कोड:

u=($1); # Array of paths.
c=($1); # Array of visited paths.
# While $u != /Philosophy, ugly trick is to use $u instead of ${u[0]}.
while ! [[ "$u" =~ /Philosophy$ ]];do   
        echo "$u";      # Print current page.
        # curl   : prints retreived page to stdout. "-s" could be skipped.
        # tr     : replace all newline with space. This is a ®sanity thing when it comes to 
        #          twidling with html using regex.
        # grep 1 : match <p> tags. Using -P's ungreedy *?.
        # sed    : remove all occurences of "(" something ")".
        # grep 2 : match links where "href" attribute starts with /wiki/ and is not e.g. File:
        # cut    : match actual href value.
        # Result is added to array ``u''.
        u=($(curl -s "en.wikipedia.org$u" |
                tr '\n' ' ' | 
                grep -Po '<p>.*?</p>' | 
                sed 's/>[^<]*([^)]*)//g' | 
                grep -o '<a [^>]*f="/wiki/[^":]*"' | 
                cut -d\" -f2));

        # For previously visited pages as x.
        for x in "${c[@]}"; do 
                # If x equals to first page ...
                if [ "$x" = "$u" ]; then        
                        # Use option or ask.
                        [ $2 ] && s=$2 || read -p "${u[0]}?" s; 
                        # If response is "y" use next link, else exit with status.
                        [ $s = y ] && u[0]=${u[1]} || { 
                                echo "!Phil"; 
                                exit;
                        } 
                fi;
        done;
        # Append current link to "visited"
        c=("${c[@]}" "$u"); 
done;
# Print number of visited pages.
echo ${#c[@]}

डारन, तुमने मुझे एक अंक से हराया! : पी मैं गोल्फ के लिए अपने समाधान अधिक है करने के लिए जा रहा हूँ
दरवाज़े

हां;), लेकिन यह निश्चित नहीं है कि यह वैध कोड है। इस तरह से टूल का उपयोग करना।
रनियम

5

जावास्क्रिप्ट 726 (444 वर्ण [556] + 170)

अब मैं सराहना करता हूं कि यह एक बुकमार्कलेट के रूप में मान्य नहीं हो सकता है, लेकिन मैंने इसके साथ छेड़छाड़ का आनंद लिया है।

उपयोग: उस पृष्ठ पर नेविगेट करें जिसे आप कंसोल से शुरू करना चाहते हैं और निम्नलिखित को चलाना चाहते हैं:

(function(a){c=0,o="";$(u="html")[u](f=$('<iframe src="'+location+'?">').on("load",function(){$=f.contentWindow.$;p=f.contentDocument.title[s="split"](" - ")[0];c++;p=="Philosophy"?document.write("<pre>"+o+p+"\n"+c):(i=RegExp("^"+p+"$","m").test(o)?a||confirm("Loop, try next?")?2:0:1)&&(f.src=$("p>a").filter(function(){return(t=$(this).parent()[u]()[s](this.outerHTML)[0])[s]("(").length==t[s](")").length})[--i].href);o+=p+"\n"})[0])})(true)

जावास्क्रिप्ट के लिए आउटपुट निम्न है:

JavaScript
Interpreter (computing)
Computer science
Science
Knowledge
Fact
Proof (truth)
Argument
Logic
Reason
Consciousness
Quality (philosophy)
Property (philosophy)
Modern philosophy
Philosophy
15

यह समाधान यह मान लेगा कि आप पता लगाए जा रहे लूप पर अगले लिंक पर जाना चाहते हैं, लेकिन यदि आप trueइसके अंत में falseइसे बदलते हैं, तो इसके बजाय एक पुष्टिकरण बॉक्स को पॉप अप किया जाएगा (काफी कष्टप्रद ...) सुनिश्चित नहीं हैं कि क्या इसके लिए योग्य है। माध्यमिक बोनस या नहीं। मैं नहीं मानूंगा।

इंडेंट:

(function(l){
    c=0,o='';
    $(u='html')[u](f=$('<iframe src="'+location+'?">').on('load',function(){ // Firefox needs the ? to properly load the frame
        $=f.contentWindow.$; // reference repeated calls as strings to save more bytes
        p=f.contentDocument.title[s='split'](' - ')[0]; // get the title

        c++;
        p=='Philosophy'?
            document.write('<pre>'+o+p+'\n'+c): // pre for nice formatting
            (i=RegExp('^'+p+'$','m').test(o)?
                l||confirm('Loop, try next?')?
                    2: // desired index + 1 so we can use as a boolean
                    0
                :
                1)&&
            (f.src=$('p>a').filter(function(){
                return (t=$(this).parent()[u]()[s](this.outerHTML)[0])[s]('(').length == t[s](')').length // shorter, but still not overly happy with this...
            })[--i].href);
            o+=p+'\n' // update output
    })[0])
})(true) // change this to show confirm box when loop detected

इसलिए मैं मूल रूप से परनों में वस्तुओं की अनदेखी करने के बारे में भाग लेने से चूक गया, जिसने इसे बहुत अधिक चिंताजनक बना दिया, इसलिए मैं गोल्फ को उम्मीद कर रहा हूं कि फ़िल्टर फ़ंक्शन नीचे (या उम्मीद है कि इसे पूरी तरह से बदल दें)।

क्रोम और फ़ायरफ़ॉक्स दोनों में काम करना (फ़ायरफ़ॉक्स 26 में परीक्षण)


2
बहुत बढ़िया लग रहा है, लेकिन फ़ायरफ़ॉक्स 20 में विफल रहता है
बूथ

Argghh! मैंने केवल क्रोम का परीक्षण किया। मैं इस पर गौर करूंगा!
डोम हेस्टिंग्स

@boothby फ़ायरफ़ॉक्स में अब काम करना चाहिए ... फिर भी उन लिंक्स पर काम करना चाहता हूं जो मैं हालांकि चुन रहा हूं!
डोम हेस्टिंग्स

5

C # - 813 वर्ण

स्कोर: 1000-813 + 50 + 170 + 140 = 547 :(

कोई बाहरी पुस्तकालय नहीं। लूप का पता लगाना

पहला तर्क है सोर्स आर्टिकल, दूसरा टारगेट आर्टिकल है।

गोल्फ संस्करण:

class Program
{
    static void Main(string[] a)
    {
        Func<XmlDocument,IList<string>> G=delegate(XmlDocument xd){return xd.SelectNodes("//p//a[starts-with(@href,'/wiki/') and not(contains(@href,':'))]").Cast<XmlNode>().Select(n=>n.Attributes["href"].InnerText).ToList();};Action<string> W=delegate(string s){Console.WriteLine(s);};var h=new HashSet<string>();var c=new WebClient();var x=new XmlDocument();var t=c.DownloadString(@"http://wikipedia.org/wiki/"+a[0]);int i=0,C=0;
    GO:
        x.LoadXml(t);var ns=G(x);
    COL:
        var f=ns[i];if(f.Equals("/wiki/"+a[1],StringComparison.OrdinalIgnoreCase)){goto END;}if(h.Contains(f)){W("loop: "+f);i++;goto COL;}else{h.Add(f);i=0;C++;}W(f);t=c.DownloadString(@"http://wikipedia.org"+f);goto GO;
    END:
        W("Found in "+C);
    }
}

बुद्धिमान संस्करण:

class Program
{
    // arg[0] source article. arg[1] target article
    static void Main(string[] arg)
    {
        Func<XmlDocument, IList<string>> G = delegate(XmlDocument xd)
        {
            return xd.SelectNodes("//p//a[starts-with(@href,'/wiki/') and not(contains(@href,':'))]").Cast<XmlNode>().Select(n => n.Attributes["href"].InnerText).ToList();
        };
        Action<string> W = delegate(string s) { Console.WriteLine(s); };
        var h = new HashSet<string>(); var c = new WebClient(); var x = new XmlDocument();
        var allText = c.DownloadString(@"http://wikipedia.org/wiki/" + arg[0]);
        int i = 0; int C = 0;
    GO:
        x.LoadXml(allText);
        var ns = G(x);
    COL:
        var f = ns[i];
        if (f.Equals("/wiki/" + arg[1], StringComparison.OrdinalIgnoreCase))
        {
            goto END;
        }
        if (h.Contains(f))
        {
            W("loop: " + f); i++; goto COL;
        }
        else
        {
            h.Add(f); i = 0; C++;
        }
        W(f);
        allText = c.DownloadString(@"http://wikipedia.org" + f);
        goto GO;
    END:
        W("Found in " + C);
    }
}

उदाहरण रन, "स्काई" से "दर्शन" तक:

C:\>wiki.exe Sky Philosophy

/wiki/Earth
/wiki/Geometric_albedo
/wiki/Phase_angle_(astronomy)
/wiki/Observational_astronomy
/wiki/Astronomy
/wiki/Natural_science
/wiki/Sciences
/wiki/Latin_language
/wiki/Classical_antiquity
/wiki/History
/wiki/Ancient_Greek
/wiki/Greek_language
/wiki/Modern_Greek
loop: /wiki/Greek_language
/wiki/Colloquialism
/wiki/Word
/wiki/Linguistics
/wiki/Science
loop: /wiki/Latin_language
/wiki/Knowledge
/wiki/Fact
/wiki/Latin
loop: /wiki/Classical_antiquity
/wiki/Italic_languages
/wiki/Indo-European_languages
/wiki/Language_family
/wiki/Language
/wiki/Human
/wiki/Extinct
/wiki/Biology
loop: /wiki/Natural_science
/wiki/Life
loop: /wiki/Earth
/wiki/Physical_body
/wiki/Physics
loop: /wiki/Greek_language
loop: /wiki/Natural_science
/wiki/Matter
/wiki/Rest_mass
/wiki/Center_of_momentum_frame
loop: /wiki/Physics
/wiki/Inertial_frame
loop: /wiki/Physics
/wiki/Frame_of_reference
loop: /wiki/Physics
/wiki/Coordinate_system
/wiki/Geometry
loop: /wiki/Ancient_Greek
/wiki/Mathematics
/wiki/Quantity
/wiki/Property_(philosophy)
/wiki/Modern_philosophy
Found in 41

C:\>

5

स्काला (294 चार्ट => 1000-294 + 140 = 846 अंक)

अद्यतन समाधान जो स्वचालित रूप से अगला लिंक लेता है यदि कोई पहले से ही उपभोग किया गया है। 140 बोनस अंक के लिए धन्यवाद।

लॉजिक: पहला "/ विकी" लिंक उठाएं, जिसमें ":" नहीं है (इसलिए यह "फाइल:" लिंक को अनदेखा करता है)। हर बार गिनती + 1 लौटाने वाली पुनरावृत्ति के साथ कुल्ला और दोहराएं। मैं सभी पिछले आउटपुट की सूची रखता हूं, ताकि प्रोग्राम अनंत लूप में न जाए।

नियमित अभिव्यक्ति: मेरे पास नियमित अभिव्यक्ति के 2 रूप हैं।

  • "<p>.*?\"/wiki/([^:]*?)\".*?/p>"जो <p>टैग के भीतर लिंक पाता है
  • "p>.*?/wiki/([^:]*?)\""जो थोड़ा अधिक प्रयोगात्मक टैग है जो काम करने के लिए सिद्ध हुआ है, लेकिन विभिन्न परिणाम प्रदान करता है क्योंकि यह, कई बार, दाईं ओर जानकारी बार से लिंक उठाता है। ये नियमित लेख हैं इसलिए मेरा मानना ​​है कि यह अभी भी मान्य है। यदि यह नहीं होने के लिए कहा जाता है, तो ओपी (या कोई और) मुझे एक टिप्पणी छोड़ सकता है और मैं अपने समाधान को बेहतर रेज-एक्स में अपडेट कर सकता हूं।

मैं दूसरी नियमित अभिव्यक्ति का उपयोग करने जा रहा हूं जब तक कि मुझे एक परीक्षण का मामला नहीं मिल जाता है जहां यह काम नहीं करता है या ओपी में साइड बार से लिंक लेने का उल्लेख नहीं किया गया है (मेरी राय में, जानकारी बार अभी भी इसका हिस्सा हैं वास्तविक लेख ही; सारांश का अधिक)।


न्यूनतम स्रोत:

object W extends App{print(x(Seq(args(0))));def x(s:Seq[Any]):Int={val? =s.last;println(?);?match{case "Philosophy"=>1;case _=>x(s:+"p>.*?/wiki/([^:]*?)\".*?/p>".r.findAllMatchIn(io.Source.fromURL("http://en.wikipedia.org/wiki/"+ ?).getLines.mkString).map(_ group 1).filter(!s.contains(_)).next)+1}}}

पठनीय स्रोत:

object W extends App {
  print(x(Seq(args(0))))

  def x(s: Seq[Any]): Int = {
    val ? = s.last
    println(?)
    ? match {
      case "Philosophy" => 1
      case _ => x(s :+ "p>.*?/wiki/([^:]*?)\"".r.findAllMatchIn(io.Source.fromURL("http://en.wikipedia.org/wiki/" + ?).getLines.mkString).map(_ group 1).filter(!s.contains(_)).next) + 1
    }
  }
}

नमूना आउटपुट:

इनपुट

Space_toilet

उत्पादन

Space_toilet
Weightlessness
G-force
Weight
Force
SI_unit
French_language
Second_language
Language_acquisition
Word
Linguistics
Science
Latin_language
Pontifical_Academy_for_Latin
Pope_Benedict_XVI
Pope_Benedict_(disambiguation)
Regnal_name#Catholic_Church
Monarch
State_(polity)
Community
Commutative_property
Mathematics
Quantity
Property_(philosophy)
Modern_philosophy
Philosophy
26

1
स्काला को किसी मुख्य वस्तु या विधि की आवश्यकता नहीं होती है। आप इसे दुभाषिया के साथ "स्कैला <फ़ाइलनाम> [args ..]" के रूप में चला सकते हैं। args(0)पहला तर्क प्राप्त करने के लिए उपयोग करें , अपनी objectऔर mainपरिभाषाओं से छुटकारा पाएं , और मुझे लगता है कि आप भी हटा सकते :Intहैं। pastebin.com/YqywKcG8
KChaloux

आप को निकाल नहीं सकते हैं : Int। एहसास नहीं था कि आप एक पुनरावर्ती कॉल कर रहे हैं। साथ ही मेरा पास्टबिन आपके पुराने पठनीय स्रोत से लिया गया था, लेकिन वही अवधारणाएं लागू होती हैं।
KChaloux

मैं मुख्य विधि से छुटकारा पाने की कोशिश करूँगा। और हाँ, पुनरावर्ती कॉल मुझे :Intवहाँ जोड़ दिया । बाद में आज, मैं भी 333 चार समाधान का एक पठनीय रूप जोड़ूंगा। सुझाव के लिए धन्यवाद @KChaloux
javatarz

1
जैसा कि मैंने कहा, object Q extends App { ... }यदि आप स्केलक के साथ संकलन करने के बजाय दुभाषिया के साथ कोड चलाते हैं तो संदर्भ पूरी तरह से अनावश्यक है। बस साथ में scala <filename> [args..]
चलें

4

आर, 379 वर्ण; 1000-379 + 170 = 791 अंक

संस्करण जो उपयोगकर्ताओं से पूछते हैं कि लूपिंग का पता चलने पर कैसे आगे बढ़ना है

library(XML);w="http://en.wikipedia.org";W="/wiki/";n=1;A=c(scan(,""));while(A[n]!="Philosophy"){a=paste0(w,W,A[n]);d=sapply(strsplit(grep(W,sapply(xpathApply(xmlParse(readLines(a)),"//p/a[@href]|//ul/li/a[@href]",xmlAttrs),`[`,'href'),v=T),"/"),`[`,3);B=d[-grep(":",d)];n=n+1;if(B[1]%in%A)if(readline("Loop!2nd link?")=="n")break;A[n]=head(B[!B%in%A],1);cat(A[n],"\n")};cat(n-1)

टिप्पणियों और टिप्पणियों के साथ:

library(XML) #Uses package XML
w="http://en.wikipedia.org"
W="/wiki/"
n=1
A=c(scan(,"")) #Stdin + makes it a vector so we can store each iteration
while(A[n]!="Philosophy"){
    a=paste0(w,W,A[n])
    d=sapply(strsplit(grep(W,sapply( #The heart of the program
             xpathApply(xmlParse(readLines(a)),"//p/a[@href]|//ul/li/a[@href]",xmlAttrs),
             `[`,'href'),v=T),"/"),`[`,3)
    B=d[-grep(":",d)] #get rid of Templates, Files ,etc...
    n=n+1
    #Ask user if should proceed when loop encountered 
    #(any answer other than "n" is considered agreement):
    if(B[1]%in%A)if(readline("Loop!2nd link?")=="n")break
    A[n]=head(B[!B%in%A],1) #Take the first link that is not redundant
    cat(A[n],"\n")
    }
cat(n-1)

उदाहरण रन:

> library(XML);w="http://en.wikipedia.org";W="/wiki/";n=1;A=c(scan(,""));while(A[n]!="Philosophy"){a=paste(w,W,A[n],sep="");d=sapply(strsplit(grep(W,sapply(xpathApply(xmlParse(readLines(a)),"//p/a[@href]|//ul/li/a[@href]",xmlAttrs),`[`,'href'),v=T),"/"),`[`,3);B=d[-grep(":",d)];n=n+1;if(B[1]%in%A)if(readline("Loop!2nd link?")=="n")break;A[n]=head(B[!B%in%A],1);cat(A[n],"\n")};cat(n-1)
1: Extended_ASCII
2: 
Read 1 item
Eight-bit 
Computer_architecture 
Computer_science 
Science 
Logic 
List_of_aestheticians 
Art 
Human_behavior 
Behavior 
Organism 
Biology 
Loop!2nd link?y
Mathematics 
Quantity 
Property_(philosophy) 
Modern_philosophy 
Philosophy 
16

आर, 325 वर्ण; ??? अंक

वह संस्करण, जो डिफ़ॉल्ट रूप से पहले गैर-अनावश्यक लिंक (यानी गैर-लूपिंग) लेता है।

library(XML);w="http://en.wikipedia.org";W="/wiki/";n=1;A=c(scan(,""));while(A[n]!="Philosophy"){a=paste0(w,W,A[n]);d=sapply(strsplit(grep(W,sapply(xpathApply(xmlParse(readLines(a)),"//p/a[@href]|//ul/li/a[@href]",xmlAttrs),`[`,'href'),v=T),"/"),`[`,3);B=d[-grep(":",d)];n=n+1;A[n]=head(B[!B%in%A],1);cat(A[n],"\n")};cat(n-1)
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.