python-nltk Ubuntu 12.04 LTS पर: nltk.download ('भूरा') परिणाम HTML त्रुटि 401 में


9

मैंने apt-get का उपयोग करके Ubuntu Server 12.04 पर python-nltk स्थापित किया है।

लेकिन जब मैं एक कॉर्पस डाउनलोड करने का प्रयास करता हूं, तो मुझे निम्नलिखित त्रुटि मिलती है:

$ python
Python 2.7.3 (default, Feb 27 2014, 19:58:35)
[GCC 4.6.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.download('brown')
[nltk_data] Error loading brown: HTTP Error 401: Authorization
[nltk_data]     Required
False

क्या मुझे कुछ विन्यास या अतिरिक्त पैकेज याद आ रहे हैं?


आप स्रोत से इंस्टॉल करने का प्रयास कर सकते हैं wget https://github.com/nltk/nltk/archive/develop.zip; unzip develop.zip; cd nltk-develop; python setup.py install। लेकिन github.com/nltk/nltk/issues/747
alvas

यह अभी भी उबंटू 13.04 के साथ एक समस्या है
टिकॉन

एक लंबे समय के बाद और कुछ सिस्टम अपग्रेड के बाद इस सवाल पर फिर से गौर: ubuntu 18.04 LTS
jk - Reinstate Monica

जवाबों:


12

DEFAULT_URLमें प्रयोग किया जाता downloader.pyउबंटू पैक संस्करण अभी भी उपयोग करता है की:

DEFAULT_URL = 'http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml'

लेकिन वर्तमान डेटा सर्वर है:

DEFAULT_URL = "http://nltk.github.com/nltk_data/"

आप निश्चित रूप से स्रोत से स्थापित कर सकते हैं या ... इस तरह नए सर्वर को इंगित करने के लिए अपने पहले से इंस्टॉल किए गए संस्करण को संशोधित कर सकते हैं:

 sudo perl -pi -e 's#DEFAULT_URL = .*#DEFAULT_URL = "http://nltk.github.com/nltk_data/"#' /usr/lib/python2.7/dist-packages/nltk/downloader.py

फिर आप "ब्राउन" कॉर्पस स्थापित कर सकते हैं:

$ python
Python 2.7.6 (default, Mar 22 2014, 22:59:56) 
[GCC 4.8.2] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.download('brown')
[nltk_data] Downloading package 'brown' to /home/sylvain/nltk_data...
[nltk_data]   Unzipping corpora/brown.zip.
True
>>> from nltk.corpus import brown
>>> brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]
>>> 

12

स्रोत कोड को बदले बिना इसे ठीक करना संभव है। अजगर में एक कस्टम डाउनलोडर बनाएँ:

>>> dl = nltk.downloader.Downloader("http://nltk.github.com/nltk_data/")

फिर आप एक GUI डायलॉग खोलें:

>>> dl.download()

चेक करें कि आपके पास डाउनलोड डायरेक्टरी तक पहुंच है और आपको जो चाहिए उसे डाउनलोड करें।


0
pip install nltk --upgrade

यह एक nltk को अपडेट nltk.download()करता है और फिर दोबारा काम करता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.