मैं एक पाठ प्रारूप में अंग्रेजी शब्दकोश डेटाबेस कहां से डाउनलोड कर सकता हूं? [बन्द है]


127

मुझे एक शब्द के लिए पाठ फ़ाइल को पढ़ने और उसके अर्थ को वापस करने की आवश्यकता है। कोई अन्य फ़ाइल प्रारूप भी काम करेगा।


मैंने सभी प्रसिद्ध ऑनलाइन शब्दकोशों (ऑक्सफ़ोर्ड, लॉन्गमैन, कैम्ब्रिज, वेबस्टर, और कोलिन्स) के लिए एक वेब पंजाबी लिखा है। आप इसका उपयोग अपने डैटसेट बनाने के लिए कर सकते हैं। github.com/kiasar/Dictionary_crawler
Peyman

जवाबों:


62

गुटेनबर्ग प्रोजेक्ट वेबस्टर लबालब अंग्रेज़ी शब्दकोश होस्ट करता है प्लस कई अन्य सार्वजनिक क्षेत्र साहित्यिक कृतियों। वास्तव में ऐसा लगता है कि उन्हें अलग-अलग वर्षों के कॉपीराइट के साथ होस्ट किए गए शब्दकोश के कई संस्करण मिले हैं। मेरे द्वारा लिंक की गई एक 2009 कॉपीराइट है। आप साइट के चारों ओर प्रहार करना चाहते हैं और वेबस्टर के शब्दकोश के विभिन्न संस्करणों की जांच कर सकते हैं।


1
'09 क्लीन-अप 1913 संस्करण की प्रतिलिपि, जाहिर है OCR पूरी तरह से साफ नहीं था। साइट पर कुल 15 संस्करण हैं।
ड्रैगनलैड

57

user1247808 के पास एक अच्छा लिंक है: wget -c

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

यदि वह आपके लिए पर्याप्त शब्द नहीं है:

http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-tmarks-in-ns0.gz (माइकल क्रॉपट के सुझाव से अपडेट किया गया url)

यद्यपि वह फ़ाइल नाम बदल जाता है, आप नवीनतम ढूंढना चाहते हैं ... जो कि केवल एक बड़ी (बहुत बड़ी) पाठ फ़ाइल बन जाती है।

http://dumps.wikimedia.org/enwiktionary/


धन्यवाद .. इस लिंक के लिए
एंडीबॉय

तुम हमेशा से नवीनतम विक्शनरी डाउनलोड कर सकते हैं dumps.wikimedia.org/enwiktionary/latest/...
माइकल Kropat

androidtech / wordnet20 SQL प्रारूप में है txt नहीं।
ड्रैगनलॉर्ड

1
कृपया ध्यान दें: वर्डनेट 20 में सिंटैक्स में .sql फ़ाइल का पदावनत TYPE = * है। sed -i 's/TYPE=/ENGINE=/g' wordnet20-from-prolog-all-3.sqlMySQL के 5.0+ संस्करण के खिलाफ चलने से पहले हटाए गए सिंटैक्स को बदलने के लिए चलाएँ
Serguei Fedorov

कोई सरल txt फ़ाइल जिसमें सभी अंग्रेजी शब्द हों?
नादव बी

27

मैं नहीं जानता कि अगर यह बहुत देर हो चुकी है, लेकिन मुझे लगा कि यह किसी और की मदद करेगा।

मैं वही बुरी तरह चाहता था ... आखिरकार मिल गया।

शायद यह सही नहीं है, लेकिन मेरे लिए यह पर्याप्त है (मेरे छोटे शब्दकोश ऐप के लिए)।

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

यह एक डंप फ़ाइल नहीं है, लेकिन एक MYSQL .sql स्क्रिप्ट फ़ाइल है

शब्द WN_SYNSET तालिका में हैं और WN_GLOSS तालिका में शब्दकोष / अर्थ हैं


4
यह किस लाइसेंस के तहत है?
कोल जॉनसन

2
मुझे यकीन नहीं है, लेकिन androidtech.com/html/downloads.php पर हैHere are some files related to natural language and chatterbot projects that we are making available to the public
बेटलिस्टा

7
MySQL उपयोगकर्ता: तालिका बनाएं कथन अब हटाए गए TYPE विकल्प का उपयोग करते हैं। sed -i 's/TYPE=MyISAM/ENGINE=MyISAM/g' filename.sqlइसे फ़ाइल पर चलाएं ताकि यह नवीनतम MySQL में काम कर सके
anthonygore

15

जांचें कि क्या ये मुफ़्त संसाधन आपकी ज़रूरत के अनुसार हैं -


8
FOLDOC (कम्प्यूटिंग के फ्री ऑन-लाइन शब्दकोश) केवल कंप्यूटिंग शब्दों / नामों का शब्दकोश प्रतीत होता है। यह कुछ के लिए उपयोगी हो सकता है, लेकिन यह आप में सबसे शब्द देख सकते हैं एक सामान्य प्रयोजन शब्दकोश में नहीं है।
लिसे majesté

2
ObjectGraph पेज का लिंक भी मृत है। आधिकारिक डाउनलोड करने योग्य संस्करण यहां स्थित हैं
लेजे मेजेस्टे

@ Lèsemajesté आपका लिंक भी अब मर चुका है
yukashima huksay
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.