शब्द सूची स्रोत


11

मैं कई भाषाओं में संज्ञाओं, क्रियाविशेषणों, विशेषणों और क्रियाओं के स्रोत की तलाश में हूँ।

मैं सूचियों को पहले ही अलग कर देना चाहता हूं , और कहा गया है कि सूचियों को फिर से बनाने के लिए OED (और गैर-अंग्रेजी समकक्ष) के माध्यम से नहीं जाना चाहिए ।

मैं वास्तव में परिभाषाओं की परवाह नहीं करता हूं, और मैं समझता हूं कि कुछ शब्द भाषण के कई भाग हो सकते हैं - यह ठीक है - "बहुत" जैसे शब्द संज्ञा या विशेषण हो सकते हैं, और दोनों सूचियों में दिखाई दे सकते हैं।

क्या यहाँ किसी को इस तरह के स्रोत का पता है? यदि नहीं, तो क्या कोई मुझे सही दिशा में इंगित करने में सक्षम हो सकता है?

मैं निम्नलिखित में से किसी के भी प्रारूप के साथ ठीक हूं (या यदि लोगों के विचार समान हैं):

  • सीएसवी: <word>, noun (y/n), verb (y/n), adverb (y/n), adjective (y/n)
  • प्लेनटेक्स्ट फाइलें जैसे "संज्ञा", "क्रिया", आदि
  • एक mysql तालिका
  • आदि

जवाबों:


8

मैंने कुछ परियोजनाओं के लिए प्रिंसटन यूनिवर्सिटी से वर्डनेट का उपयोग किया है । यह अंग्रेजी में एक शाब्दिक डेटाबेस है। ग्लोबल वर्डनेट परियोजना का एक विस्तार है जो सभी भाषाओं के लिए समान है।

आप संबंधित परियोजनाओं में http://wordnet.princeton.edu/wordnet/related-projects/ पर भी रुचि ले सकते हैं


1
वर्डनेट जाने का रास्ता है। सभी शीर्ष शोधकर्ता इसका उपयोग करते हैं।
ऋत्विक बोस

4

यह बिल्कुल भी मदद नहीं कर सकता, मुझे नहीं पता। लेकिन मीडियाविकि के पास एक निश्चित श्रेणी से संबंधित सभी पृष्ठों को सूचीबद्ध करने के लिए एक एपीआई है । आप इसे विक्षनरी डॉट ओआरजी पर प्रयोग करके देख सकते हैं।

टिप्पणियाँ:

  • प्रत्येक प्रश्न केवल 500 परिणाम देता है। हालाँकि, अंत में, यह अगले 500 परिणाम प्राप्त करने के लिए किसी अन्य क्वेरी में उपयोग करने के लिए एक पैरामीटर भी निर्दिष्ट करता है।
  • इसमें निर्दिष्ट श्रेणी, यहां तक ​​कि अन्य उप-श्रेणियों में सब कुछ शामिल है।
  • परिणाम वर्णमाला क्रम में प्रतीत होते हैं, हालांकि एक बड़े अक्षर से शुरू होने वाली सब कुछ कम मामले में कुछ भी होने से पहले आता है।

उदाहरण:

उम्मीद है कि यह मदद करता है, यह वही है जो मैं साथ आ सकता हूं।


1

मैं wordnet के @ teknikqa सुझाव को जारी करूंगा, लेकिन मैं आपको उनके एपीआई की जांच करने का सुझाव दूंगा;

कहानी : मेरे पास एक एआई पाठ्यक्रम था जिसमें भाषा विश्लेषण भाग था; मैंने शीर्ष तीन परिभाषा प्रकारों को स्वचालित रूप से देखने के लिए वर्डनेट के पर्ल एपीआई का उपयोग किया, और स्टैटटाइम के निकट-वास्तविक समय END में उस से वाक्यांश को वर्गीकृत किया।

भाषाओं के बहुत सारे के लिए एपीआई बाहर हैं

FYI करें: परियोजना को A + मिला

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.