nlp पर टैग किए गए जवाब

प्राकृतिक भाषा प्रसंस्करण (एनएलपी) कंप्यूटर विज्ञान, कृत्रिम बुद्धिमत्ता और भाषा विज्ञान का एक क्षेत्र है, जो कंप्यूटर और मानव (प्राकृतिक) भाषाओं के बीच की बातचीत से संबंधित है। जैसे, एनएलपी मानव-कंप्यूटर संपर्क के क्षेत्र से संबंधित है। एनएलपी में कई चुनौतियों में प्राकृतिक भाषा समझ शामिल है, अर्थात्, कंप्यूटर को मानव या प्राकृतिक भाषा इनपुट से अर्थ प्राप्त करने में सक्षम बनाता है, और अन्य में प्राकृतिक भाषा पीढ़ी शामिल है।

4
अव्यक्त डिरिचलेट आवंटन बनाम पदानुक्रमित डिरिचलेट प्रक्रिया
अव्यक्त डिरिचलेट आवंटन (LDA) और पदानुक्रमित डिरिचलेट प्रक्रिया (HDP) दोनों विषय मॉडलिंग प्रक्रियाएं हैं। प्रमुख अंतर एलडीए को विषयों की संख्या के विनिर्देश की आवश्यकता है, और एचडीपी नहीं है। ऐसा क्यों हैं? और दोनों विषय मॉडलिंग विधियों के अंतर, पेशेवरों और विपक्ष क्या हैं?
49 nlp  topic-model  lda 

5
दस्तावेजों के बीच की दूरी की गणना के कुछ मानक तरीके क्या हैं?
जब मैं "दस्तावेज़" कहता हूं, तो मेरे पास विकिपीडिया लेखों और समाचारों जैसे वेब पेज हैं। मैं उत्तरार्द्ध के लिए मजबूत वरीयता के साथ वेनिला लेक्सिकल डिस्टेंस मेट्रिक्स या अत्याधुनिक सिमेंटिक डिस्टेंस मेट्रिक्स देने वाले उत्तर पसंद करता हूं।

1
स्केगन ग्रैडिएंटबॉस्टिंग क्लैसिफायर की तुलना में एक्सगबोस्ट इतना तेज क्यों है?
मैं 100 न्यूमेरिक फीचर्स के साथ 50k उदाहरणों पर एक ढाल बढ़ाने वाले मॉडल को प्रशिक्षित करने की कोशिश कर रहा हूं। XGBClassifierमेरी मशीन पर 43 सेकंड के भीतर 500 पेड़ लगाता है, जबकि GradientBoostingClassifier1 मिनट और 2 सेकंड में केवल 10 पेड़ (!) को संभालता है :( मैंने 500 …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

4
रिज्यूम डेटा के आधार पर जॉब क्लासिफिकेशन करने के लिए मुझे किन एल्गोरिदम का इस्तेमाल करना चाहिए?
ध्यान दें कि मैं आर में सब कुछ कर रहा हूं। समस्या इस प्रकार है: मूल रूप से, मेरे पास रिज्यूमे (सीवी) की एक सूची है। कुछ उम्मीदवारों को पहले काम का अनुभव होगा और कुछ को नहीं। यहाँ लक्ष्य है: उनके सीवी पर पाठ के आधार पर, मैं उन्हें …

3
वाक्य से मुख्य पाठ निकालने के लिए सामान्य दृष्टिकोण (nlp)
जैसे एक वाक्य दिया: Complimentary gym access for two for the length of stay ($12 value per person per day) जिम या जिम एक्सेस शब्द की पहचान के लिए मैं क्या सामान्य दृष्टिकोण अपना सकता हूं?

4
नामित एंटिटी मान्यता के लिए Word2Vec
मैं एक नामित निकाय मान्यता प्रणाली बनाने के लिए Google के word2vec कार्यान्वयन का उपयोग करना चाह रहा हूं। मैंने सुना है कि संरचना के माध्यम से वापस प्रसार के साथ पुनरावर्ती तंत्रिका जाल नामित इकाई मान्यता कार्यों के लिए अच्छी तरह से अनुकूल हैं, लेकिन मैं उस प्रकार के …

3
एनएलपी और मशीन लर्निंग समुदाय गहरी शिक्षा में क्यों रुचि रखते हैं?
मुझे आशा है कि आप मेरी मदद कर सकते हैं, क्योंकि इस विषय पर मेरे कुछ प्रश्न हैं। मैं गहरी शिक्षा के क्षेत्र में नया हूं, और जब मैंने कुछ ट्यूटोरियल किए, तो मैं एक दूसरे से अवधारणाओं को संबंधित या अलग नहीं कर सकता।

3
ट्रांसफार्मर मॉडल में स्थितीय एन्कोडिंग क्या है?
मैं एमएल के लिए नया हूं और यह मेरा पहला प्रश्न है, इसलिए यदि मेरा प्रश्न मूर्खतापूर्ण है तो क्षमा करें। मैं कागज को पढ़ने और समझने की कोशिश कर रहा हूं ध्यान आप सभी की जरूरत है और इसमें, एक तस्वीर है: मैं नहीं जानता कि स्थितिगत एन्कोडिंग क्या …

3
Word2Vec के लिए एक बेहतर इनपुट क्या है?
यह सामान्य एनएलपी प्रश्न की तरह अधिक है। Word2Vec नाम के शब्द एम्बेड करने के लिए उपयुक्त इनपुट क्या है? क्या लेख से संबंधित सभी वाक्य एक कॉर्पस में एक अलग दस्तावेज़ होना चाहिए? या कहा कि प्रत्येक लेख में एक दस्तावेज होना चाहिए? यह अजगर और जेनसिम का उपयोग …

3
मैं Gensim के साथ FastText प्रीट्रेन मॉडल को कैसे लोड करूं?
मैंने फास्टटेक्स प्रीट्रेन मॉडल को फास्टटेक्स मॉडल से लोड करने की कोशिश की । मैं wiki.simple.en का उपयोग कर रहा हूं from gensim.models.keyedvectors import KeyedVectors word_vectors = KeyedVectors.load_word2vec_format('wiki.simple.bin', binary=True) लेकिन, यह निम्नलिखित त्रुटियों को दर्शाता है Traceback (most recent call last): File "nltk_check.py", line 28, in <module> word_vectors = KeyedVectors.load_word2vec_format('wiki.simple.bin', …
21 nlp  gensim 

2
Word2vec मॉडल का उपयोग करके किसी शब्द का पूर्वानुमान लगाना
एक वाक्य दिया: "जब मैं ?? दरवाजा खोलता हूं तो यह अपने आप गर्म होने लगता है" मैं संभव शब्दों की सूची प्राप्त करना चाहूँगा ?? एक संभावना के साथ। शब्द 2vec मॉडल में उपयोग की जाने वाली मूल अवधारणा आस-पास के संदर्भ में दिए गए शब्द का "पूर्वानुमान" करना …

4
मैं शब्दों की शब्दार्थ समानता का माप कैसे प्राप्त कर सकता हूं?
शब्दों की शब्दार्थ समानता का पता लगाने का सबसे अच्छा तरीका क्या है? Word2Vec ठीक है, लेकिन आदर्श नहीं: # Using the 840B word Common Crawl GloVe vectors with gensim: # 'hot' is closer to 'cold' than 'warm' In [7]: model.similarity('hot', 'cold') Out[7]: 0.59720456121072973 In [8]: model.similarity('hot', 'warm') Out[8]: 0.56784095376659627 …

3
प्रारंभिक कीवर्ड के आधार पर संबंधित शब्दों की सूची कैसे विकसित करें?
मैंने हाल ही में एक शांत सुविधा देखी थी जो Google पत्रक में उपलब्ध थी: आप कुछ संबंधित खोजशब्दों को लगातार कोशिकाओं में लिखकर शुरू करते हैं, कहते हैं: "ब्लू", "ग्रीन", "येलो", और यह स्वचालित रूप से समान कीवर्ड उत्पन्न करता है (इस मामले में) , अन्य रंग)। इस YouTube …

3
अनौपचारिक पाठ पर नामांकित मान्यता के लिए डेटासेट
मैं वर्तमान में अनौपचारिक पाठ (ट्वीट के समान कुछ) से नामित संस्थाओं को निकालने के लिए एक मॉडल को प्रशिक्षित करने के लिए लेबल किए गए डेटासेट की खोज कर रहा हूं। क्योंकि पूंजीकरण और व्याकरण में अक्सर मेरे डेटासेट में दस्तावेजों की कमी होती है, मैं ऐसे डोमेन डेटा …
18 dataset  nlp 

4
मेटा-डेटा के साथ टेक्स्ट डॉक्यूमेंट्स एनोटेट कैसे करें?
बहुत सारे पाठ दस्तावेज़ (प्राकृतिक भाषा में, असंरचित) होने के बाद, उन्हें कुछ शब्दार्थ मेटा-डेटा के साथ एनोटेट करने के संभावित तरीके क्या हैं? उदाहरण के लिए, एक छोटे दस्तावेज़ पर विचार करें: I saw the company's manager last day. इससे जानकारी निकालने में सक्षम होने के लिए, इसे कम …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.