विषय मॉडल और एलडीए पर ट्यूटोरियल


8

मैं जानना चाहूंगा कि यदि आप लोगों के पास विषय के मॉडल और LDA के बारे में कुछ अच्छे ट्यूटोरियल (तेज और सीधे) हैं, तो सहज ज्ञान युक्त शिक्षण, कुछ वास्तविक उदाहरणों के साथ, कुछ मापदंडों को निर्धारित करने और उनका उपयोग कैसे करें।


प्रत्यक्ष उत्तर नहीं है और ट्यूटोरियल भी नहीं है, लेकिन यदि आप पदानुक्रमित मॉडल में रुचि रखते हैं, तो आपको मेरा हालिया उत्तर सहायक (शोध पत्रों का संग्रह) पर मिल सकता है।
१०:१२ पर --le

2
आम तौर पर ऐसे सवाल जो सिर्फ ऑफ-साइट संसाधनों के लिए पूछे जाते हैं, उन्हें टॉपिक माना जाता है। हो सकता है कि आप एक ट्यूटोरियल में जो खोज रहे हैं, उसे कम कर सकते हैं। आप क्या जानते हैं, आप क्या जानना चाहते हैं, क्या आप किसी विशेष भाषा में कोड चाहते हैं, आदि
सीन ओवेन

जवाबों:


9

यदि आप R में कार्य कर रहे हैं, तो फिल्म समीक्षा में LDA से मॉडल विषयों पर कार्सन सीवर्ट का ट्यूटोरियल एक उत्कृष्ट प्रारंभिक बिंदु है:

http://cpsievert.github.io/LDAvis/reviews/reviews.html

यह ट्यूटोरियल LDAvis का उपयोग करता है, जो विषय और शब्द वितरण का एक इंटरैक्टिव विज़ुअलाइज़ेशन है जो वास्तव में अंतर्ज्ञान की सहायता कर सकता है।

इसके अलावा, हालांकि छोटा नहीं है, विषय के मॉडल पर डेविड एम। बेली के व्याख्यान मापदंडों के पीछे के अर्थ को समझने के लिए एक महान संसाधन हैं: http://videolectures.net/mlss09uk_blei_tm/


7

मैं इस ट्यूटोरियल की अत्यधिक अनुशंसा करता हूं: टॉपिक मॉडलिंग और MALLET के साथ शुरुआत करना

यहां कुछ अतिरिक्त लिंक दिए गए हैं जो आपको आरंभ करने में मदद करते हैं ...

अच्छी परिचयात्मक सामग्री (शोध पत्रों के लिंक सहित): http://www.cs.princeton.edu/~blei/topicmodeling.html

सॉफ्टवेयर:

  • MALLET (जावा): http://mallet.cs.umass.edu/topics.php
  • गेंसिम (पायथन): http://radimrehurek.com/gensim/
  • topicmodels (R): http://cran.r-project.org/web/packages/topicmodels@india.html
  • स्टैनफोर्ड टॉपिक मॉडलिंग टूलबॉक्स (सामाजिक वैज्ञानिकों द्वारा उपयोग के लिए डिज़ाइन किया गया): http://www-nlp.stanford.edu/software/tmt/tmt-0.4/
  • Mr.LDA (मापनीय विषय MapReduce का उपयोग करके मॉडलिंग): http://lintool.github.io/Mr.LDA/
    • यदि आप भारी मात्रा में इनपुट टेक्स्ट के साथ काम कर रहे हैं , तो आप अपने विषय मॉडल बनाने के लिए Mr.LDA का उपयोग करने पर विचार कर सकते हैं - बहुत सारे डेटा के साथ काम करने पर इसका MapReduce- आधारित दृष्टिकोण अधिक कुशल हो सकता है।

बायस्ड एस्टिमेट्स ब्लॉग पर और भी अधिक: टॉपिक मॉडल रीडिंग लिस्ट


2

यदि आप शुरू करने और लागू करने में आसान के लिए कुछ सरल देख रहे हैं, तो मैं इसकी सिफारिश करूंगा।

टॉपिक मॉडलिंग के लिए शुरुआती गाइड


@pedrobisp जवाब देना है अगर यह आप के लिए समझ में आता है।
एसवीके

2

क्लैरिन-डी परियोजना ने यूनिवर्सिटिंग डेस सारलैंड्स क्लैरिन सेंटर द्वारा होस्ट की गई टीचिंग एन्स लर्निंग मटीरियल्स कलेक्शन (टीएलईएमएक्यूओ) साइट पर विषय मॉडलिंग और एलडीए के लिए कुछ अच्छे पॉइंटर्स एकत्र किए हैं।


1

मेरा सुझाव है कि मशीन लर्निंग प्लू के जेनसिम ट्यूटोरियल की कोशिश करना । यह आपको एनएलपी और एलडीए पर एक समग्र अवलोकन देगा, जिसमें शामिल हैं: अपने डेटा को पूर्व-प्रक्रिया कैसे करें, इंजीनियरिंग करें और एलडीए को लागू करें।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.