मुझे इस पेपर के बारे में पता चला जो ट्रेंडिंग टॉपिक्स की भविष्यवाणी करने के लिए लिंक विसंगति का पता लगाने का उपयोग करता है, और मैंने इसे अविश्वसनीय रूप से पेचीदा पाया: पेपर "लिंक एनोमली डिटेक्शन के माध्यम से सामाजिक धाराओं में उभरते विषयों की खोज" है ।
मैं इसे एक अलग डेटा सेट पर दोहराना पसंद करूंगा, लेकिन मैं इन तरीकों से परिचित नहीं हूं कि इनका उपयोग कैसे किया जाए। मान लें कि मेरे पास छह महीने की अवधि के दौरान नोड्स के नेटवर्क के स्नैपशॉट हैं। नोड्स में लंबे समय तक पूंछ वाले वितरण होते हैं, जिनमें से अधिकांश में केवल कुछ कनेक्शन होते हैं, लेकिन कुछ में बहुत सारे होते हैं। इस समय अवधि के भीतर नए नोड दिखाई देते हैं।
मैं कैसे असमान लिंक का पता लगाने के लिए कागज में क्रमिक रूप से रियायती सामान्यीकृत अधिकतम संभावना गणनाओं को लागू कर सकता हूं जो मुझे लगता है कि एक फटने के लिए अग्रदूत हो सकते हैं? क्या अन्य तरीके हैं जो अधिक उपयुक्त होंगे?
मैं सैद्धांतिक और व्यावहारिक रूप से दोनों पूछता हूं। अगर कोई मुझे अजगर या आर में इसे लागू करने का तरीका बता सकता है, तो यह बहुत मददगार होगा।
किसी को? मुझे पता है कि आप स्मार्ट लोग हैं, जवाब के लिए कुछ शुरुआती विचार हैं,