सामाजिक नेटवर्क में संभावित कनेक्शन कैसे निर्धारित करें?


29

मैं "सुझाए गए दोस्तों" एल्गोरिथ्म से निपटने के लिए एक दृष्टिकोण निर्धारित करने में उत्सुक हूं।

फेसबुक में एक ऐसी सुविधा है जिसमें यह आपके लिए व्यक्तियों की सिफारिश करेगा जो यह सोचते हैं कि आप इससे परिचित हो सकते हैं। ये उपयोगकर्ता सामान्य रूप से (उन मामलों को छोड़कर, जिनमें उपयोगकर्ता विशेष रूप से किसी मित्र की अनुशंसा करता है ) के पास स्वयं के लिए एक समान नेटवर्क होता है। यानी आम दोस्तों की संख्या अधिक है। मुझे लगता है कि ट्विटर उनके "हू टू फॉलो" तंत्र के लिए एक समान मार्ग का अनुसरण करता है।

फ़ेसबुक के एक कर्मचारी स्टीफ़न डॉयल (Igy) ने सुझाव दिया कि संबंधित न्यूज़फ़ीड जो कि EdgeRank सूत्र का उपयोग करता है, जो यह दर्शाता है कि दोस्तों की तुलना में अधिक मूल्यवान है जैसे कि उपस्थिति समान पोस्ट है। एक अन्य उपयोगकर्ता ने Google रैंक प्रणाली का सुझाव दिया।

फेसबुक में कहा गया है उनके समाचार फ़ीड अनुकूलन के रूप में जहांuewede

ue = देखने वाले उपयोगकर्ता और किनारे बनाने वाले के बीच संबंध स्कोर = इस किनारे के लिए वजन (बनाएं, टिप्पणी, जैसे, टैग, आदि) = समय क्षय कारक के आधार पर कि कितनी देर पहले बढ़त बनाई गई थी
डी we
de

इन वस्तुओं को सारांशित करने के लिए एक वस्तु का दर्जा देना चाहिए, जिसे मैं Igy संकेत के रूप में मानता हूं, इसका मतलब है कि समान प्रारूप में कुछ का उपयोग सुझाए गए दोस्तों द्वारा किया जाता है।

तो मैं अनुमान लगा रहा हूं कि यह वह तरीका है जिसमें सभी प्रकार के कनेक्शन एक रैंक सिस्टम के माध्यम से सामान्य रूप से किए जाते हैं?


एक साधारण शुरुआती बिंदु के रूप में, आप "दोस्तों के मित्र" सिफारिश प्रणाली का उपयोग कर सकते हैं। यही है, अगर आपके कई दोस्त हैं जो व्यक्ति एक्स के दोस्त हैं, तो हो सकता है कि आप व्यक्ति एक्स के साथ दोस्ती करें।
जो

1
विभिन्न यादृच्छिक-ग्राफ मॉडल हैं जो वास्तविक सामाजिक नेटवर्क की संरचना को पकड़ने की कोशिश करते हैं। संभावित किनारे की संभावना की गणना आपके द्वारा उपयोग किए जाने वाले मॉडल और उपलब्ध जानकारी पर निर्भर करती है।
केव

जवाबों:


7

आप सामाजिक ग्राफ को मैट्रिक्स रूप में सोच सकते हैं । समस्या के लिए एक दृष्टिकोण पहले एम 2 की गणना करना है , जो सामाजिक नेटवर्क में दो अभिनेताओं के बीच लंबाई दो के सभी रास्तों को देगा। इसे दोस्तों के इन दोस्तों के बीच संबंध के वजन के रूप में देखा जा सकता है। अगला कदम नए दोस्तों के लिए सर्वश्रेष्ठ उम्मीदवार प्राप्त करने के लिए रुचि के व्यक्ति के अनुरूप एम 2 की पंक्ति से कॉलम का चयन करना है ।MM2एम2


1
यह और व्यक्ति p के बीच पथों की संख्या देगा , जो तब मित्रों को रैंक करने के लिए उपयोग किया जा सकता है। यह क्रूड है, मैं मानता हूं। मैंपी
डेव क्लार्क

मुझे लगता है कि एक ग्राफ के साथ समस्या को हल करना आसान और अधिक सहज दोनों है।
MMS

11

जो आप खोज रहे हैं वह एक हेयुरिस्टिक है। कोई भी एल्गोरिथम यह नहीं कह सकता है कि केवल इनपुट के रूप में दोस्तों का ग्राफ दिया गया है, चाहे दो व्यक्ति जो सीधे जुड़े हुए नहीं हैं वे दोस्त हैं या नहीं; मैत्री / परिचित संबंध संक्रमणीय होने की गारंटी नहीं है (हम समरूपता मान सकते हैं, लेकिन यह वास्तविक जीवन में भी खिंचाव हो सकता है)। इसलिए किसी भी अच्छे अनुमानी को इस बात की समझ पर आधारित होना होगा कि लोग संबंधों के रेखांकन की प्रकृति की कुछ गणितीय समझ के बजाय कैसे बातचीत करते हैं (हालाँकि हमें इन शब्दों में अनुमान लगाने की आवश्यकता होगी)।

समान संभावना वाले दोस्तों का सुझाव देना अपेक्षाकृत सस्ता लेकिन गलत अनुमान लगाने वाला है। उदाहरण के लिए, मेरे पिता के दोस्त हैं, लेकिन मैं नहीं कहूंगा कि मैं उनमें से किसी के साथ दोस्त हूं (हालांकि मैं शायद कहूंगा कि मैं अपने पिता के उद्देश्यों के लिए एक दोस्त हूं, उदाहरण के लिए, एक सामाजिक नेटवर्क)। एक अपेक्षाकृत नज़दीकी दूरी पर एक व्यक्ति होने के नाते जरूरी नहीं कि उन्हें एक महान उम्मीदवार बनाया जाए।

जिन लोगों के पास आपके पास बहुत सारे विस्तारित कनेक्शन हैं, उन्हें सुझाव देना भी सामान्य रूप से एक खराब पसंद की तरह लगता है, क्योंकि इससे उन लोगों के दोस्तों की तेजी से वृद्धि होगी, जो आगे की ओर खींचते हैं (केविन बेकन गेम से अलग होने की सात डिग्री एक है इसका उदाहरण)।

मैं एक सर्किट-आधारित मॉडल का सुझाव देता हूं। मान लें कि प्रत्येक लिंक प्रतिरोध का प्रतिरोधक है । फिर एक नए दोस्त के लिए सबसे अच्छा उम्मीदवार सबसे कम समकक्ष प्रतिरोध वाला व्यक्ति हो सकता है। यहाँ एक खराब-निष्पादित ASCII ग्राफिक्स उदाहरण है:आर

  _____
 /     \
a---c   f
|   | /
b   d---e
| \ |
g   h   i

कहें कि हम नए दोस्त ढूंढना चाहते हैं aaके वर्तमान दोस्त हैं b, cऔर f। हम बीच शुद्ध बराबर प्रतिरोध का मूल्यांकन aऔर से प्रत्येक d, e, g, h, और i:

pair   resistance
(a,d)   6/7
(a,e)  13/7
(a,g)   7/4
(a,h)   1/1
(a,i)   inf

इस दृष्टिकोण के अनुसार, dसबसे अच्छा उम्मीदवार मित्र है, जिसके बाद निकटता है hgअगला सबसे अच्छा दांव है, इसके बाद निकटता है eiइस विधर्मी द्वारा कभी भी उम्मीदवार मित्र नहीं हो सकता है। चाहे आप वास्तविक मानव सामाजिक संबंधों के प्रतिनिधि होने के लिए इस अनुमान के परिणामों को खोजें, जो महत्वपूर्ण है। कम्प्यूटेशनल रूप से बोलते हुए, इसमें दो व्यक्तियों (या, शायद दिलचस्प, कुछ सार्थक रूप से चयनित ट्रंकेशन) के बीच सभी रास्तों वाले सबग्राफ को खोजना होगा, फिर स्रोत और सिंक नोड्स के बीच समकक्ष प्रतिरोध का मूल्यांकन करना होगा।

संपादित करें: तो इसके लिए मेरी सामाजिक प्रेरणा क्या है? खैर, यह एक कठिन मॉडल हो सकता है कि संपर्क में आने के लिए कितना कठिन है, और बाद में बिचौलियों (दोस्तों) के माध्यम से संभवतः महत्वपूर्ण मात्रा में जानकारी का संचार करें। सीएस शब्दों में (भौतिकी शब्दों के बजाय), यह एक ग्राफ में दो नोड्स के बीच बैंडविड्थ के रूप में माना जा सकता है। इस प्रणाली के विस्तार विभिन्न भार (प्रतिरोध, बैंडविड्थ, आदि) वाले लोगों के बीच विभिन्न प्रकार के लिंक की अनुमति देने और ऊपर के रूप में आगे बढ़ने के लिए होंगे।


10

इस समस्या पर बहुत काम किया जा रहा है क्योंकि सोशल नेटवर्किंग की लोकप्रियता में कमी आई है। समस्या को आम तौर पर "लिंक भविष्यवाणी" कहा जाता है और बहुत अच्छे और व्यापक सर्वेक्षण यहां और यहां पाए जा सकते हैं । विधियाँ बहुत ही सरल (जैसे नोड के बीच जैकार्ड समानता) से लेकर बहुत जटिल (जैसे जेनेरिक कनेक्शन प्रक्रिया के सांख्यिकीय मॉडल का निर्माण) तक होती हैं। यह आपके डेटासेट में आपके द्वारा उपलब्ध विशिष्ट विशेषताओं पर बहुत कुछ निर्भर करता है (जैसे कि सिर्फ नेटवर्क संरचना, नोड विशेषताएँ; एज एट्रिब्यूट्स, ...), लेकिन ये सर्वेक्षण आपको एक अच्छा विचार देंगे कि कहां से शुरुआत करें।


4

अस्वीकरण: मैं बेतहाशा यहाँ अनुमान लगा रहा हूँ; मैंने कोई शैली अनुसंधान नहीं पढ़ा है।

आप देख सकते हैं कि नोड्स के पास नोड्स के लिए अपेक्षाकृत कितने नोड्स के कनेक्शन अपेक्षाकृत साझा होते हैं। यह एक बहुत ही भोली (स्थानीय) विचार है, लेकिन यहाँ जाता है।

एनसीएनएन1एन2एन2एन1

|सीएन1सीएन2||सीएन1|α

α[0,1]

एक अन्य विचार अधिक वैश्विक है: हाथ में एक के समान नोड्स का एक सेट निर्धारित करें और उन कनेक्शनों का प्रस्ताव करें जो उनमें से कई साझा करते हैं। तो, समान नोड्स के सेट को परिभाषित करें

एसएन={एम:|सीएनसीएम|एनα}

और द्वारा निर्धारित प्रशंसनीय सुझाव

{एस:Σएमएसएन[एसएम]|एसएन|β}

α,β[0,1]

एसएन

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.