मेरे पास एक निर्देशित नेटवर्क के 4 मिलियन किनारों के साथ एक सीएसवी फ़ाइल है, जो एक दूसरे के साथ संवाद करने वाले लोगों का प्रतिनिधित्व करते हैं (जैसे जॉन मैरी को संदेश भेजता है, मैरी एन को एक संदेश भेजता है, जॉन मैरी को एक अन्य संदेश भेजता है , आदि)। मैं दो काम करना चाहूंगा:
प्रत्येक व्यक्ति के लिए डिग्री, बीच और (शायद) eigenvector केंद्रीयता उपायों का पता लगाएं।
नेटवर्क का एक दृश्य प्राप्त करें।
मैं लिनक्स सर्वर पर कमांड-लाइन पर ऐसा करना चाहूंगा क्योंकि मेरे लैपटॉप में अधिक शक्ति नहीं है। मैंने उस सर्वर और स्टेटनेट लाइब्रेरी पर आर स्थापित किया है। मैंने 2009 के इस पोस्ट को मुझसे अधिक सक्षम पाया, जो मुझे एक ही काम करने की कोशिश कर रहा था और इसके साथ समस्या थी। इसलिए मैं सोच रहा था कि किसी और के पास यह करने के लिए कोई संकेत है, अधिमानतः मुझे कदम से कदम उठाना क्योंकि मैं केवल सीएसवी फ़ाइल को लोड करना जानता हूं और कुछ नहीं।
बस आपको एक विचार देने के लिए, यह है कि मेरी CSV फ़ाइल कैसी दिखती है:
$ head comments.csv
"src","dest"
"6493","139"
"406705","369798"
$ wc -l comments.csv
4210369 comments.csv