जवाबों:
Facebook पृष्ठों का एक बड़ा सूचकांक बनाया गया था और यह एक धार के रूप में उपलब्ध है (यह ~ 2.8Gb है) http://btjunkie.org/torrent/Facebook-directory-personal-details-for-100-million-users-3979e54c73099d291605e7579b90838c2cd86a8958
Twitter डेटासेट को Infochimps: http://infochimps.com/tags/twitter पर टैग किया गया है
एक lastfm डेटासेट http://mtg.upf.edu/node/1671 पर उपलब्ध है
बस इसे मिला: 476 मिलियन ट्विटर ट्वीट्स ( @yarapavan के माध्यम से )।
हमने 2009 में और फिर 2009 में उपयोगकर्ताओं के दोस्तों के लिए एक ट्विटर डेटासेट को क्यूरेट किया है। आप अधिक जानकारी यहाँ पा सकते हैं: http://strict.dista.uninsubria.it/?p=364
फेसबुक सोशल ग्राफ, एप्लिकेशन इंस्टॉलेशन और Last.fm उपयोगकर्ता, ईवेंट, http://odysseas.calit2.uci.edu/research/ पर समूह
दो डेटासेट (अप्रैल-मई 2009 को एकत्र किए गए), जिनमें कुछ अनाउंस किए गए गुणों के साथ ~ 1 मिलियन उपयोगकर्ता फेसबुक के प्रतिनिधि नमूने हैं: प्रत्येक नमूना उपयोगकर्ता के लिए, मित्र सूची, गोपनीयता सेटिंग्स और नेटवर्क सदस्यता शामिल हैं। एक तीसरे डेटासेट (फरवरी 2008 को एकत्र) में एक द्विदलीय ग्राफ शामिल है जो फेसबुक उपयोगकर्ताओं द्वारा एप्लिकेशन इंस्टॉलेशन का प्रतिनिधित्व करता है। डेली एक्टिव यूजर्स के साथ एक चौथा डेटासेट और 6 महीने से अधिक के एप्लिकेशन इंस्टॉलेशन (सितंबर 2007-फरवरी 2008 को एकत्रित)। एक पांचवां डेटासेट जिसमें मल्टीग्राफ नमूने का उपयोग करके प्राप्त Last.fm उपयोगकर्ताओं का प्रतिनिधि नमूना शामिल है (जुलाई 2010 को एकत्र किया गया)।
डेटासेट खोजने के लिए एक अच्छा संसाधन है:
/ आर / डेटासेटरेडिट पर ।
उस पृष्ठ पर एक त्वरित नज़र इस स्रोत को प्रकट करती है , जिसमें आपके लिए कुछ उपयोगी हो सकता है।
यह पेपर एक फेसबुक डेटासेट का उपयोग करता है जो यहां उपलब्ध है। यहाँ लेखकों से वर्णन है:
डेटा में सितंबर 2005 में एक बार के स्नैपशॉट से 100 अमेरिकी कॉलेजों और विश्वविद्यालयों के नोड्स और लिंक (और कुछ जनसांख्यिकीय जानकारी) का पूरा सेट शामिल है ।