सार्वजनिक रूप से उपलब्ध सामाजिक नेटवर्क डेटासेट / एपीआई


26

सार्वजनिक रूप से उपलब्ध डेटासेट की हमारी महान सूची के विस्तार के रूप में , मैं यह जानना चाहूंगा कि क्या सार्वजनिक रूप से उपलब्ध सामाजिक नेटवर्क डेटासेट / क्रॉलिंग एपीआई की कोई सूची है। यह बहुत अच्छा होगा यदि डेटासेट / एपीआई के लिंक के साथ, उपलब्ध डेटा की विशेषताओं को जोड़ा गया। ऐसी जानकारी होनी चाहिए, और यह तक सीमित नहीं है:

  • सोशल नेटवर्क का नाम;
  • यह किस प्रकार की उपयोगकर्ता जानकारी प्रदान करता है (पोस्ट, प्रोफ़ाइल, मैत्री नेटवर्क, ...);
  • क्या यह एपीआई (और दर: 10 / मिनट, 1k / महीना, ...) के माध्यम से अपनी सामग्री को क्रॉल करने की अनुमति देता है;
  • क्या यह संपूर्ण डेटासेट का स्नैपशॉट प्रदान करता है।

किसी भी सुझाव और अतिरिक्त विशेषताओं को जोड़ा जाना बहुत स्वागत है।

जवाबों:


20

सामाजिक नेटवर्क एपीआई के बारे में शब्दों की एक जोड़ी। लगभग एक साल पहले मैंने शोधकर्ताओं के लिए लोकप्रिय सामाजिक नेटवर्क 'एपीआई' की समीक्षा लिखी थी। दुर्भाग्य से, यह रूसी में है। यहाँ एक सारांश है:

ट्विटर ( https://dev.twitter.com/docs/api/1.1 )

  • ट्वीट्स / ग्रंथों और उपयोगकर्ताओं के बारे में लगभग सभी डेटा उपलब्ध है;
  • समाजशास्त्रीय डेटा की कमी;
  • महान स्ट्रीमिंग एपीआई: वास्तविक समय पाठ प्रसंस्करण के लिए उपयोगी;
  • प्रोग्रामिंग भाषाओं के लिए बहुत सारे रैपर;
  • नेटवर्क संरचना (कनेक्शन) प्राप्त करना संभव है, लेकिन समय-महंगा (1 मिनट प्रति 1 अनुरोध)।

फेसबुक ( https://developers.facebook.com/docs/reference/api/ )

  • दर सीमा: प्रति सेकंड 1 अनुरोध के बारे में;
  • अच्छी तरह से प्रलेखित, सैंडबॉक्स उपस्थित;
  • FQL (SQL-like) और «रेगुलर रेस्ट» ग्राफ एपीआई;
  • दोस्ती के आंकड़े और समाजशास्त्र संबंधी विशेषताएं मौजूद हैं;
  • डेटा का एक बहुत कुछ घटना क्षितिज से परे है : केवल दोस्तों के दोस्तों और दोस्तों का डेटा कम या ज्यादा पूरा होता है, लगभग कुछ भी नहीं यादृच्छिक उपयोगकर्ता के बारे में जांच की जा सकती है;
  • कुछ अजीब एपीआई कीड़े, और ऐसा लगता है कि कोई भी इसके बारे में परवाह नहीं करता है (उदाहरण के लिए, एफक्यूएल के माध्यम से उपलब्ध कुछ विशेषताएं, लेकिन ग्राफ एपीआई पर्याय के माध्यम से नहीं)।

इंस्टाग्राम ( http://instagram.com/developer/ )

  • दर सीमा: प्रति घंटे 5000 अनुरोध;
  • वास्तविक समय एपीआई (ट्विटर के लिए स्ट्रीमिंग एपीआई की तरह, लेकिन तस्वीरों के साथ) - इसका कनेक्शन थोड़ा मुश्किल है: कॉलबैक का उपयोग किया जाता है;
  • समाजशास्त्रीय डेटा की कमी;
  • तस्वीरें, फिल्टर डेटा उपलब्ध;
  • अप्रत्याशित खामियां (उदाहरण के लिए, पोस्ट / फोटो के लिए केवल 150 टिप्पणियाँ एकत्र करना संभव है)।

Foursquare ( https://developer.foursquare.com/overview/ )

  • दर सीमा: प्रति घंटे 5000 अनुरोध;
  • भू-स्थानिक डेटा का राज्य :)
  • गोपनीयता के मुद्दों के कारण शोध से काफी बंद। चेकइन डेटा एकत्र करने के लिए एक बार में 4sq, bit.ly और ट्विटर एपीआई के साथ काम करने वाले समग्र पार्सर के निर्माण की आवश्यकता होती है;
  • फिर से: sociodemographic डेटा की कमी।

Google+ ( https://developers.google.com/+/api/latest/ )

  • लगभग 5 अनुरोध प्रति सेकंड (सत्यापित करने का प्रयास करें);
  • मुख्य विधियाँ: गतिविधियाँ और लोग;
  • फेसबुक की तरह, यादृच्छिक उपयोगकर्ता के लिए बहुत से व्यक्तिगत डेटा छिपा हुआ है;
  • उपयोगकर्ता कनेक्शन डेटा की कमी।

और प्रतियोगिता से बाहर: मैंने रूसी पाठकों के लिए सामाजिक नेटवर्क की समीक्षा की, और यहां # 1 नेटवर्क vk.com है । यह कई भाषाओं में अनुवादित है, लेकिन केवल रूस और अन्य सीआईएस देशों में लोकप्रिय है। एपीआई डॉक्स लिंक: http://vk.com/dev/ । और मेरे दृष्टिकोण से, यह होमब्रेव सोशल मीडिया अनुसंधान के लिए सबसे अच्छा विकल्प है। कम से कम, रूस में। इसीलिए:

  • दर सीमा: प्रति सेकंड 3 अनुरोध;
  • सार्वजनिक पाठ और मीडिया डेटा उपलब्ध;
  • उपलब्ध समाजशास्त्रीय डेटा: यादृच्छिक उपयोगकर्ता उपलब्धता के स्तर के बारे में 60-70% है;
  • उपयोगकर्ताओं के बीच कनेक्शन भी उपलब्ध हैं: यादृच्छिक उपयोगकर्ता के लिए लगभग सभी मित्रता डेटा उपलब्ध है;
  • कुछ विशेष तरीके: उदाहरण के लिए, वास्तविक समय में सटीक उपयोगकर्ता के लिए ऑनलाइन / ऑफ़लाइन स्थिति प्राप्त करने के लिए एक विधि है, और कोई भी अपने दर्शकों के लिए शेड्यूल बना सकता है।

1
सरासर अजीब! मैं वास्तव में कुछ इस तरह की उम्मीद कर रहा था जैसे कई जवाबों में भंग हो गया, और आप पूरे जवाब के लिए आते हैं: उत्तर के लिए धन्यवाद। अच्छी नौकरी! :)
रूबेंस

1
मैंने गुंजाइश छोड़ दी लिंक्डइन, YouTube, सीक्रेट। शायद अन्य क्षेत्रीय नेटवर्क (QQ?)। और उनके बारे में कोई भी जानकारी प्राप्त करने में खुशी होगी।
सोबच

8

यह प्रति सामाजिक नेटवर्क नहीं है, लेकिन Stackexchange अपने पूरे डेटाबेस को समय-समय पर प्रकाशित करता है:

आप कुछ सामाजिक जानकारी का विश्लेषण करके निकाल सकते हैं, जो उपयोगकर्ता एक दूसरे से पूछते हैं और जवाब देते हैं। एक अच्छी बात यह है कि चूंकि पोस्ट टैग किए गए हैं, आप आसानी से उप-समुदायों का विश्लेषण कर सकते हैं।


6

सार्वजनिक रूप से उपलब्ध सामाजिक नेटवर्क डेटासेट की एक अच्छी सूची स्टैनफोर्ड नेटवर्क विश्लेषण परियोजना वेबसाइट पर पाई जा सकती है:

SNAP डेटासेट

साइट में इंटरनेट सोशल नेटवर्क डेटा (फेसबुक, ट्विटर, गूगल प्लस), अकादमिक पत्रिकाओं के लिए उद्धरण नेटवर्क, अमेज़ॅन से सह-क्रय नेटवर्क और कई अन्य प्रकार के नेटवर्क हैं। उन्होंने निर्देशित किया है, अप्रत्यक्ष और द्विदलीय रेखांकन और सभी डेटासेट स्नैपशॉट हैं जिन्हें संकुचित रूप में डाउनलोड किया जा सकता है।


5

जर्मनी से एक उदाहरण: ज़िंग लिंक्डिन के समान एक साइट है लेकिन जर्मन भाषी देशों तक सीमित है।

इसका लिंक डेवलपर केंद्रीय है: https://dev.xing.com/overview

इसके लिए पहुँच प्रदान करता है: उपयोगकर्ता प्रोफाइल, उपयोगकर्ताओं के बीच बातचीत (उपयोगकर्ता स्वयं तक सीमित), नौकरी विज्ञापन, संपर्क और संपर्क के संपर्क, नेटवर्क से समाचार और कुछ जियोलोकेशन एपि।

हां इसमें एक एपी है, लेकिन मुझे रेट के बारे में जानकारी नहीं मिली। लेकिन यह मुझे लगता है, कि कुछ जानकारी उपयोगकर्ता की सहमति तक सीमित है।


4

नेटवर्क रिपॉजिटरी ( http://networkrepository.com ) में सोशल नेटवर्क, वेब ग्राफ़, बायो और ब्रेन नेटवर्क आदि के टन हैं। सबसे अच्छी बात यह है कि विभिन्न सामाजिक नेटवर्क की तुलना / अन्वेषण के लिए उनके पास इंटरैक्टिव विज़ुअल एनालिटिक टूल भी हैं।


2

इस तरह के लिंक का एक छोटा संग्रह यहां पाया जा सकता है । उनमें से कई सामाजिक रेखांकन हैं।


मैं आप इस संदर्भ पोस्ट करने के लिए बहुत बहुत धन्यवाद, लेकिन मैं यहाँ सामाजिक नेटवर्क के लिए सार्वजनिक रूप से उपलब्ध डाटासेट / एपीआई बात करने के लिए जवाब उम्मीद कर रहा था, andalso से बताएं कि इस तरह के स्रोत के द्वारा प्रदान की जाती है (पदों की डाउनलोड दर, या जानकारी के प्रकार क्या या तो उपयोगकर्ताओं के बारे में)। जैसा कि आपका जवाब है, मुझे लगता है कि हमारे पास सार्वजनिक रूप से उपलब्ध डेटासेट की सूची में यह बहुत ही स्वागत योग्य होगा ।
Rubens

0

विभिन्न सोशल मीडिया प्लेटफ़ॉर्म + सेंटीमेंट लेबल (सकारात्मक, तटस्थ, नकारात्मक) से थाई पाठ

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.