यह "यूनाइटेड स्टेट ऑफ रेडिट" ग्राफ कैसे बनाया गया है?


9

नीचे p से एक ग्राफ है। 202 क्रिश्चियन रूडर के डाटासिल्स , हालांकि इसे जेम्स डॉवेल ने बनाया था। यह रिश्तों को दिखाता है, जो विभिन्न शीर्ष 200 उप-विभाजनों को धोखा देता है, जो reddit.com पर रुचि के क्षेत्र हैं जहां उपयोगकर्ता लिंक, टिप्पणियां और वोट सबमिट कर सकते हैं। ये इस साइट पर टैग के समान हैं। सबरडिट क्षेत्रों का आकार उनकी लोकप्रियता का प्रतिनिधित्व करता है। सबरेडिट्स को क्रॉस-कमेंटिंग द्वारा वर्गीकृत किया जाता है, और गहरा टिंट उन लोगों के प्रतिशत का प्रतिनिधित्व करता है जो उस सब्रेडिट के भीतर रहते हैं और दूसरों को पोस्ट नहीं करते हैं।

क्या यह सिर्फ एक मानक Voronoi विभाजन है, जिसमें कुछ रंग बिरंगेपन के लिए हैं, या क्या यह कुछ और शामिल है?

इनमें से एक बनाने के बारे में कैसे जाना जा सकता है?

रेडिट के संयुक्त राज्य अमेरिका


3
मुझे नहीं पता, लेकिन मेरा अनुमान है कि यह एक वोरोनोई कार्टोग्राम है - जब तक कि वोरोनोई क्षेत्र के प्रत्येक क्षेत्र एक पूर्व निर्धारित मूल्य के लिए आनुपातिक नहीं है, तब तक बिंदु केंद्र (नहीं दिखाए गए) को समायोजित करता है।
whuber

जवाबों:


7

सबसे पहले, मैं जेम्स डॉवेल हूं, इसलिए मैं जवाब देने के लिए विशिष्ट रूप से योग्य हूं (जवाब देने के लिए एक खाता बनाया गया है, अगर कोई चिंतित है तो पहचान की पुष्टि कर सकता है)।

सरल जवाब वास्तव में दूसरों ने क्या हासिल किया है: यह एक http://en.wikipedia.org/wiki/Voronoi-diagram है । हमने 194 पृष्ठ पर एक ही अवधारणा का उपयोग किया, जहां वोरोनोई साइटें हैं, जो अक्षांशों के देशांतर जोड़े हैं जो craigslist.org द्वारा सूचीबद्ध हैं।

दुर्भाग्य से, यह ज्ञान वास्तव में बहुत उपयोगी नहीं है। क्रेगलिस्ट ग्राफ के साथ, यह स्पष्ट है कि साइटों के लिए किन मूल्यों का उपयोग करना है। लेकिन इस ग्राफ़ में x / y निर्देशांक निर्दिष्ट करने के लिए Dataclysm ने किस जादुई चाल का उपयोग किया?

इसका उत्तर बहुत अधिक लोगों की अपेक्षा में शामिल है, और मैं यह नहीं कह सकता कि हमने जो किया, उसे फिर से करने की सलाह देते हैं। मैं शर्त लगाता हूं कि कोई और यहां एक दृष्टिकोण की सिफारिश कर सकता है जो कम या ज्यादा समान परिणाम प्राप्त करता है और बहुत सरल है।

सच तो यह है:

ईसाई और मैं इस अध्याय के लिए रेखांकन बनाते हुए 3 महीने से अधिक समय के लिए आगे और पीछे चले गए, ताकि हम कभी काम न कर सकें। लेकिन, एक दृष्टिकोण के परिणाम अक्सर अगले में खिलाए जाते हैं।

  1. सबसे महत्वपूर्ण बात यह है कि दुर्भाग्य से एक तकनीक और कुछ छवि संपत्ति शामिल हैं जो मैं किसी भी सार्थक तरीके से तलाशने या साझा करने के लिए स्वतंत्र नहीं हूं, क्योंकि हम अभी भी किसी भी तरह उनका उपयोग कर सकते हैं। मैं क्या कहूंगा कि हमने एक जटिल http://en.wikipedia.org/wiki/Graph_theory#Graph लिया, जिसे हमने Reddit के डेटा से अनुमति के साथ संकलित किया, जिसमें उपयोगकर्ता और सब्रेडिट शामिल हैं, और हमने इस ग्राफ और विभिन्न डेरिवेटिव के साथ खेला। इसके अंदर http://gephi.github.io/(मैं इन दिनों "OpenOrd" का विशेष रूप से प्रशंसक हूं)। वास्तव में हमें एक शानदार छवि मिली - अगर यह प्रकाशित हुई होती तो पुस्तक का मुख्य आकर्षण होता - लेकिन जब यह किसी वेबसाइट पर ठीक काम करती तो यह पुस्तक में अच्छी तरह से नहीं छपती - पर्याप्त कमरा या संकल्प नहीं। क्रिश्चियन मूल रूप से इसे पुस्तक में एक तह के रूप में स्थापित करने पर विचार कर रहा था, लेकिन यह क्राउन के लिए प्रभावी नहीं था।

  2. हालाँकि, इस बिंदु पर हमारे पास एक छवि थी जो सबरडिट्स के लिए x / y निर्देशांक थी और वे कम से कम अपेक्षाकृत अच्छी तरह से x / y स्थान में व्यवस्थित थे। हम भी जल्दी में थे क्योंकि प्रकाशन की समय सीमा निकट आ रही थी। मैं एक प्रोग्रामर पहले और एक डेटा लड़का दूसरा हूं, इसलिए किताब में पृष्ठ की अत्यंत तंग सीमाओं और घड़ी के समय को छोड़ने के लिए, मेरी वृत्ति Box2D में एक कार्यक्रम लिखने की थी, जिसने पृष्ठ की सीमाओं का अनुकरण किया दीवारें, ग्राफ़ के एक बहुत ही सिकुड़े हुए संस्करण को अंदर डालती हैं, और उन नोड्स को बढ़ाते हुए सिम्युलेटेड हो जाती हैं (बॉक्स 2 डी के लिए प्राकृतिक नहीं है, यह कठोर निकायों की उम्मीद करता है जो तब तक नहीं बदलते) जब तक कि सब कुछ दीवारों और एक दूसरे के खिलाफ फ्लश नहीं हो जाता। नोड्स उस सब्रेडिट के आकार के आनुपातिक रूप से एक दर से बढ़ते थे, जिसका अर्थ था कि अंतिम आकार भी उसी तरह आनुपातिक होगा।रनिंग करते समय box2d प्रोग्राम का स्क्रीनशॉट

  3. उस का परिणाम बहुत अच्छा नहीं लग रहा था, लेकिन इसने मुझे बहुत मूल्यवान दिया: वोरोनोई साइटें। मैंने परिणामी बॉक्स 2 डी पॉलीगोन के सेंट्रोइड्स को लिया, उन्हें एक मानक प्रक्रिया के माध्यम से रखा, और यही वह है जो पुस्तक में ग्राफ के लिए उपयोग किया गया था। मुझे विश्वास है कि फ़ोटोशॉप में टेक्स्ट लेबल हाथ से लगाए गए थे।

संयोग से, सेल रंग एक आंकड़े से संबंधित था जिसे हमने ग्राफ (ए) में वापस बनाने के लिए विकसित किया था


1
साइट पर आपका स्वागत है। यह करीब है कि मैंने इसे कैसे करने की कोशिश की होगी। नोड्स को xy निर्देशांक निर्दिष्ट करने के लिए जो भी ग्राफ लेआउट का उपयोग करें। (यह कुछ बल आधारित लेआउट में संभव हो सकता है कि कोशिकाओं को किनारे के आकार और द्रव्यमान को निर्दिष्ट करने के आधार पर आपके द्वारा इच्छित आकार बनाने के लिए, लेकिन मुझे संदेह है कि वे सटीक होंगे।) मूल ग्राफ लेआउट के वोरोनोई क्षेत्रों को बनाने के बाद, फिर मैं। स्कैपीटैड की तरह एक कार्टोग्राम टूल का उपयोग करें, जो अंत क्षेत्रों को ब्याज की सांख्यिकी के आनुपातिक बनाता है। यह बॉक्स 2 डी में आपके द्वारा सुझाए गए कार्यक्रम के समान ही समाप्त होता है।
एंडी डब्ल्यू

0

यह वोरोनोई बहुभुज उपस्थिति के साथ एक शब्द क्लाउड समस्या की तरह दिखता है। आपको स्थान तय करने के लिए शब्द आवृत्ति का उपयोग करने की आवश्यकता है (उच्च आवृत्ति का अर्थ केंद्र)। जब तक निर्धारित शब्दों का स्थान, वोरोनोई बहुभुज को खींचना एक बड़ा सौदा नहीं होना चाहिए।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.