भौगोलिक सीमाओं में एक शब्द / टैग क्लाउड फिट करना


15

क्या दुनिया के नक्शे पर किसी टैग या शब्द क्लाउड (जिसे वर्डल के रूप में भी जाना जाता है ) को प्रदर्शित करने के लिए कोई भी उपलब्ध उपकरण या एक सिफारिश के तरीके हैं , इस उदाहरण में बहुत कुछ: मैप: संयुक्त राज्य अमेरिका के उपनाम ? (एनवाई टाइम्स पर अन्य उदाहरण हो सकते हैं।)

ध्यान दें कि ऊपर दिए गए उदाहरण में, शब्द निश्चित निर्देशांक द्वारा स्थित हैं, जबकि टेक्स्ट क्लाउडिंग को स्वचालित रूप से शब्द एल्गोरिथ्म ( एसओ पर वर्णित ) के साथ लागू किया जा सकता है। तो, क्या कोई ऐसा सॉफ़्टवेयर है जो आपको किसी दिए गए देश पर यादृच्छिक रूप से शब्द डालने देता है, या क्या आपको लगता है कि शब्द मूल एल्गोरिथ्म को जोड़ना सबसे अच्छा है (जैसे, पूर्वनिर्धारित सीमाओं के आधार पर बाधाओं को जोड़कर)?



@underdark उस धागे को इंगित करने के लिए धन्यवाद। हालांकि, यह मुझे जियोटैगिंग से अधिक संबंधित लगता है, जबकि मैं एक ऐसे समाधान की तलाश में हूं जहां हमें प्रत्येक शब्द के लिए ज्ञात स्थानिक निर्देशांक (जैसे, शहर या काउंटी) से जुड़ना न हो। दूसरे शब्दों में, किसी देश के शब्दों का लेआउट उसके वास्तविक सीमाओं के अलावा अन्य बाधाओं से मुक्त होना चाहिए। यदि दूसरों को लगता है कि यह वास्तव में एक डुप्लिकेट है, तो मैं इसे बिना किसी जांच के हटा सकता हूं।
२:११ को

@chl: तो सीमाओं के अंदर शब्दों के स्थान का कोई अर्थ नहीं है? फिर यह कोई नकल नहीं है।
UnderDark

@underdark हां, बिल्कुल। वर्डले का मुख्य विचार उनके सापेक्ष आवृत्तियों द्वारा आकार के साथ एक अच्छा दिखने वाला स्थानिक लेआउट खोजने की कोशिश कर रहा है। फिर, मैं सिर्फ संभव (x, y) के विकल्प को "सीमाओं" पर समन्वित करना चाहता हूं।
chl

GSE में यहाँ कुछ टैग / क्लाउड थ्रेड हैं। gis.stackexchange.com/search?q=tag+cloud ऐसा लगता है कि टैग / क्लाउड से क्लाउड को अलग करने के लिए कुछ प्रयास (शायद स्टैक एक्सचेंज समुदाय द्वारा शुरू किए गए) होने चाहिए। अपनी खोज में टैग के साथ भी मुझे "ऐसा लग रहा है" जैसे सभी क्लाउड थ्रेड वापस आ गए हैं। शायद हम मेटा पर चर्चा शुरू करने के लिए एक सूत्र शुरू कर सकते हैं। या शायद यह किसी और को परेशान नहीं करता है। ???
ब्रैड नेसोम

जवाबों:


4

यह बहुत कम ट्विकिंग लेता है: आइसोटैटिक लाइनों (अर्थात, क्षैतिज और ऊर्ध्वाधर खंडों) द्वारा बहुभुज सीमा को अनुमानित करें और, प्रारंभिक स्थितियों के रूप में, बाहरी स्थानों में उन पंक्तियों के साथ गठबंधन किए गए बक्से (रिक्त सामग्री के साथ) में, बहुभुज और आंतरिक में बहुभुज के बाउंडिंग बॉक्स में। इस बिंदु पर कॉन्फ़िगरेशन बिल्कुल वैसा ही दिखेगा जैसे कि वर्डले एल्गोरिथ्म कुछ समय के लिए जा रहा था और बाउंडिंग बॉक्स की परिधि के चारों ओर पहले शब्दों को रखने के लिए हुआ था। एल्गोरिथम को वहां से ले जाने दें।

वास्तव में, यह बहुभुज का प्रतिनिधित्व शुरू से ही चतुष्कोण के साथ करता है और अन्यथा वर्डले एल्गोरिथम को पुन: प्रस्तुत करता है।

यदि आप बहुभुज में हजारों शब्द नहीं रख रहे हैं और यदि आपके पास थोड़ा-थोड़ा कंप्यूटिंग समय है, तो आपको एक स्थानिक इंडेक्स को कोड करने की आवश्यकता नहीं है: आप ब्रूट-फोर्स सभी जोड़े की तुलना का उपयोग करके टकराव का पता लगा सकते हैं बाउंडिंग बॉक्स। एक छोटे से अधिक काम के साथ आप x- और y- निर्देशांक द्वारा छांटे गए शब्द स्थानों की सूची बनाए रख सकते हैं और टकराव का पता लगाने वाले एल्गोरिथ्म को कारगर बनाने के लिए इन सूचियों का दोहन कर सकते हैं।


6

बहुत तरकीब। मैं खुद ऐसा कुछ करने की कोशिश कर रहा हूं, लेकिन एक्सिस मैप्स से इस तरह का टाइपोग्राफिक मैप तैयार करना।

यहाँ छवि विवरण दर्ज करें

आप क्यूगिस या मेपनिक के साथ कुछ कोशिश कर सकते हैं, मूल बातें होंगी:
1) शब्दों की गणना करें और घटनाओं की संख्या से वजन उत्पन्न करें।
2) एक बहुभुज के अंदर यादृच्छिक अंक उत्पन्न करते हैं।
3) प्रत्येक बिंदु के लिए एक शब्द अपलोड करें और यह टेबल टेबल पर वजन है।
4) टेक्स्ट को वज़न के आधार पर फ़ॉन्ट आकार के साथ ड्रा करें।

आप तालिका में एक यादृच्छिक घुमाव और रंग भी जोड़ सकते हैं।


(+1) टाइपोग्राफिक मानचित्र इंगित करने के लिए धन्यवाद। यह मुझे याद दिलाता है कि मैं कुछ महीने पहले ठंडे सामान में आया था। मैं इसे आज़माता हूँ, लेकिन मैं सोच रहा था कि क्या SO पर @aeby द्वारा उपलब्ध उपलब्ध पायथन कोड भी उपयोगी नहीं होगा, बशर्ते मैं देश की सीमाओं पर विरोधाभासों को जोड़ दूं । मैं QGis से काफी परिचित नहीं हूं लेकिन मैं इसे सीखने की कोशिश करूंगा।
२:११ को

समान रूप से यादृच्छिक बिंदुओं पर शब्द रखने से आम तौर पर कई ओवरलैप बनेंगे। यदि शब्द समान रूप से बहुभुज को भरने के लिए स्केल किए जाते हैं - जो ज्यादातर मामलों में वांछनीय स्थिति है - तो यादृच्छिक बिंदुओं का उपयोग करना निश्चित है काम नहीं करना। यह एक स्थानिक सिम्युलेटेड एनलिंग एल्गोरिथ्म के लिए एक अच्छी शुरुआत होगी, हालांकि :-)।
whuber

वे ओवरलैप नहीं करते क्योंकि क्यूगिस और मेपनिक में टक्कर डिटेक्टर होते हैं। लेकिन कुछ शब्दों को दबा दिया जाएगा। कई अन्य समस्याएं हैं, जैसे, बहुभुज के आकार के आधार पर आपको कितने शब्दों की आवश्यकता होगी?
पाब्लो

@whuber, आपकी विचारधारा का अनुसरण करते हुए, शायद यादृच्छिक बिंदुओं के बजाय, एल्गोरिथ्म बहुभुज को अन्य बहुभुजों से भरना शुरू कर सकता है, जो शब्द के आकार के साथ शीर्ष बाएं से बॉटन दाईं ओर होता है। फिर इन बहुभुजों को लेबल करें।
पाब्लो


हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.