एक नई सेवा (जैसे कि एक गैर-आरडीबीएमएस डेटा स्टोर या एक संदेश कतार) का उपयोग करते समय मैं जिन चीजों के बारे में सोचता हूं उनमें से एक है: "मुझे अपने डेटा की संरचना कैसे करनी चाहिए?"।
मैंने कुछ परिचयात्मक सामग्रियों को पढ़ा और देखा है। विशेष रूप से, उदाहरण के लिए, काफ्का: लॉग प्रोसेसिंग के लिए एक वितरित संदेश प्रणाली , जो लिखते हैं:
- "एक विषय वह कंटेनर है जिसके साथ संदेश जुड़े हुए हैं"
- "समानता की सबसे छोटी इकाई एक विषय का विभाजन है। इसका तात्पर्य यह है कि सभी संदेश ... जो किसी विषय के एक विशेष विभाजन से संबंधित हैं, उपभोक्ता समूह में उपभोक्ता द्वारा उपभोग किए जाएंगे।"
यह जानना, एक अच्छा उदाहरण क्या होगा जो दिखाता है कि विषयों और विभाजन का उपयोग कैसे करें? कुछ विषय कब होना चाहिए? विभाजन कब होना चाहिए?
उदाहरण के रूप में, मान लें कि मेरा (क्लीजुर) डेटा ऐसा दिखता है:
{:user-id 101 :viewed "/page1.html" :at #inst "2013-04-12T23:20:50.22Z"}
{:user-id 102 :viewed "/page2.html" :at #inst "2013-04-12T23:20:55.50Z"}
विषय पर आधारित होना चाहिए user-id
? viewed
? at
? विभाजन के बारे में क्या?
मैं कैसे तय करूं?