क्यूब्स में क्या उपाय और आयाम हैं


21

मैं Microsoft Sql सर्वर बिजनेस इंटेलिजेंस के लिए बहुत नया हूं और Analysis Service(लेकिन मैं SQL सर्वर के साथ वर्षों से प्रोग्रामिंग कर रहा हूं)। क्या कोई भी सरल शब्दों में क्यूब्स में माप और आयाम का वर्णन कर सकता है (यदि यह छवियों के साथ संभव है)?

धन्यवाद

जवाबों:


39

उस प्रक्रिया या घटना के बारे में सोचें जिसका आप विश्लेषण करना चाहते हैं।

मान लें कि आप लूप एनालिटिक्स का निर्माण कर रहे थे , और अपनी साइट पर यात्राओं (एकल पृष्ठ के अनुरोध के विपरीत) का विश्लेषण करना चाहते हैं। वेबसाइट पर जाना एक प्रक्रिया है।

एक तथ्य तालिका एक प्रक्रिया या घटना का प्रतिनिधित्व करती है जिसका आप विश्लेषण करना चाहते हैं, इस मामले में यह साइट विज़िट की एक सूची है। आप जितनी चाहें उतनी फैक्ट टेबल रख सकते हैं, एक प्रक्रिया या घटना के अनुसार।

साइट विज़िट के विश्लेषण में आपके लिए क्या चीजें उपयोगी हो सकती हैं?

  • वेब ब्राउज़र के बारे में जानकारी (ब्रांड, स्क्रीन रिज़ॉल्यूशन, ...)
  • उपयोगकर्ता (देश, राज्य, शहर, आईएसपी, उनके आईपी पते के आधार पर) के बारे में जानकारी
  • यात्रा कब शुरू हुई (वर्ष, तिमाही, माह, सप्ताह, दिन) के बारे में जानकारी
  • यात्रा की अवधि
  • संदर्भित पृष्ठ, लैंडिंग पृष्ठ और निकास पृष्ठ (शीर्षक, url पथ)
  • यात्रा के दौरान पृष्ठों की संख्या देखी गई

तकनीकी रूप से, आप यह सब एक ही तालिका में डाल सकते हैं - जैसा कि आप एक्सेल में करेंगे, लेकिन यह वास्तविक बड़ा वास्तविक तेज़ होगा, इसलिए हम सामान्य स्तर का एक स्तर करेंगे। आयामी डिजाइन अक्सर सिर्फ "एक बड़ी तालिका में विश्लेषण के लिए आपको आवश्यक सभी कुछ डालते हैं", और फिर एक स्तर को सामान्य करते हैं।

तो आपकी तथ्य तालिका इस तरह दिखाई देगी:

web_browser_key          bigint
ip_address_key           bigint
start_date_key           int
referring_page_key       bigint
landing_page_key         bigint
exit_page_key            bigint
duration_seconds         int
number_of_pages_visited  int

इसमें प्रमुख मानों का एक समूह है जो अन्य तालिकाओं में मूल्यों का संदर्भ देता है, और दो गैर-कुंजी। गैर-कुंजी संख्यात्मक मान हैं और इसे उपाय कहा जाता है । क्या आप वेब ब्राउज़र ब्रांड नाम का औसत ले सकते हैं? नहीं, इसलिए यह एक आयाम है। क्या आप यात्रा की अवधि का औसत ले सकते हैं? हां, तो यह एक उपाय है।

अन्य तालिकाओं को आयाम तालिकाओं कहा जाता है , और ip_addressआयाम तालिका इस तरह दिख सकती है:

ip_address_key  bigserial primary key, /* use meaningless surrogate keys */
ip_address      inet unique,
country         text,
division        text,
locality        text,
latitude        numeric(8,6),
longitude       numeric(9,6)

ध्यान दें कि यह सामान्यीकृत नहीं है: देश को शहर (इलाके) से प्राप्त किया जा सकता है। हालांकि एक डेटा वेयरहाउस में, हम पहले विश्लेषण की सुविधा के बारे में परवाह करते हैं । विश्लेषण की सुविधा से मेरा मतलब है कि गहरे जुड़ाव से बचना।

ध्यान दें कि आयाम तालिका में कुछ डेटा पदानुक्रमित है : देश> विभाजन> स्थानीयता। आपका OLAP सर्वर (उम्मीद) ड्रिल-डाउन ऑपरेशन का समर्थन करने के लिए पदानुक्रम को समझता है।

एक तार्किक घन केवल आयामों और मापों का संग्रह है, जिसके साथ आप काम कर रहे हैं। रुबिक के घन के विपरीत, इसके 3 से अधिक आयाम हो सकते हैं। बस अपने डेटा सेट में एक कॉलम के रूप में एक आयाम के बारे में सोचें।

OLAP एक ऑपरेशन का एक सेट है जिसे आप डेटा सेट के खिलाफ कर सकते हैं, जैसे कि एक धुरी, टुकड़ा करना, dicing, ड्रिलिंग। एक्सेल PivotTables के बारे में सोचो। एक OLAP सर्वर OLAP संचालन की सुविधा देता है।

† आमतौर पर विदेशी कुंजियों के बिना


मुझे एक उदाहरण के साथ स्पष्टीकरण पसंद आया, लेकिन छोटा मुद्दा - cityआपके स्कीमा में कोई उल्लेख नहीं है , इसलिए जब आप कहते हैं कि country could be derived from cityमैं सकारात्मक नहीं हूं तो आपका क्या मतलब है।
डॉन चेडल

@mmcrae 'इलाके' शहर / शहर / गाँव के लिए सामान्य नाम है
नील मैकगिगन

13

नीचे दी गई छवि में जो एक मूल स्टार स्कीमा का एक उदाहरण है। आयाम Dim_Tables हैं।

ये आमतौर पर वे मान होते हैं, जिनके द्वारा आप डेटा का विश्लेषण करना चाहते हैं। इसलिए आप किसी विशेष देश में, किसी विशेष तिथि सीमा पर, किसी विशेष उत्पाद की बिक्री को देखना चाहते हैं।

Fact_sales तालिका में आपके पास केवल एक उपाय है, जो Unit_Sold है।

उपाय (सबसे सरल स्तर पर) केवल ऐसी चीजें हैं जो आप आयामों में मानदंडों के आधार पर विश्लेषण करते समय एकत्र करना चाहते हैं।

बेसिक स्टार स्कीमा

अगर कुछ और विशिष्ट है जो आप जानना चाहते हैं तो कृपया मुझे बताएं।


ऐसा लगता है कि यह छवि विकिपीडिया: en.wikipedia.org/wiki/Star_schema से आई है । आपको इसका उल्लेख करना चाहिए।
स्कारबी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.