जवाबों:
उस प्रक्रिया या घटना के बारे में सोचें जिसका आप विश्लेषण करना चाहते हैं।
मान लें कि आप लूप एनालिटिक्स का निर्माण कर रहे थे , और अपनी साइट पर यात्राओं (एकल पृष्ठ के अनुरोध के विपरीत) का विश्लेषण करना चाहते हैं। वेबसाइट पर जाना एक प्रक्रिया है।
एक तथ्य तालिका एक प्रक्रिया या घटना का प्रतिनिधित्व करती है जिसका आप विश्लेषण करना चाहते हैं, इस मामले में यह साइट विज़िट की एक सूची है। आप जितनी चाहें उतनी फैक्ट टेबल रख सकते हैं, एक प्रक्रिया या घटना के अनुसार।
साइट विज़िट के विश्लेषण में आपके लिए क्या चीजें उपयोगी हो सकती हैं?
तकनीकी रूप से, आप यह सब एक ही तालिका में डाल सकते हैं - जैसा कि आप एक्सेल में करेंगे, लेकिन यह वास्तविक बड़ा वास्तविक तेज़ होगा, इसलिए हम सामान्य स्तर का एक स्तर करेंगे। आयामी डिजाइन अक्सर सिर्फ "एक बड़ी तालिका में विश्लेषण के लिए आपको आवश्यक सभी कुछ डालते हैं", और फिर एक स्तर को सामान्य करते हैं।
तो आपकी तथ्य तालिका इस तरह दिखाई देगी:
web_browser_key bigint
ip_address_key bigint
start_date_key int
referring_page_key bigint
landing_page_key bigint
exit_page_key bigint
duration_seconds int
number_of_pages_visited int
इसमें प्रमुख मानों का एक समूह है जो अन्य तालिकाओं में मूल्यों का संदर्भ देता है, और दो गैर-कुंजी। गैर-कुंजी संख्यात्मक मान हैं और इसे उपाय कहा जाता है । क्या आप वेब ब्राउज़र ब्रांड नाम का औसत ले सकते हैं? नहीं, इसलिए यह एक आयाम है। क्या आप यात्रा की अवधि का औसत ले सकते हैं? हां, तो यह एक उपाय है।
अन्य तालिकाओं को आयाम तालिकाओं कहा जाता है , और ip_address
आयाम तालिका इस तरह दिख सकती है:
ip_address_key bigserial primary key, /* use meaningless surrogate keys */
ip_address inet unique,
country text,
division text,
locality text,
latitude numeric(8,6),
longitude numeric(9,6)
ध्यान दें कि यह सामान्यीकृत नहीं है: देश को शहर (इलाके) से प्राप्त किया जा सकता है। हालांकि एक डेटा वेयरहाउस में, हम पहले विश्लेषण की सुविधा के बारे में परवाह करते हैं । विश्लेषण की सुविधा से मेरा मतलब है कि गहरे जुड़ाव से बचना।
ध्यान दें कि आयाम तालिका में कुछ डेटा पदानुक्रमित है : देश> विभाजन> स्थानीयता। आपका OLAP सर्वर (उम्मीद) ड्रिल-डाउन ऑपरेशन का समर्थन करने के लिए पदानुक्रम को समझता है।
एक तार्किक घन केवल आयामों और मापों का संग्रह है, जिसके साथ आप काम कर रहे हैं। रुबिक के घन के विपरीत, इसके 3 से अधिक आयाम हो सकते हैं। बस अपने डेटा सेट में एक कॉलम के रूप में एक आयाम के बारे में सोचें।
OLAP एक ऑपरेशन का एक सेट है जिसे आप डेटा सेट के खिलाफ कर सकते हैं, जैसे कि एक धुरी, टुकड़ा करना, dicing, ड्रिलिंग। एक्सेल PivotTables के बारे में सोचो। एक OLAP सर्वर OLAP संचालन की सुविधा देता है।
† आमतौर पर विदेशी कुंजियों के बिना
नीचे दी गई छवि में जो एक मूल स्टार स्कीमा का एक उदाहरण है। आयाम Dim_Tables हैं।
ये आमतौर पर वे मान होते हैं, जिनके द्वारा आप डेटा का विश्लेषण करना चाहते हैं। इसलिए आप किसी विशेष देश में, किसी विशेष तिथि सीमा पर, किसी विशेष उत्पाद की बिक्री को देखना चाहते हैं।
Fact_sales तालिका में आपके पास केवल एक उपाय है, जो Unit_Sold है।
उपाय (सबसे सरल स्तर पर) केवल ऐसी चीजें हैं जो आप आयामों में मानदंडों के आधार पर विश्लेषण करते समय एकत्र करना चाहते हैं।
अगर कुछ और विशिष्ट है जो आप जानना चाहते हैं तो कृपया मुझे बताएं।
city
आपके स्कीमा में कोई उल्लेख नहीं है , इसलिए जब आप कहते हैं किcountry could be derived from city
मैं सकारात्मक नहीं हूं तो आपका क्या मतलब है।