मेडियन, मोड्स, परसेंटाइल और OLAP


9

मैं नौसिखिया हूँ, मैं OLAP के चारों ओर अपना सिर लपेटने की कोशिश कर रहा हूँ, और मेरे कुछ सवाल हैं।

  • प्रश्न 1: क्या एक OLAP घन मंज़िलों, मोडों, प्रतिशतकों को संग्रहीत कर सकता है?
  • प्रश्न 2: क्या कोई उपयोगकर्ता-लिखित एमडीएक्स क्वेरी पंक्ति-स्तरीय डेटा का सारांश लौटा सकता है? (उदा:% लेनदेन> $ 100)। या क्यूब डिज़ाइनर को क्यूब में जोड़ना चाहिए?
  • प्रश्न 3: क्या कोई ओएलएपी उत्पाद अब पंक्ति स्तरीय डेटा तक पहुँचने के लिए तंत्र प्रदान करते हैं? कौन कौन से?

हमारा आईटी विभाग इस बात पर प्रतिक्रिया की तलाश कर रहा है कि हम किस तरह के मुद्दों पर एक विशेष एमएस अनैलिस सर्विसेस रोलैप क्यूब के साथ हैं। हमारे पास इसके पीछे रिलेशनल डेटाबेस तक पहुंच नहीं है और गणना करने की आवश्यकता है जो वर्तमान में क्यूब में उपायों के रूप में उपलब्ध नहीं हैं।

मुझे देखने दो कि क्या मेरे पास यह अधिकार है।

  1. एक घन गिनती, साधन, अनुपात, मानक विचलन के लिए आंकड़े प्रदान कर सकता है।
  2. यदि घन डिजाइनर द्वारा प्रदान किए गए एक उपाय में किसी विशेष आंकड़े को पूरा नहीं किया गया है, तो क्या हम इसे प्राप्त करने के लिए MDX क्वेरी लिख सकते हैं? या क्या उन्हें पंक्ति स्तर के डेटा से पूर्व-गणना करने के लिए घन को बदलने की आवश्यकता है?
  3. एक घन आंकड़े प्रदान नहीं कर सकता है जैसे कि मध्यस्थ, मोड या प्रतिशत, इन आंकड़ों को सही ढंग से बढ़ाना नहीं है।

वे कहते हैं कि मैं Lland Wilkinson की द ग्रामर ऑफ़ ग्राफिक्स और डेटा माइनिंग और OLAP के अपने अध्याय में पढ़ रहा हूँ , वे कहते हैं

ये [घन संचालन] गणना, साधन, अनुपात और मानक विचलन जैसे आंकड़ों के साथ अच्छी तरह से काम करते हैं। उपवर्गों पर सरल एकत्रीकरण की गणना मूल सारांश आँकड़ों का उत्पादन करने के लिए रेखीय कार्यों में संयुक्त रूप से sums, वर्गों और अन्य शब्दों पर काम करके की जा सकती है।

वे माध्यिका, मोड और प्रतिशत जैसे आँकड़ों के साथ ठीक से काम नहीं करते हैं क्योंकि इन आँकड़ों का समुच्चय उनके समुच्चय का आँकड़ा नहीं है। उदाहरण के लिए, माध्यकों का माध्य समुच्चय का माध्यिका नहीं है।

वह आगे बढ़ता है:

एक और अधिक परिष्कृत रॉप मॉडल हाल ही में सामने आया है। कई तकनीकों के माध्यम से, सांख्यिकीय एल्गोरिदम को वास्तविक समय में रिलेशनल मॉडल के माध्यम से कच्चे डेटा तक पहुंच प्रदान करना संभव है। यह दृष्टिकोण डेटा क्यूब्स जैसी संरचनाओं द्वारा पेश किए गए कठोर एकत्रीकरण की तुलना में अधिक आशाजनक है।

इस वास्तुकला के सबसे सुरुचिपूर्ण रूप में, अनुप्रयोग अपने डेटा-हैंडलिंग विधियों के बारे में जानकारी प्रदान करने और लौटी जानकारी के आधार पर उपयुक्त कार्रवाई करने के लिए दूरस्थ कनेक्शन का अनुरोध कर सकते हैं। इस रूप में, घटक वास्तुकला वितरित कंप्यूटिंग के वास्तविक वादे को प्राप्त कर सकता है: डिजाइन और निष्पादन जो साइट, ऑपरेटिंग सिस्टम, या भाषा से स्वतंत्र हैं।

यह 2005 में लिखा गया था। क्या किसी को इस पद्धति को लागू करने वाले उत्पादों के बारे में पता है जो पंक्ति-स्तरीय डेटा एक्सेस के लिए अनुमति देता है?


1
कोई लेने वाला नहीं? प्रश्न को बेहतर बनाने के लिए किसी भी सुझाव का उत्तर देने के लिए कैसे?
टॉमी ओ'डेल

जवाबों:


5

अपने सवालों के जवाब देने के लिए:

  1. क्यूब मीडियन, मोड्स (या औसत) को स्टोर नहीं करता है, लेकिन आप क्वेश्चन लिख सकते हैं जो उन्हें कैलकुलेट करता है और क्यूब में कैलकुलेटेड उपायों के रूप में एम्बेड करता है। इस तरह की संगणना को एम्बेड करने की क्षमता OLAP प्रौद्योगिकी के मुख्य अद्वितीय विक्रय बिंदुओं में से एक है।
  2. यदि आपके पास एक आयाम है जो व्यक्तिगत पंक्तियों की पहचान कर सकता है (जो तथ्य तालिका पर एक पहचानकर्ता से प्राप्त पतित या 'तथ्य' आयाम हो सकता है) तो आप अलग-अलग पंक्तियों के आधार पर एक प्रश्न कर सकते हैं। हालांकि, ओएलएपी आयामों और समुच्चय के संदर्भ में काम करता है, इसलिए आपको व्यक्तिगत पंक्तियों (एक मूल्य से बना कुल मिलाकर) की पहचान करने में सक्षम आयाम की आवश्यकता होगी।
  3. कोई भी OLAP टूल ऐसा कर सकता है जिसे (2) में वर्णित किया गया है, साथ ही वे आम तौर पर 'ड्रिल-थ्रू' नामक एक तंत्र का समर्थन करते हैं, जहां क्यूब एक दिए गए स्लाइस को अंतर्निहित ट्रांजैक्शनल डेटा का एक सीमा रेखा लौटाएगा जिसे आप में ड्रिल करते हैं।

यदि आप गणना करना चाहते हैं जो सीधे क्यूब लिपि में उपलब्ध नहीं हैं, तो कई ओएलएपी उपकरण जैसे कि देर से, लामेंटेड प्रोक्लेरिटी आपको कस्टम एमडीएक्स आधारित गणनाओं से जुड़े प्रश्नों को तैयार करने की अनुमति देगा। जब तक घन के पास वास्तविक गणना करने के लिए आवश्यक जानकारी नहीं है, तब तक कस्टम MDX गणना को आपके द्वारा आवश्यक किसी भी गणना का समर्थन करने में सक्षम होना चाहिए।

यद्यपि OLAP क्वेरी पारंपरिक रूप से समग्र प्रश्नों में सांख्यिकीय प्रश्नों से जुड़ी होती हैं, यदि आपके पास एक आयाम है जो आपको विस्तार से बताने की अनुमति देता है, तो आपको उन प्रश्नों को तैयार करना निश्चित रूप से संभव है जो मध्यस्थों, प्रतिशतता या हिस्टोग्राम प्रश्नों की गणना करेंगे, जिनसे मोड का अनुमान लगाया जा सकता है या गणना की जा सकती है।

उदाहरण के लिए, इसमें एक पेरेटो विश्लेषण क्वेरी का एक उदाहरण है , जो रैंकिंग पर आधारित है।

कई क्यूब उत्पाद हाइब्रिड या रिलेशनल ओएलएपी मोड में काम कर सकते हैं, जहां वे डेटा को खुद नहीं बनाए रखते हैं, लेकिन एक अंतर्निहित डेटाबेस से क्वेरी करते हैं। इसके अलावा, शुद्ध ROLAP टूल जैसे कि बिज़नेस ऑब्जेक्ट, रिपोर्ट बिल्डर या डिस्कवर एक अंतर्निहित डेटाबेस से क्वेरी कर सकते हैं और पंक्ति द्वारा कार्य पंक्ति कर सकते हैं। हालाँकि, उनके पास समर्पित OLAP उत्पादों के परिष्कार की कमी है, और उनके पास बॉक्स से बाहर सांख्यिकीय विश्लेषण क्षमता के लिए बहुत कुछ नहीं है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.