जब सिस्टम-वर्जन वाली टेम्पोरल टेबल (SQL Server 2016 में नई) का उपयोग किया जाता है, तो एक बड़े रिलेशनल डेटा वेयरहाउस में धीरे-धीरे बदलते आयामों को संभालने के लिए इस सुविधा का उपयोग करने पर क्वेरी संलेखन और प्रदर्शन निहितार्थ क्या हैं?
उदाहरण के लिए, मान लें कि मेरे पास एक कॉलम के Customer
साथ 100,000-पंक्ति आयाम Postal Code
और Sales
एक CustomerID
विदेशी कुंजी कॉलम के साथ एक बहु-अरब-पंक्ति तथ्य तालिका है । और मान लें कि मैं "ग्राहक के पोस्टल कोड द्वारा कुल 2014 बिक्री" को क्वेरी करना चाहता हूं। सरलीकृत डीडीएल इस तरह है (स्पष्टता के लिए कई कॉलमों को छोड़ना):
CREATE TABLE Customer
(
CustomerID int identity (1,1) NOT NULL PRIMARY KEY CLUSTERED,
PostalCode varchar(50) NOT NULL,
SysStartTime datetime2 GENERATED ALWAYS AS ROW START NOT NULL,
SysEndTime datetime2 GENERATED ALWAYS AS ROW END NOT NULL,
PERIOD FOR SYSTEM_TIME (SysStartTime, SysEndTime)
)
WITH (SYSTEM_VERSIONING = ON);
CREATE TABLE Sale
(
SaleId int identity(1,1) NOT NULL PRIMARY KEY CLUSTERED,
SaleDateTime datetime2 NOT NULL,
CustomerId int NOT NULL FOREIGN KEY REFERENCES Customer(CustomerID),
SaleAmount decimal(10,2) NOT NULL
);
जहां यह दिलचस्प हो जाता है कि ग्राहक वर्ष के दौरान स्थानांतरित हो सकते हैं, तो एक ही ग्राहक के पास अलग-अलग डाक कोड हो सकते हैं। और यह भी दूर से संभव है कि एक ग्राहक दूर चला गया और फिर वापस चला गया, जिसका अर्थ है कि एक ही डाक कोड के साथ एक ही ग्राहक के लिए कई इतिहास रिकॉर्ड हो सकते हैं! "डाक कोड द्वारा बिक्री" की मेरी क्वेरी को ग्राहकों के डाक कोड समय के साथ कैसे बदलते हैं, इसके सही परिणामों की गणना करने में सक्षम होना चाहिए।
मैं समझता हूं कि ग्राहक आयाम को अकेले क्वेरी करने के लिए टेम्पोरल टेबल का उपयोग कैसे करें (जैसे SELECT * FROM Customer FOR SYSTEM_TIME FROM '2014-1-1' TO '2015-1-1'
) लेकिन मुझे यकीन नहीं है कि तथ्य तालिका में सबसे सटीक और कुशलता से कैसे शामिल हो।
क्या यह है कि मुझे इसे कैसे क्वेरी करना चाहिए?
SELECT c.PostalCode, sum(s.SaleAmount) SaleAmount
FROM Customer c FOR SYSTEM_TIME FROM '2014-1-1' TO '2015-1-1'
JOIN Sale s ON s.CustomerId = c.CustomerId
WHERE s.SaleDateTime >= '2014-1-1' AND s.SaleDateTime < '2015-1-1'
AND c.SysStartTime >= s.SaleDateTime
AND c.SysEndTime < s.SaleDateTime
GROUP BY c.PostalCode
और इस तरह के प्रश्न करते समय मुझे क्या प्रदर्शन पर विचार करना चाहिए?