मान्यताओं / स्पष्टीकरण
infinity
ऊपरी सीमा को खोलने और खोलने के बीच अंतर करने की आवश्यकता नहीं है upper(range) IS NULL
। (आप इसे वैसे भी कर सकते हैं, लेकिन यह इस तरह से सरल है।)
चूंकि date
एक असतत प्रकार है, सभी श्रेणियों में डिफ़ॉल्ट [)
सीमाएं हैं।
प्रति प्रलेखन:
बिल्ट-इन रेंज प्रकार int4range
, int8range
और daterange
सभी एक कैनोनिकल फॉर्म का उपयोग करते हैं जिसमें निचला बाउंड शामिल होता है और ऊपरी बाउंड को बाहर करता है; वह यह है कि [)
।
अन्य प्रकारों के लिए (जैसे tsrange
!) यदि संभव हो तो मैं इसे लागू करूंगा:
शुद्ध एसक्यूएल के साथ समाधान
स्पष्टता के लिए सीटीई के साथ:
WITH a AS (
SELECT range
, COALESCE(lower(range),'-infinity') AS startdate
, max(COALESCE(upper(range), 'infinity')) OVER (ORDER BY range) AS enddate
FROM test
)
, b AS (
SELECT *, lag(enddate) OVER (ORDER BY range) < startdate OR NULL AS step
FROM a
)
, c AS (
SELECT *, count(step) OVER (ORDER BY range) AS grp
FROM b
)
SELECT daterange(min(startdate), max(enddate)) AS range
FROM c
GROUP BY grp
ORDER BY 1;
या , उपश्रेणियों के साथ ही, तेज लेकिन कम आसान भी पढ़ें:
SELECT daterange(min(startdate), max(enddate)) AS range
FROM (
SELECT *, count(step) OVER (ORDER BY range) AS grp
FROM (
SELECT *, lag(enddate) OVER (ORDER BY range) < startdate OR NULL AS step
FROM (
SELECT range
, COALESCE(lower(range),'-infinity') AS startdate
, max(COALESCE(upper(range), 'infinity')) OVER (ORDER BY range) AS enddate
FROM test
) a
) b
) c
GROUP BY grp
ORDER BY 1;
या एक कम उप-स्तर के स्तर के साथ, लेकिन फ़्लिपिंग क्रम:
SELECT daterange(min(COALESCE(lower(range), '-infinity')), max(enddate)) AS range
FROM (
SELECT *, count(nextstart > enddate OR NULL) OVER (ORDER BY range DESC NULLS LAST) AS grp
FROM (
SELECT range
, max(COALESCE(upper(range), 'infinity')) OVER (ORDER BY range) AS enddate
, lead(lower(range)) OVER (ORDER BY range) As nextstart
FROM test
) a
) b
GROUP BY grp
ORDER BY 1;
- पूरी तरह से उल्टे क्रम क्रम को प्राप्त करने के लिए
ORDER BY range DESC NULLS LAST
(के साथ NULLS LAST
) दूसरे चरण में विंडो को सॉर्ट करें। यह सस्ता होना चाहिए (उत्पादन करने में आसान, सुझावित सूचकांक के क्रमबद्ध रूप से पूरी तरह से मेल खाता है) और कोने के मामलों के लिए सटीक है ।
rank IS NULL
समझाना
a
: द्वारा आदेश देते समय range
, एक विंडो फ़ंक्शन के साथ ऊपरी बाउंड ( ) के चल रहे अधिकतम की गणना करें enddate
।
NULL बाउंड्स (अनबाउंड) को +/- के साथ बदलें ( infinity
केवल विशेष NULL केस को सरल बनाने के लिए)।
b
: उसी तरह के क्रम में, यदि पिछला enddate
पहले से है , तो startdate
हमारे पास एक अंतर है और एक नई सीमा शुरू करें ( step
)।
याद रखें, ऊपरी सीमा हमेशा बाहर रखी जाती है।
c
: grp
अन्य विंडो फ़ंक्शन के साथ चरणों की गणना करके फॉर्म समूह ( )।
बाहरी SELECT
निर्माण में प्रत्येक समूह में निचले से ऊपरी हिस्से तक होता है। देखा।
अधिक विवरण के साथ एसओ पर बारीकी से संबंधित जवाब:
Plpgsql के साथ प्रक्रियात्मक समाधान
किसी भी तालिका / स्तंभ नाम के लिए काम करता है, लेकिन केवल प्रकार के लिए daterange
।
छोरों के साथ प्रक्रियात्मक समाधान आमतौर पर धीमे होते हैं, लेकिन इस विशेष मामले में मुझे उम्मीद है कि फ़ंक्शन काफी तेजी से होगा क्योंकि इसे केवल एकल अनुक्रमिक स्कैन की आवश्यकता है :
CREATE OR REPLACE FUNCTION f_range_agg(_tbl text, _col text)
RETURNS SETOF daterange AS
$func$
DECLARE
_lower date;
_upper date;
_enddate date;
_startdate date;
BEGIN
FOR _lower, _upper IN EXECUTE
format($$SELECT COALESCE(lower(t.%2$I),'-infinity') -- replace NULL with ...
, COALESCE(upper(t.%2$I), 'infinity') -- ... +/- infinity
FROM %1$I t
ORDER BY t.%2$I$$
, _tbl, _col)
LOOP
IF _lower > _enddate THEN -- return previous range
RETURN NEXT daterange(_startdate, _enddate);
SELECT _lower, _upper INTO _startdate, _enddate;
ELSIF _upper > _enddate THEN -- expand range
_enddate := _upper;
-- do nothing if _upper <= _enddate (range already included) ...
ELSIF _enddate IS NULL THEN -- init 1st round
SELECT _lower, _upper INTO _startdate, _enddate;
END IF;
END LOOP;
IF FOUND THEN -- return last row
RETURN NEXT daterange(_startdate, _enddate);
END IF;
END
$func$ LANGUAGE plpgsql;
कॉल करें:
SELECT * FROM f_range_agg('test', 'range'); -- table and column name
तर्क SQL समाधान के समान है, लेकिन हम एक पास से कर सकते हैं।
एसक्यूएल फिडल।
सम्बंधित:
डायनामिक SQL में उपयोगकर्ता इनपुट को संभालने के लिए सामान्य ड्रिल:
सूची
इनमें से प्रत्येक समाधान के लिए एक सादा (डिफ़ॉल्ट) बीटीआरई सूचकांक range
बड़े तालिकाओं में प्रदर्शन के लिए महत्वपूर्ण होगा:
CREATE INDEX foo on test (range);
Btree इंडेक्स सीमित प्रकारों के लिए सीमित उपयोग का है , लेकिन हम पूर्व-सॉर्ट किए गए डेटा और शायद एक इंडेक्स-केवल स्कैन भी प्राप्त कर सकते हैं।