तालिका से "n" लगातार मुक्त नंबर प्राप्त करें


17

मेरे पास इस तरह की संख्याओं के साथ कुछ तालिका है (स्थिति या तो मुफ़्त है या लिखित है)

आईडी_सेट नंबर की स्थिति         
-----------------------
1 000001 ASSIGNED
1 000002 मुफ़्त
1 000003 सहायता प्राप्त
1 000004 मुफ़्त
1 000005 मुफ़्त
1 000006 सहायता प्राप्त
1 000007 सहायता प्राप्त
1 000008 मुफ़्त
1 000009 मुफ़्त
1 000010 मुफ़्त
1 000011 असिस्ड
1 000012 ASSIGNED
1 000013 असिस्ड
1 000014 मुफ़्त
1 001515 के अनुसार

और मुझे "n" लगातार संख्याओं को खोजने की आवश्यकता है, इसलिए n = 3 के लिए, क्वेरी वापस आ जाएगी

1 000008 मुफ़्त
1 000009 मुफ़्त
1 000010 मुफ़्त

इसे प्रत्येक id_set का केवल पहला संभव समूह वापस करना चाहिए (वास्तव में, इसे केवल id_set प्रति क्वेरी के लिए निष्पादित किया जाएगा)

मैं WINDOW फ़ंक्शंस की जाँच कर रहा था, जैसे कुछ प्रश्नों की कोशिश की COUNT(id_number) OVER (PARTITION BY id_set ROWS UNBOUNDED PRECEDING), लेकिन यह सब मुझे मिल गया :) मैं तर्क के बारे में नहीं सोच सकता था कि पोस्टग्रेज़ में ऐसा कैसे करें।

मैं वर्चुअल कॉलम बनाने के बारे में सोच रहा था जिसमें WINDOW फ़ंक्शंस की गिनती की जा रही हो, जहां हर नंबर के लिए पंक्तियाँ हों, जहाँ स्थिति = 'मुफ़्त' हो, फिर पहली संख्या चुनें, जहाँ गिनती मेरे "n" नंबर के बराबर हो।

या हो सकता है कि समूह संख्याएँ स्थिति के अनुसार हों, लेकिन केवल एक ASSIGNED से दूसरे ASSIGNED और केवल उन समूहों का चयन करें जिनमें कम से कम "n" अंक हों

संपादित करें

मुझे यह क्वेरी मिली (और इसे थोड़ा बदल दिया)

WITH q AS
(
  SELECT *,
         ROW_NUMBER() OVER (PARTITION BY id_set, status ORDER BY number) AS rnd,
         ROW_NUMBER() OVER (PARTITION BY id_set ORDER BY number) AS rn
  FROM numbers
)
SELECT id_set,
       MIN(number) AS first_number,
       MAX(number) AS last_number,
       status,
       COUNT(number) AS numbers_count
FROM q
GROUP BY id_set,
         rnd - rn,
         status
ORDER BY
     first_number

जो मुफ़्त / मिश्रित संख्याओं के समूह का उत्पादन करता है, लेकिन मैं केवल पहले समूह से सभी संख्याएँ लेना चाहूँगा जो शर्त पूरी करती हैं

एसक्यूएल फिडल

जवाबों:


17

यह एक समस्या है। यह मानते हुए कि एक ही id_setसेट में कोई अंतराल या डुप्लिकेट नहीं हैं :

WITH partitioned AS (
  SELECT
    *,
    number - ROW_NUMBER() OVER (PARTITION BY id_set) AS grp
  FROM atable
  WHERE status = 'FREE'
),
counted AS (
  SELECT
    *,
    COUNT(*) OVER (PARTITION BY id_set, grp) AS cnt
  FROM partitioned
)
SELECT
  id_set,
  number
FROM counted
WHERE cnt >= 3
;

इस प्रश्न के लिए यहाँ एक SQL फिडेल डेमो * लिंक है: http://sqlfiddle.com/#/1/a2633/1

अपडेट करें

केवल एक सेट वापस करने के लिए, आप रैंकिंग के एक और दौर में जोड़ सकते हैं:

WITH partitioned AS (
  SELECT
    *,
    number - ROW_NUMBER() OVER (PARTITION BY id_set) AS grp
  FROM atable
  WHERE status = 'FREE'
),
counted AS (
  SELECT
    *,
    COUNT(*) OVER (PARTITION BY id_set, grp) AS cnt
  FROM partitioned
),
ranked AS (
  SELECT
    *,
    RANK() OVER (ORDER BY id_set, grp) AS rnk
  FROM counted
  WHERE cnt >= 3
)
SELECT
  id_set,
  number
FROM ranked
WHERE rnk = 1
;

यहाँ इस एक के लिए एक डेमो भी है: http://sqlfiddle.com/# -1/a2633/2

यदि आपको कभी भी इसे प्रतिid_set सेट एक करने की आवश्यकता है , तो RANK()कॉल को इस तरह बदलें :

RANK() OVER (PARTITION BY id_set ORDER BY grp) AS rnk

इसके अतिरिक्त, आप क्वेरी को सबसे छोटे मिलान सेट को वापस कर सकते हैं (अर्थात पहले तीन लगातार संख्याओं के पहले सेट को वापस करने का प्रयास करें यदि यह मौजूद है, अन्यथा चार, पांच आदि), इस तरह:

RANK() OVER (ORDER BY cnt, id_set, grp) AS rnk

या इस तरह (एक प्रति id_set):

RANK() OVER (PARTITION BY id_set ORDER BY cnt, grp) AS rnk

* इस उत्तर में जुड़े SQL फिडेल डेमो 9.1.8 उदाहरण का उपयोग करते हैं क्योंकि 9.2.1 इस समय काम नहीं कर रहा है।


बहुत बहुत धन्यवाद, यह अच्छा लग रहा है, लेकिन इसे बदलना संभव है इसलिए केवल पहले समूह का नंबर लौटाया गया है? अगर मैं इसे cnt> = 2 में बदलता हूं, तो मुझे 5 नंबर मिलते हैं (2 समूह = 2 + 3 नंबर)
boobiq

@boobiq: क्या आप एक id_setया सिर्फ एक चाहते हैं? कृपया अपने प्रश्न को अपडेट करें यदि यह शुरुआत से ही इसका हिस्सा था। (ताकि अन्य पूरी आवश्यकताओं को देख सकें और अपने सुझाव प्रस्तुत कर सकें या अपने उत्तर अपडेट कर सकें।)
एंड्री एम

मैंने अपना प्रश्न संपादित किया (वापसी के बाद), यह केवल एक id_set के लिए निष्पादित किया जाएगा, इसलिए केवल पहला संभव समूह मिला
boobiq

10

एक सरल और तेज संस्करण:

SELECT min(number) AS first_number, count(*) AS ct_free
FROM (
    SELECT *, number - row_number() OVER (PARTITION BY id_set ORDER BY number) AS grp
    FROM   tbl
    WHERE  status = 'FREE'
    ) x
GROUP  BY grp
HAVING count(*) >= 3  -- minimum length of sequence only goes here
ORDER  BY grp
LIMIT  1;
  • number(जैसा कि प्रश्न में प्रदान किया गया है) में संख्याओं के अंतर रहित अनुक्रम की आवश्यकता होती है ।

  • statusइसके अलावा 'FREE', साथ ही संभव मूल्यों की किसी भी संख्या के लिए काम करता है NULL

  • प्रमुख विशेषता गैर-योग्य पंक्तियों को समाप्त करने के बाद row_number()से घटाना है number। लगातार संख्या एक ही में समाप्त होती है grp- और आरोही क्रमgrp में होने की गारंटी भी है ।

  • फिर आप GROUP BY grpसदस्यों की गणना कर सकते हैं। चूंकि आप पहली घटना चाहते हैं , ORDER BY grp LIMIT 1और आपको अनुक्रम की प्रारंभिक स्थिति और लंबाई मिल सकती है (> = n ) हो सकती है।

पंक्तियों का समूह

संख्याओं का एक वास्तविक सेट प्राप्त करने के लिए, तालिका को दूसरी बार न देखें। बहुत सस्ता के साथ generate_series():

SELECT generate_series(first_number, first_number + ct_free - 1)
    -- generate_series(first_number, first_number + 3 - 1) -- only 3
FROM  (
   SELECT min(number) AS first_number, count(*) AS ct_free
   FROM  (
      SELECT *, number - row_number() OVER (PARTITION BY id_set ORDER BY number) AS grp
      FROM   tbl
      WHERE  status = 'FREE'
      ) x
   GROUP  BY grp
   HAVING count(*) >= 3
   ORDER  BY grp
   LIMIT  1
   ) y;

यदि आप वास्तव में अग्रणी शून्य के साथ एक स्ट्रिंग चाहते हैं जैसे आप अपने उदाहरण मूल्यों में प्रदर्शित करते हैं, to_char()तो FM(भरण मोड) संशोधक के साथ उपयोग करें :

SELECT to_char(generate_series(8, 11), 'FM000000')

विस्तारित परीक्षण मामले और दोनों प्रश्नों के साथ एसक्यूएल फिडल

बारीकी से संबंधित जवाब:


8

यह ऐसा करने के लिए एक काफी सामान्य तरीका है।

ध्यान रखें कि यह आपके numberकॉलम के लगातार बने रहने पर निर्भर करता है । यदि यह विंडो फ़ंक्शन नहीं है और / या CTE टाइप-सॉल्यूशन की आवश्यकता होगी:

SELECT 
    number
FROM
    mytable m
CROSS JOIN
   (SELECT 3 AS consec) x
WHERE 
    EXISTS
       (SELECT 1 
        FROM mytable
        WHERE number = m.number - x.consec + 1
        AND status = 'FREE')
    AND NOT EXISTS
       (SELECT 1 
        FROM mytable
        WHERE number BETWEEN m.number - x.consec + 1 AND m.number
        AND status = 'ASSIGNED')

घोषणा पोस्टग्रेज में उस तरह से काम नहीं करेगी।
a_horse_with_no_name

@a_horse_with_no_name कृपया इसे ठीक करने के लिए स्वतंत्र महसूस करें :)
JNK

कोई खिड़की कार्य, बहुत अच्छा! हालांकि मुझे लगता है कि यह होना चाहिए M.number-consec+1(जैसे 10 के लिए यह होना चाहिए 10-3+1=8)।
एंड्री एम

@AndriyM खैर यह "अच्छा" नहीं है क्योंकि यह उस numberक्षेत्र के अनुक्रमिक मूल्यों पर निर्भर है क्योंकि यह नाजुक है । गणित पर अच्छा कॉल मैं इसे सही करूंगा।
जेएनके

2
मैंने पोस्टग्रेज के लिए वाक्य रचना को ठीक करने के लिए स्वतंत्रता ली। पहले EXISTSसरलीकृत किया जा सकता है। चूँकि हमें केवल यह सुनिश्चित करने की आवश्यकता है कि पहले की कोई पंक्तियाँ मौजूद हैं, इसलिए हम इसे छोड़ सकते हैं AND status = 'FREE'। और मैं भविष्य में अतिरिक्त विकल्पों के खिलाफ इसे सख्त EXISTSकरने के status <> 'FREE'लिए 2 में स्थिति को बदल दूंगा।
इरविन ब्रान्डेसटेटर

5

यह केवल 3 नंबरों में से पहला लौटाएगा। इसकी आवश्यकता नहीं है कि मूल्य numberनिरंतर हैं। SQL-Fiddle में परीक्षण किया गया :

WITH cte3 AS
( SELECT
    *,
    COUNT(CASE WHEN status = 'FREE' THEN 1 END) 
        OVER (PARTITION BY id_set ORDER BY number
              ROWS BETWEEN CURRENT ROW AND 2 FOLLOWING)
      AS cnt
  FROM atable
)
SELECT
  id_set, number
FROM cte3
WHERE cnt = 3 ;

और यह सभी नंबर दिखाएगा (जहां 3 या अधिक लगातार 'FREE'स्थितियां हैं):

WITH cte3 AS
( SELECT
    *,
    COUNT(CASE WHEN status = 'FREE' THEN 1 END) 
        OVER (PARTITION BY id_set ORDER BY number
              ROWS BETWEEN CURRENT ROW AND 2 FOLLOWING)
      AS cnt
  FROM atable
)
, cte4 AS
( SELECT
    *, 
    MAX(cnt) 
        OVER (PARTITION BY id_set ORDER BY number
              ROWS BETWEEN 2 PRECEDING AND CURRENT ROW)
      AS maxcnt
  FROM cte3
)
SELECT
  id_set, number
FROM cte4
WHERE maxcnt >= 3 ;

0
select r1.number from some_table r1, 
some_table r2,
some_table r3,
some_table r4 
where r3.number <= r2.number 
and r3.number >= r1.number 
and r3.status = 'FREE' 
and r2.number = r1.number + 4 
and r4.number <= r2.number 
and r4.number >= r1.number 
and r4.status = 'ASSIGNED'
group by r1.number, r2.number having count(r3.number) = 5 and count(r4.number) = 0 order by r1.number asc limit 1 ;

इस मामले में 5 लगातार संख्या - इसलिए अंतर 4 या दूसरे शब्दों में count(r3.number) = nऔर होना चाहिए r2.number = r1.number + n - 1

जुड़ने के साथ:

select r1.number 
from some_table r1 join 
 some_table r2 on (r2.number = r1.number + :n -1) join
 some_table r3 on (r3.number <= r2.number and r3.number >= r1.number) join
 some_table r4 on (r4.number <= r2.number and r4.number >= r1.number)
where  
 r3.status = 'FREE' and
 r4.status = 'ASSIGNED'
group by r1.number, r2.number having count(r3.number) = :n and count(r4.number) = 0 order by r1.number asc limit 1 ;

आपको लगता है कि 4-वे कार्टेसियन उत्पाद ऐसा करने का एक कुशल तरीका है?
जेएनके

वैकल्पिक रूप से आप इसे आधुनिक JOINवाक्य रचना के साथ लिख सकते हैं ?
जेएनके

खैर मैं खिड़की के कार्यों पर भरोसा नहीं करना चाहता था और एक समाधान दिया जो किसी भी sql-db पर काम करेगा।
यूनोक्टियम

-1
CREATE TABLE #ConsecFreeNums
(
     id_set BIGINT
    ,number VARCHAR(10)
    ,status VARCHAR(10)
)

CREATE TABLE #ConsecFreeNumsResult
(
     Seq    INT
    ,id_set BIGINT
    ,number VARCHAR(10)
    ,status VARCHAR(10)
)

INSERT #ConsecFreeNums
SELECT 1, '000002', 'FREE' UNION
SELECT 1, '000003', 'ASSIGNED' UNION
SELECT 1, '000004', 'FREE' UNION
SELECT 1, '000005', 'FREE' UNION
SELECT 1, '000006', 'ASSIGNED' UNION
SELECT 1, '000007', 'ASSIGNED' UNION
SELECT 1, '000008', 'FREE' UNION
SELECT 1, '000009', 'FREE' UNION
SELECT 1, '000010', 'FREE' UNION
SELECT 1, '000011', 'ASSIGNED' UNION
SELECT 1, '000012', 'ASSIGNED' UNION
SELECT 1, '000013', 'ASSIGNED' UNION
SELECT 1, '000014', 'FREE' UNION
SELECT 1, '000015', 'ASSIGNED'

DECLARE @id_set AS BIGINT, @number VARCHAR(10), @status VARCHAR(10), @number_count INT, @number_count_check INT

DECLARE ConsecFreeNumsCursor CURSOR FAST_FORWARD FOR
SELECT
       id_set
      ,number
      ,status
 FROM
      #ConsecFreeNums
WHERE id_set = 1
ORDER BY number

OPEN ConsecFreeNumsCursor

FETCH NEXT FROM ConsecFreeNumsCursor INTO @id_set, @number, @status

SET @number_count_check = 3
SET @number_count = 0

WHILE @@FETCH_STATUS = 0
BEGIN
    IF @status = 'ASSIGNED'
    BEGIN
        IF @number_count = @number_count_check
        BEGIN
            SELECT 'Results'
            SELECT * FROM #ConsecFreeNumsResult ORDER BY number
            BREAK
        END
        SET @number_count = 0
        TRUNCATE TABLE #ConsecFreeNumsResult
    END
    ELSE
    BEGIN
        SET @number_count = @number_count + 1
        INSERT #ConsecFreeNumsResult SELECT @number_count, @id_set, @number, @status
    END
    FETCH NEXT FROM ConsecFreeNumsCursor INTO @id_set, @number, @status
END

CLOSE ConsecFreeNumsCursor
DEALLOCATE ConsecFreeNumsCursor

DROP TABLE #ConsecFreeNums
DROP TABLE #ConsecFreeNumsResult

मैं बेहतर प्रदर्शन के लिए कर्सर का उपयोग कर रहा हूं - क्या बड़ी संख्या में पंक्तियों का चयन करना चाहिए
रवि रामास्वामी

मैंने कोड को हाइलाइट करके और { }संपादक पर बटन दबाकर आपके उत्तर को सुधार दिया । का आनंद लें!
jcolebrand

आप अपने उत्तर को संपादित करना चाहते हैं और बता सकते हैं कि आपको क्यों लगता है कि कर्सर बेहतर प्रदर्शन प्रदान करता है।
jcolebrand

कर्सर एक अनुक्रमिक प्रक्रिया है। यह लगभग एक समय में एक फ्लैट फ़ाइल एक रिकॉर्ड पढ़ने की तरह है। किसी एक स्थिति में, मैंने MEM TEMP तालिका को एक एकल कर्सर से बदल दिया। इससे प्रसंस्करण समय 26 घंटे से घटकर 6 घंटे रह गया। मैं परिणाम के माध्यम से पाश करने के लिए neseted का उपयोग करना पड़ा।
रवि रामास्वामी

क्या आपने कभी अपनी मान्यताओं को परखने की कोशिश की है? आप हैरान हो सकते हैं। कोने के मामलों को छोड़कर सादा एसक्यूएल सबसे तेज है।
एरविन ब्रान्डेसटेटर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.