4 तरीके हैं जिनका आप उपयोग कर सकते हैं:
- DISTINCT
- समूह द्वारा
- सबक्वेरी
- ROW_NUMBER () के साथ सामान्य टेबल एक्सप्रेशन (CTE)
TABLEपरीक्षण डेटा के साथ निम्नलिखित नमूने पर विचार करें :
CREATE TEMPORARY TABLE dupes(word text, num int, id int);
INSERT INTO dupes(word, num, id)
VALUES ('aaa', 100, 1)
,('bbb', 200, 2)
,('ccc', 300, 3)
,('bbb', 400, 4)
,('bbb', 200, 5)
,('ccc', 300, 6)
,('ddd', 400, 7)
,('bbb', 400, 8)
,('aaa', 100, 9)
,('ccc', 300, 10);
विकल्प 1: DISTINCT का चयन करें
यह सबसे सरल और सीधे आगे है, लेकिन सबसे सीमित तरीका भी है:
SELECT DISTINCT word, num
FROM dupes
ORDER BY word, num;
विकल्प 2: ग्रुप बाय
समूहीकरण आप समेकित डेटा को जोड़ने के लिए, की तरह की अनुमति देता है min(id), max(id), count(*), आदि:
SELECT word, num, min(id), max(id), count(*)
FROM dupes
GROUP BY word, num
ORDER BY word, num;
विकल्प 3: उपशम
एक उप-वर्ग का उपयोग करते हुए, आप पहले नकली पंक्तियों को अनदेखा करने के लिए पहचान सकते हैं, और फिर WHERE NOT IN (subquery)निर्माण के साथ बाहरी क्वेरी में उन्हें फ़िल्टर कर सकते हैं :
SELECT distinct d2.id
FROM dupes d1
INNER JOIN dupes d2 ON d2.word=d1.word AND d2.num=d1.num
WHERE d2.id > d1.id
SELECT *
FROM dupes
WHERE id NOT IN (
SELECT d2.id
FROM dupes d1
INNER JOIN dupes d2 ON d2.word=d1.word AND d2.num=d1.num
WHERE d2.id > d1.id
)
ORDER BY word, num;
विकल्प 4: ROW_NUMBER () के साथ सामान्य तालिका अभिव्यक्ति
सामान्य तालिका अभिव्यक्ति (CTE) में, समूह कॉलम द्वारा विभाजित ROW_NUMBER () का चयन करें, और वांछित क्रम में ऑर्डर करें। फिर केवल उन अभिलेखों का चयन करें जिनके पास है ROW_NUMBER() = 1:
WITH CTE AS (
SELECT *
,row_number() OVER(PARTITION BY word, num ORDER BY id) AS row_num
FROM dupes
)
SELECT word, num, id
FROM cte
WHERE row_num = 1
ORDER BY word, num;