कुछ क्षेत्रों पर डुप्लिकेट खोजने के लिए कथन का चयन करें


415

आप कई क्षेत्रों पर डुप्लिकेट खोजने के लिए एसक्यूएल बयान के साथ मेरी मदद कर सकते हैं?

उदाहरण के लिए, छद्म कोड में:

select count(field1,field2,field3) 
from table 
where the combination of field1, field2, field3 occurs multiple times

और उपरोक्त कथन से यदि कई घटनाएं होती हैं तो मैं पहले रिकॉर्ड को छोड़कर हर रिकॉर्ड को चुनना चाहूंगा ।


3
आपका छद्म कोड अस्पष्ट है, साथ ही आप उस आदेश को परिभाषित नहीं करते हैं जिसके अनुसार आप पहले नहीं चाहते हैं। मेरा सुझाव है कि आप कुछ नमूना डेटा दें।
अप्रयुक्त डेस

जवाबों:


840

उन क्षेत्रों की सूची प्राप्त करने के लिए जिनके लिए कई रिकॉर्ड हैं, आप उपयोग कर सकते हैं।

select field1,field2,field3, count(*)
  from table_name
  group by field1,field2,field3
  having count(*) > 1

पंक्तियों को हटाने के तरीके के बारे में अधिक जानकारी के लिए इस लिंक की जाँच करें।

http://support.microsoft.com/kb/139444

संपादित करें: जैसा कि अन्य उपयोगकर्ताओं ने उल्लेख किया है, यह तय करने के लिए एक मानदंड होना चाहिए कि ऊपर दिए गए लिंक में दृष्टिकोण का उपयोग करने से पहले आप "पहली पंक्तियों" को कैसे परिभाषित करते हैं। इसके आधार पर यदि आवश्यक हो तो आपको एक आदेश का उपयोग करके खंड और एक उप क्वेरी का उपयोग करना होगा। यदि आप कुछ नमूना डेटा पोस्ट कर सकते हैं, तो यह वास्तव में मदद करेगा।


42

आप "पहले एक" का उल्लेख करते हैं, इसलिए मैं मानता हूं कि आपके डेटा पर किसी प्रकार का आदेश है। मान लेते हैं कि आपका डेटा किसी क्षेत्र द्वारा ऑर्डर किया गया है ID

यह एसक्यूएल आपको पहले वाले को छोड़कर डुप्लिकेट प्रविष्टियों को प्राप्त करना चाहिए। यह मूल रूप से उन सभी पंक्तियों का चयन करता है, जिनके लिए (a) समान फ़ील्ड और (b) लोअर ID मौजूद है। प्रदर्शन बहुत अच्छा नहीं होगा, लेकिन यह आपकी समस्या को हल कर सकता है।

SELECT A.ID, A.field1, A.field2, A.field3
  FROM myTable A
 WHERE EXISTS (SELECT B.ID
                 FROM myTable B
                WHERE B.field1 = A.field1
                  AND B.field2 = A.field2
                  AND B.field3 = A.field3
                  AND B.ID < A.ID)

17

यह SQL सर्वर 2005 के साथ एक मजेदार समाधान है जो मुझे पसंद है। मैं यह मानकर चल रहा हूं कि "पहले एक को छोड़कर हर रिकॉर्ड के लिए", आपका मतलब है कि एक और "आईडी" कॉलम है जिसे हम यह पहचानने के लिए उपयोग कर सकते हैं कि कौन सी पंक्ति "पहली" है।

SELECT id
    , field1
    , field2
    , field3
FROM
(
    SELECT id
        , field1
        , field2
        , field3
        , RANK() OVER (PARTITION BY field1, field2, field3 ORDER BY id ASC) AS [rank]
    FROM table_name
) a
WHERE [rank] > 1

बस SQL ​​सर्वर 2008 टैग देखा। खुशी है कि मेरा सुझाव अभी भी मान्य है।
निक वैकेरो

1
उत्कृष्ट समाधान क्योंकि यह उन पंक्तियों को भी लौटाता है जिन्हें प्रश्न में तालिका से हटाने की आवश्यकता होगी
Realto619

1
यह PK फ़ील्ड की सूची के रूप में विभाजन द्वारा फ़ील्ड सूची के बारे में सोचने में मदद करता है
bkwdesign

6

डुप्लिकेट मान देखने के लिए:

with MYCTE  as (
    select row_number() over ( partition by name  order by name) rown, *
    from tmptest  
    ) 
select * from MYCTE where rown <=1

3

यदि आप SQL सर्वर 2005 या बाद का उपयोग कर रहे हैं (और आपके प्रश्न के लिए टैग SQL Server 2008 इंगित करते हैं), तो आप पहले एक के बाद डुप्लिकेट रिकॉर्ड वापस करने के लिए रैंकिंग फ़ंक्शन का उपयोग कर सकते हैं यदि किसी कारण से जॉन्स कम वांछनीय या अव्यवहारिक है। निम्न उदाहरण इसे कार्रवाई में दिखाता है, जहां यह जांच किए गए कॉलम में शून्य मानों के साथ भी काम करता है।

create table Table1 (
 Field1 int,
 Field2 int,
 Field3 int,
 Field4 int 
)

insert  Table1 
values    (1,1,1,1)
        , (1,1,1,2)
        , (1,1,1,3)
        , (2,2,2,1)
        , (3,3,3,1)
        , (3,3,3,2)
        , (null, null, 2, 1)
        , (null, null, 2, 3)

select    *
from     (select      Field1
                    , Field2
                    , Field3
                    , Field4
                    , row_number() over (partition by   Field1
                                                      , Field2
                                                      , Field3
                                         order by       Field4) as occurrence
          from      Table1) x
where     occurrence > 1

इस उदाहरण को चलाने के बाद नोटिस करें कि हर "समूह" में से पहला रिकॉर्ड बाहर रखा गया है, और यह कि अशक्त मानों के साथ रिकॉर्ड ठीक से संभाला गया है।

यदि आपके पास समूह के भीतर रिकॉर्ड ऑर्डर करने के लिए कोई कॉलम उपलब्ध नहीं है, तो आप ऑर्डर-बाय कॉलम के रूप में पार्टीशन कॉलम का उपयोग कर सकते हैं।


1
CREATE TABLE #tmp
(
    sizeId Varchar(MAX)
)

INSERT  #tmp 
    VALUES ('44'),
        ('44,45,46'),
        ('44,45,46'),
        ('44,45,46'),
        ('44,45,46'),
        ('44,45,46'),
        ('44,45,46')


SELECT * FROM #tmp
DECLARE @SqlStr VARCHAR(MAX)

SELECT @SqlStr = STUFF((SELECT ',' + sizeId
              FROM #tmp
              ORDER BY sizeId
              FOR XML PATH('')), 1, 1, '') 


SELECT TOP 1 * FROM (
select items, count(*)AS Occurrence
  FROM dbo.Split(@SqlStr,',')
  group by items
  having count(*) > 1
  )K
  ORDER BY K.Occurrence DESC    

0

प्रत्येक सेलेक्ट स्टेटमेंट की सेप्रेटली गणना करने के लिए इस क्वेरी को आज़माएं:

select field1,count(field1) as field1Count,field2,count(field2) as field2Counts,field3, count(field3) as field3Counts
from table_name
group by field1,field2,field3
having count(*) > 1
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.