RANK () और DENSE_RANK () फंक्शन में क्या अंतर है?


150

बीच क्या अंतर है RANK()और DENSE_RANK()कार्यों? निम्नलिखित emptblतालिका में एनटी वेतन कैसे पता करें ?

DEPTNO  EMPNAME    SAL
------------------------------
10       rrr    10000.00
11       nnn    20000.00
11       mmm    5000.00
12       kkk    30000.00
10       fff    40000.00
10       ddd    40000.00
10       bbb    50000.00
10       ccc    50000.00

यदि तालिका डेटा में है nulls, तो क्या होगा यदि मैं nthवेतन का पता लगाना चाहता हूं ?

जवाबों:


242

RANK आपको अपने ऑर्डर किए गए विभाजन के भीतर रैंकिंग देता है। टाई को एक ही रैंक दिया जाता है, अगली रैंकिंग के साथ छोड़ दिया जाता है। इसलिए, यदि आपके पास रैंक 2 पर 3 आइटम हैं, तो सूचीबद्ध अगला रैंक 5 स्थान पर होगा।

DENSE_RANK फिर से आपको अपने ऑर्डर किए गए विभाजन के भीतर रैंकिंग देता है, लेकिन रैंक लगातार होते हैं। यदि कई आइटम्स के साथ रैंक हैं, तो कोई रैंक नहीं छोड़ी जाती है।

नल के लिए, यह ORDER BY क्लॉज पर निर्भर करता है। यहाँ एक सरल परीक्षण स्क्रिप्ट है जिसे आप देख सकते हैं कि क्या होता है:

with q as (
select 10 deptno, 'rrr' empname, 10000.00 sal from dual union all
select 11, 'nnn', 20000.00 from dual union all
select 11, 'mmm', 5000.00 from dual union all
select 12, 'kkk', 30000 from dual union all
select 10, 'fff', 40000 from dual union all
select 10, 'ddd', 40000 from dual union all
select 10, 'bbb', 50000 from dual union all
select 10, 'xxx', null from dual union all
select 10, 'ccc', 50000 from dual)
select empname, deptno, sal
     , rank() over (partition by deptno order by sal nulls first) r
     , dense_rank() over (partition by deptno order by sal nulls first) dr1
     , dense_rank() over (partition by deptno order by sal nulls last) dr2
 from q; 

EMP     DEPTNO        SAL          R        DR1        DR2
--- ---------- ---------- ---------- ---------- ----------
xxx         10                     1          1          4
rrr         10      10000          2          2          1
fff         10      40000          3          3          2
ddd         10      40000          3          3          2
ccc         10      50000          5          4          3
bbb         10      50000          5          4          3
mmm         11       5000          1          1          1
nnn         11      20000          2          2          2
kkk         12      30000          1          1          1

9 rows selected.

यहाँ एक अच्छी व्याख्या और कुछ उदाहरणों का लिंक दिया गया है।


14
किसी भी तालिका को बनाए बिना नमूना डेटा उत्पन्न करने के लिए दोहरे से सभी चुनिंदा संघ का उपयोग करने के लिए बहुत अच्छा विचार है
जीन-क्रिस्टोफ ब्लैंचर्ड

@ जीन-क्रिस्टोफब्लंचर्ड हालांकि आप आसानी से एक valuesखंड का उपयोग कर सकते हैं ।
वाइल्डकार्ड

1
@Wildcard पीजी में, हाँ। ओरेकल में, नहीं । कम से कम 11 के रूप में नहीं। मैं अभी तक 12 उत्पादों में नहीं चला हूं।
jpmc26

from dualRedshift में इस डेटा को जनरेट करने के लिए निकालें
Gaurav

4
इवान, RANK मुझे एक विचार देता है जहां मैं उन सभी के सापेक्ष हूं जो मुझसे आगे हैं। DENSE_RANK मुझे पूर्ण रैंक बताता है। मेरे पास दूसरा सबसे अधिक वेतन हो सकता है, लेकिन मेरे आगे 100 लोग हो सकते हैं। जो बेहतर है वह उस प्रश्न पर निर्भर करता है जिसका मैं उत्तर दे रहा हूं।
डीसीयूकी

93

यहाँ यह लेख इसे अच्छी तरह से समझाता है। अनिवार्य रूप से, आप इसे इस तरह देख सकते हैं:

CREATE TABLE t AS
SELECT 'a' v FROM dual UNION ALL
SELECT 'a'   FROM dual UNION ALL
SELECT 'a'   FROM dual UNION ALL
SELECT 'b'   FROM dual UNION ALL
SELECT 'c'   FROM dual UNION ALL
SELECT 'c'   FROM dual UNION ALL
SELECT 'd'   FROM dual UNION ALL
SELECT 'e'   FROM dual;

SELECT
  v,
  ROW_NUMBER() OVER (ORDER BY v) row_number,
  RANK()       OVER (ORDER BY v) rank,
  DENSE_RANK() OVER (ORDER BY v) dense_rank
FROM t
ORDER BY v;

उपरोक्त उपज:

+---+------------+------+------------+
| V | ROW_NUMBER | RANK | DENSE_RANK |
+---+------------+------+------------+
| a |          1 |    1 |          1 |
| a |          2 |    1 |          1 |
| a |          3 |    1 |          1 |
| b |          4 |    4 |          2 |
| c |          5 |    5 |          3 |
| c |          6 |    5 |          3 |
| d |          7 |    7 |          4 |
| e |          8 |    8 |          5 |
+---+------------+------+------------+

शब्दों में

  • ROW_NUMBER() प्रत्येक पंक्ति के लिए एक अद्वितीय मूल्य है
  • RANK() एक ही मूल्य के लिए एक ही पंक्ति संख्या का गुण होता है, "छेद" को छोड़कर
  • DENSE_RANK() एक ही मूल्य के लिए एक ही पंक्ति संख्या को विशेषता देता है, कोई "छेद" नहीं छोड़ता है

त्रुटि: SQL त्रुटि: ORA-00923: कीवर्ड जहां अपेक्षित नहीं मिला
zloctb

9
SELECT empno,
       deptno,
       sal,
       RANK() OVER (PARTITION BY deptno ORDER BY sal) "rank"
FROM   emp;

     EMPNO     DEPTNO        SAL       rank
---------- ---------- ---------- ----------
      7934         10       1300          1
      7782         10       2450          2
      7839         10       5000          3
      7369         20        800          1
      7876         20       1100          2
      7566         20       2975          3
      7788         20       3000          4
      7902         20       3000          4
      7900         30        950          1
      7654         30       1250          2
      7521         30       1250          2
      7844         30       1500          4
      7499         30       1600          5
      7698         30       2850          6


SELECT empno,
       deptno,
       sal,
       DENSE_RANK() OVER (PARTITION BY deptno ORDER BY sal) "rank"
FROM   emp;

     EMPNO     DEPTNO        SAL       rank
---------- ---------- ---------- ----------
      7934         10       1300          1
      7782         10       2450          2
      7839         10       5000          3
      7369         20        800          1
      7876         20       1100          2
      7566         20       2975          3
      7788         20       3000          4
      7902         20       3000          4
      7900         30        950          1
      7654         30       1250          2
      7521         30       1250          2
      7844         30       1500          3
      7499         30       1600          4
      7698         30       2850          5

8

रैंक () : इसका उपयोग पंक्तियों के समूह के भीतर रिकॉर्ड बनाने के लिए किया जाता है।

dense_rank () : DENSE_RANK फ़ंक्शन RANK फ़ंक्शन की तरह कार्य करता है, सिवाय इसके कि यह लगातार रैंक प्रदान करता है।

प्रश्न -

select 
    ENAME,SAL,RANK() over (order by SAL) RANK
from 
    EMP;

आउटपुट -

+--------+------+------+
| ENAME  | SAL  | RANK |
+--------+------+------+
| SMITH  |  800 |    1 |
| JAMES  |  950 |    2 |
| ADAMS  | 1100 |    3 |
| MARTIN | 1250 |    4 |
| WARD   | 1250 |    4 |
| TURNER | 1500 |    6 |
+--------+------+------+

प्रश्न -

select 
    ENAME,SAL,dense_rank() over (order by SAL) DEN_RANK
from 
    EMP;

आउटपुट -

+--------+------+-----------+
| ENAME  | SAL  |  DEN_RANK |
+--------+------+-----------+
| SMITH  |  800 |         1 |
| JAMES  |  950 |         2 |
| ADAMS  | 1100 |         3 |
| MARTIN | 1250 |         4 |
| WARD   | 1250 |         4 |
| TURNER | 1500 |         5 |
+--------+------+-----------+

2
select empno
       ,salary
       ,row_number() over(order by salary desc) as Serial
       ,Rank() over(order by salary desc) as rank
       ,dense_rank() over(order by salary desc) as denseRank
from emp ;

Row_number() -> सीरियल नंबर जनरेट करने के लिए उपयोग किया जाता है

Dense_rank() निरंतर रैंक देगा लेकिन रैंक के टकराव के मामले में रैंक को छोड़ देगा।


2

RANK () और DENSE_RANK () फ़ंक्शन के बीच एकमात्र अंतर उन मामलों में है जहां "टाई" है; यानी, ऐसे मामलों में जहां एक सेट में कई मानों की रैंकिंग समान होती है। ऐसे मामलों में, RANK () सेट में मानों के लिए गैर-लगातार "रैंक" निर्दिष्ट करेगा (जिसके परिणामस्वरूप टाई होने पर पूर्णांक रैंकिंग मानों के बीच अंतराल होता है), जबकि DENSE_RANK () मानों को लगातार रैंक प्रदान करेगा। सेट (इसलिए टाई के मामले में पूर्णांक रैंकिंग मानों के बीच कोई अंतराल नहीं होगा)।

उदाहरण के लिए, सेट {25, 25, 50, 75, 75, 100} पर विचार करें। ऐसे सेट के लिए, RANK () {1, 1, 3, 4, 4, 6} (ध्यान दें कि मान 2 और 5 छोड़ दिए गए हैं) वापस आ जाएंगे, जबकि DENSE_RANK () {1,1,2,3, वापस आ जाएगा 3,4}।


1

रैंक () एसक्यूएल फ़ंक्शन मानों के निर्धारित सेट के भीतर डेटा की रैंक उत्पन्न करता है, लेकिन पिछली रैंक के बाद अगला रैंक उस विशेष पंक्ति का रो_नंबर है। दूसरी ओर, Dense_Rank () SQL फ़ंक्शन row_number बनाने के बजाय अगला नंबर जेनरेट करता है। नीचे SQL उदाहरण है जो अवधारणा को स्पष्ट करेगा:

Select ROW_NUMBER() over (order by Salary) as RowNum, Salary, 
RANK() over (order by Salary) as Rnk, 
DENSE_RANK() over (order by Salary) as DenseRnk from (
Select 1000 as Salary union all
Select 1000 as Salary union all
Select 1000 as Salary union all
Select 2000 as Salary union all
Select 3000 as Salary union all
Select 3000 as Salary union all
Select 8000 as Salary union all
Select 9000 as Salary) A

यह निम्नलिखित उत्पादन उत्पन्न करेगा:

----------------------------
RowNum  Salary  Rnk DenseRnk
----------------------------
1       1000    1   1
2       1000    1   1
3       1000    1   1
4       2000    4   2
5       3000    5   3
6       3000    5   3
7       8000    7   4
8       9000    8   5

0

रैंक और डेंस रैंक विभक्त डेटासेट में रैंक देता है।

रैंक (): यह आपको लगातार पूर्णांक संख्या नहीं देता है।

Dense_rank (): यह आपको लगातार पूर्णांक संख्या देता है।

यहाँ छवि विवरण दर्ज करें

उपरोक्त चित्र में, 10008 ज़िप की रैंक dense_rank () फ़ंक्शन द्वारा 2 और रैंक () फ़ंक्शन से 24 है क्योंकि यह row_number मानता है।


0

Rank(), Dense_rank(), row_number() ये सभी विंडो फ़ंक्शंस हैं जिसका मतलब है कि वे पहली बार में कुछ ऑर्डर किए गए इनपुट सेट पर विंडो की तरह काम करते हैं। इन खिड़कियों में आवश्यकता के आधार पर अलग-अलग कार्यक्षमता जुड़ी हुई है। उपरोक्त 3:

row_number()

row_number()इस रूप में शुरू करने से इन संबंधित विंडो कार्यों का आधार बनता है। row_number()जैसा कि नाम से पता चलता है कि पंक्तियों के सेट को एक अद्वितीय संख्या मिलती है, जिस पर इसे लागू किया गया है। प्रत्येक पंक्ति को क्रम संख्या देने के समान।

Rank()

के एक तोड़फोड़ के row_number()रूप में कहा जा सकता है rank()। रैंक () का उपयोग उन क्रमांकित सेट पंक्तियों के लिए एक ही सीरियल नंबर देने के लिए किया जाता है जो डुप्लिकेट होते हैं, लेकिन यह अभी भी डुप्लिकेट गिनती row_number()रैंक () के बाद के अर्थ के लिए उन सभी के लिए इसी तरह रखता है जैसे कि नीचे से उदाहरण के लिए। डेटा के लिए 2 पंक्ति_नंबर () = रैंक () दोनों अर्थ केवल डुप्लिकेट के रूप में भिन्न होते हैं।

Data row_number() rank() dense_rank() 
    1         1                    1       1
    1         2                    1       1
    1         3                    1       1
    2         4                    4       2

आखिरकार,

Dense_rank () रैंक का एक विस्तारित संस्करण है () जैसा कि नाम से पता चलता है कि इसका घनत्व इसलिए है क्योंकि आप उपरोक्त उदाहरण रैंक () = dense_rank () से सभी डेटा 1 के लिए देख सकते हैं, लेकिन डेटा 2 के लिए यह इस रूप में भिन्न है कि यह पिछले क्रम से रैंक () के क्रम का पता लगाता है (वास्तविक डेटा नहीं)


0

RANK () और DENSE_RANK () फ़ंक्शन के बीच एकमात्र अंतर उन मामलों में है जहां "टाई" है; यानी, ऐसे मामलों में जहां एक सेट में कई मानों की रैंकिंग समान होती है। ऐसे मामलों में, RANK () सेट में मानों के लिए गैर-लगातार "रैंक" निर्दिष्ट करेगा (जिसके परिणामस्वरूप टाई होने पर पूर्णांक रैंकिंग मानों के बीच अंतराल होता है), जबकि DENSE_RANK () मानों को लगातार रैंक प्रदान करेगा। सेट (इसलिए टाई के मामले में पूर्णांक रैंकिंग मानों के बीच कोई अंतराल नहीं होगा)।

उदाहरण के लिए, सेट पर विचार करें {30, 30, 50, 75, 75, 100}। ऐसे सेट के लिए, RANK () {1, 1, 3, 4, 4, 6} (ध्यान दें कि मान 2 और 5 छोड़ दिए गए हैं) वापस आ जाएंगे, जबकि DENSE_RANK () {1,1,2,3, वापस आ जाएगा 3,4}।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.