त्वरित सॉर्ट के लिए एक बुरा मामला क्या है?

मैं क्विकसॉर्ट के बारे में सीख रहा हूं और विभिन्न सरणियों को चित्रित करना चाहता हूं कि क्विकॉर्ट पर एक कठिन समय होगा। मेरे पास जो क्विकॉर्ट्स है, वह प्रारंभिक यादृच्छिक फेरबदल नहीं करता है, 2 विभाजन करता है, और मंझला गणना नहीं करता है।

मैंने अब तक तीन उदाहरणों के बारे में सोचा:

[1,2,3,4,5,6,7,8,9,10] - when the array is sorted
[10,9,8,7,6,5,4,3,2,1] - when the array is reversed
[1,1,1,1,1,1,1,1,1,1] - when the array is the same values
[1,1,1,2,2,2,3,3,3,3] - when there are few and unique keys

उदाहरण के लिए, मैं इस बारे में निश्चित नहीं हूं:

[1,3,5,7,9,10,8,6,4,2]

तो एक सरणी के लिए क्या बनाता है कि क्विकॉर्ट को जहां यह (लगभग) आदर्श है, उसकी तुलना में कठिनाई होती है?

algorithms sorting

— mrQWERTY
स्रोत

धुरी का चयन कैसे किया जाता है? आपने दो तरीके बताए हैं जो चयनित नहीं थे, लेकिन यह नहीं कि इसे कैसे चुना गया।

— विंस्टन एवर्ट

कृपया QuickSort के लिए सबसे खराब मामला दें - यह कब हो सकता है? StackOverflow पर एक पढ़ें। मैं सॉर्टिंग एल्गोरिदम का एक अच्छा दृश्य होने के लिए सॉर्टिंग.ट भी ढूंढता हूं ।

@InstonEwert Pivot को पहले तत्व द्वारा चुना गया है।

— mrQWERTY

@ Renren29 मैंने सवाल को थोड़ा संशोधित किया है, इस पर ध्यान केंद्रित करने की कोशिश कर रहा है कि इस कारण से कि एस्कॉर्ट को उदाहरण सरणियों की तलाश के बजाय किसी दिए गए सरणी के साथ कठिनाई कैसे होगी (मैं लोगों को आपको जवाब देने में सक्षम नहीं हूं [2,1,2,1,2,1,2,1]और यह संपूर्ण है जवाब)। प्रश्न का लक्ष्य, आदर्श रूप से, एक होगा जहां अन्य लोग आ सकते हैं और उदाहरण के बजाय क्यों (जिसके पास एक उत्तर है) के बारे में अधिक पता कर सकते हैं (जिनमें से अनगिनत हैं)।

आप 2 तत्वों के विखंडन के लिए क्विकसॉर्ट चला रहे हैं? क्योंकि वास्तविक दुनिया के कार्यान्वयन छोटे-छोटे विखंडों के लिए सरल प्रकार का उपयोग करते हैं। उदा। तुलना और अदला-बदली एन = 2 के लिए क्विकसॉर्ट की तुलना में बहुत सरल है।

— एमएसल्टर्स

जवाबों:

हर तरह के एल्गोरिदम में सबसे खराब स्थिति होती है, और कई मामलों में सबसे खराब स्थिति वास्तव में खराब होती है, इसलिए यह इसके लिए परीक्षण के लायक है। समस्या यह है कि कोई भी सबसे खराब स्थिति नहीं है, क्योंकि आप बुनियादी एल्गोरिथ्म को जानते हैं।

सामान्य सबसे खराब मामलों में शामिल हैं: पहले से ही हल; उलटा क्रमबद्ध; लगभग क्रमबद्ध, एक आदेश तत्व से बाहर; सभी समान हैं; पहले (या अंतिम) को छोड़कर सभी समान उच्च (या निम्न) हैं। हमारे पास एक बार एक प्रकार था जहां सबसे खराब स्थिति एक विशेष आराध्य पैटर्न थी, जो कि भविष्यवाणी करना बहुत कठिन था लेकिन व्यवहार में काफी सामान्य था।

क्विकॉर्ट के लिए सबसे खराब स्थिति वह है जो इसे सबसे खराब संभव धुरी को चुनने के लिए प्राप्त करता है, ताकि किसी एक विभाजन में केवल एक ही तत्व हो। यदि पिवट पहला तत्व (बुरा विकल्प) है तो पहले से ही सॉर्ट किया गया या उलटा सॉर्ट किया गया डेटा सबसे खराब स्थिति है। एक मध्य-तीन पिवट डेटा के लिए जो सभी समान है या सिर्फ पहला या अंतिम है अलग-अलग चाल है।

क्विकॉर्ट के लिए औसत जटिलता शून्य है और सबसे खराब स्थिति n ^ 2 है। कारण यह है कि यह सबसे खराब मामला व्यवहार को ट्रिगर करने के लायक है क्योंकि यह भी ऐसा मामला है जो पुनरावृत्ति की सबसे बड़ी गहराई पैदा करता है। एक भोले-भाले कार्यान्वयन के लिए पुनरावृत्ति की गहराई n हो सकती है, जो स्टैक ओवरफ्लो को ट्रिगर कर सकती है। अन्य चरम स्थितियों (सर्वोत्तम मामले सहित) का परीक्षण करना समान कारणों के लिए सार्थक हो सकता है।

— david.pfx
स्रोत

मैं देख रहा हूं, इसलिए माध्य से मानक विचलन वास्तव में विभाजन परिणाम को निर्धारित करता है।

— mrQWERTY

"... और लगभग हर मामले में सबसे खराब स्थिति वास्तव में खराब है इसलिए यह इसके लिए परीक्षण के लायक है।" । यह बहस का मुद्दा है। जब मैं इस तालिका को देखता हूं: en.wikipedia.org/wiki/… मैं यह निष्कर्ष निकालता हूं कि अधिकांश "अच्छे" सॉर्ट एल्गोरिदम (औसत O(NlogN)प्रदर्शन या बेहतर के साथ) सबसे खराब और औसत मामलों में एक ही जटिलता है। यह बताता है कि आमतौर पर सबसे खराब स्थिति के लिए परीक्षण के लायक नहीं है। (यह देखते हुए कि परीक्षण संभवतः O(N)... या इससे भी बुरा है।)

— स्टीफन सी।

@ Renren29: 3 पिवट का माध्य पहला या अंतिम तभी होगा जब मानों में से 2 या 3 समान हों। SD इसमें नहीं आता है।

— david.pfx

@StephenC: क्विकॉर्ट सहित कई 'अच्छे' एल्गोरिदम में n ^ 2 सबसे खराब स्थिति है। लेकिन संपादित देखें।

— david.pfx

@ david.pfx - "कुछ" ... हाँ। "लगभग हर" ... नहीं।

— स्टीफन सी।

एक एल्गोरिथ्म सबसे खराब मामलों से बच जाता है, एक यादृच्छिक रूप से धुरी का उपयोग करते हुए, निरंतर तत्वों को छोड़कर विभाजन और धुरी से एक धुरी के बराबर होता है। यह एक तत्व को अधिक खोजता है या एक धुरी के बराबर होता है , और एक तत्व को धुरी से कम खोजता है ।
मैं माइकलटी को धन्यवाद देता हूं, असममित खोज [2,1,2,1,2,1,2,1] को हल करने के लिए तैयार है।

निम्न परिणाम मेरे फ़ंक्शन qsort_random () द्वारा उत्पन्न होता है। एन = 100,000

usec    call   compare   copy    pattern
80132   62946  1971278   877143  random
47326   57578  1606067   215155  sorted : 0,1,2,3,...,n-1
49927   63578  1628883   338715  sorted in reverse : n-1,n-2,...,2,1,0
55619   63781  1596934   377330  nearly reverse : n-2,n-1,n-4,n-3,...,2,3,0,1
54714   66667  1611454   290392  median-3-killer : n-1,0,1,2,...,n-2
1491    1      99999     4       all values the same : n,n,n,...
1577    1      99999     4       first is higher : n,1,1,1,...
2778    2      156159    10      last is lower : n,n,n,...,n,1
2994    3      199996    100009  a few data : n,...,n,1,...,1
3196    3      199996    50012   zigzag : n,1,n,1,...,n,1
917796  56284  67721985  673356  valley(sawtooth?) : n-1,n-3,...,0,...,n-4,n-2

अधिकांश मामले यादृच्छिक पैटर्न की तुलना में तेज़ होते हैं। अधिकांश पिवट चयन के लिए घाटी पैटर्न एक बुरा मामला है।

qsort(3)       usec = 14523   call = 0      compare = 884463    copy = 0
qsort_head()   usec = 138609  call = 99999  compare = 8120991   copy = 1214397
qsort_middle() usec = 664325  call = 99999  compare = 52928111  copy = 1036047
qsort_trad()   usec = 118122  call = 99999  compare = 6476025   copy = 1337523
qsort_random() usec = 295699  call = 58806  compare = 19439952  copy = 732962
qsort_log2()   usec = 66411   call = 63987  compare = 1597455   copy = 944821

qsort_log2 () log2 (N) तत्वों में एक धुरी का चयन करके बुरे मामले से बच जाता है।
qsort (3) GNU लाइब्रेरी का उपयोग करते हैं जो इंडेक्स सॉर्टिंग का मर्ज है।
qsort_trad () पहले, मध्य और अंतिम तत्वों में एक धुरी का चयन करें।
qsort_random () और qsort_log2 () स्वैपिंग का उपयोग नहीं करते हैं।
स्रोत C प्रोग्राम और स्क्रिप्ट्स को github में पोस्ट किया गया है ।

— लेओर्ज टेकूची
स्रोत