सारांश
मैं विवरण अनुभाग में अपने विचार साझा करता हूं । मुझे लगता है कि वे पहचानने में उपयोगी हैं कि हम वास्तव में क्या हासिल करना चाहते हैं।
मुझे लगता है कि यहां मुख्य समस्या यह है कि आपने परिभाषित नहीं किया है कि रैंक समानता का क्या मतलब है। इसलिए, कोई नहीं जानता कि रैंकों के बीच अंतर को मापने का कौन सा तरीका बेहतर है।
प्रभावी रूप से, यह हमें अनुमानों के आधार पर अस्पष्ट तरीके से चुनने के लिए छोड़ देता है।
मैं वास्तव में सुझाव देता हूं कि पहले गणितीय अनुकूलन उद्देश्य को परिभाषित करें। तभी हम निश्चित होंगे कि क्या हम वास्तव में जानते हैं कि हम क्या चाहते हैं।
जब तक हम ऐसा नहीं करते, तब तक वास्तव में यह नहीं पता कि हम क्या चाहते हैं। हम हो सकता है लगभग जानते हैं कि हम क्या चाहते हैं, लेकिन लगभग जानने जानते हुए भी ।≠
विवरण में मेरा पाठ अनिवार्य रूप से रैंक समानता की गणितीय परिभाषा तक पहुंचने की दिशा में एक कदम है । एक बार जब हम इसे कील करते हैं, तो हम इस तरह की समानता को मापने का सबसे अच्छा तरीका चुनने के लिए आत्मविश्वास से आगे बढ़ सकते हैं।
विवरण
युर टिप्पणियों में से एक पर आधारित:
- " उद्देश्य यह देखना है कि क्या दो समूहों की रैंकिंग अलग है ", पीटर फ्लोम।
उद्देश्य की कड़ाई से व्याख्या करते हुए इसका उत्तर देना :
- रैंकों, किसी भी आइटम है, तो अलग हैं , वहां मौजूद ऐसा है कि , जहां आइटम के के पद है समूह द्वारा और है एक ही आइटम की रैंक लेकिन समूह द्वारा ।मैं एक मैं ≠ ख मैं एक मैं मैं एक ख मैं खi∈{1,2,…,25}iai≠biaiiabib
- और, रैंक अलग नहीं हैं।
लेकिन मुझे नहीं लगता कि आप वास्तव में उस सख्त व्याख्या को चाहते हैं । इसलिए, मुझे लगता है कि आपके कहने का वास्तव में क्या मतलब है:
- कैसे अलग-अलग समूहों के रैंक कर रहे हैं और ?bab
यहां एक समाधान केवल न्यूनतम संपादित दूरी को मापने के लिए है । Ie ऐसे कितने न्यूनतम संपादन हैं जो समूह की रैंक सूची पर किए जाने की आवश्यकता जैसे कि यह समूह समान हो ।bab
एक एडिट को दो वस्तुओं की अदला-बदली के रूप में परिभाषित किया जा सकता है, और कितने hops की आवश्यकता के आधार पर लागत अंक निर्धारित करता है। इसलिए यदि आइटम को आइटम साथ स्वैप करना होगा ( और के समूहों के बीच समान रैंक प्राप्त करने के लिए ), तो इस संपादन की लागत ।1 3 ए बी 3n13ab3
लेकिन क्या यह तरीका उपयुक्त है? इसका उत्तर देने के लिए, आइए इसे थोड़ा और गहराई से देखें:
यह सामान्यीकृत नहीं है। अगर हम कहते हैं कि समूहों के रैंक के बीच की दूरी है , जबकि समूह के रैंक के बीच की दूरी है है, यह जरूरी नहीं है कि और अधिक से अधिक एक दूसरे के समान हैं कर रहे हैं एक दूसरे के लिए (इसका मतलब यह भी हो सकता है कि वस्तुओं के एक बहुत बड़े सेट को रैंकिंग कर रहे थे)।3 सी , डी 123 ए , बी सी , डी सी , डीa,b3c,d123a,bc,dc,d
यह मानता है कि प्रत्येक संपादन की लागत हॉप्स की संख्या के संबंध में रैखिक है । क्या यह हमारे एप्लिकेशन डोमेन के लिए सही है? क्या ऐसा हो सकता है कि एक तार्किक संबंध अधिक उपयुक्त हो? या एक घातीय ?
यह मानता है कि सभी आइटम समान रूप से महत्वपूर्ण हैं। रैंकिंग आइटम (माना) में जैसे असहमति रैंकिंग आइटम (माना) में असहमति के समान व्यवहार किया जाता है । क्या यह आपके डोमेन में सही है? उदाहरण के लिए, यदि हम पुस्तकों की रैंकिंग कर रहे हैं, तो TAOCP जैसी प्रसिद्ध पुस्तक की रैंकिंग पर असहमत हैं, TAOUP जैसी भयानक पुस्तक की रैंकिंग पर असहमति के लिए भी उतना ही महत्वपूर्ण है ?515
एक बार जब हम उपरोक्त बिंदुओं को संबोधित करते हैं, और दो रैंकों के बीच समानता के एक उपयुक्त माप तक पहुंचते हैं, तो हमें और अधिक दिलचस्प प्रश्न पूछने की आवश्यकता होगी, जैसे:
- इस तरह के मतभेदों, या अधिक चरम मतभेद अवलोकन की संभावना, क्या है अगर समूहों के बीच अंतर और केवल यादृच्छिक मौका के कारण था?bab
the best ways to compare these rankings
- 2 समूहों को किस प्रकार के अंतर से आप जानना चाहेंगे?