मान लें कि मेरे पास 400 छात्र हैं (जो एक बड़े विश्वविद्यालय में हैं) जिन्हें कंप्यूटर विज्ञान परियोजना करनी है, और उन्हें अकेले काम करना होगा (छात्रों का कोई समूह नहीं)। प्रोजेक्ट का एक उदाहरण "फोरट्रान में एक तेज फूरियर ट्रांसफॉर्म एल्गोरिथ्म को लागू करने" को दिया जा सकता है (मुझे पता है, कि सेक्सी ध्वनि नहीं है लेकिन यह मेरे सवाल को सरल बनाता है)। मैं सही हूं और मैं यह जांचने के लिए रूटीन भेजना चाहता हूं कि क्या ऐसे छात्रों के समूह हैं जिन्होंने कार्यान्वयन का प्रस्ताव दिया है जो "वास्तव में स्वतंत्र रूप से लिखे जाने के समान हैं"।
यह गुच्छों के लिए अनिश्चित खोज है। मुझे लगता है कि सवाल यह है कि कौन सी विशेषताओं का उपयोग करने के बजाय कौन सा क्लस्टरिंग एल्गोरिथ्म का उपयोग करना है। पहली चीज जो मैं करता हूं वह पत्र हिस्टोग्राम द्वारा एक पत्र है। आदर्श रूप से, चूंकि चॉटर उससे कहीं अधिक होशियार हैं, इसलिए मैं अंततः पत्र के अच्छे क्रमबद्ध यादृच्छिक क्रमों को देखने की कोशिश करूंगा कि क्या पत्र के हिस्टोग्राम (क्रमपरिवर्तन के साथ) का अच्छा मेल मौजूद है। इसके अलावा, जो कोड की संरचना का पता नहीं लगाते हैं, केवल पत्रों का सीमांत वितरण ... आपके पास क्या समाधान है? क्या मौजूदा सॉफ़्टवेयर या पैकेज उस समस्या के लिए समर्पित हैं? (वास्तव में मेरे पुराने दिनों में कंप्यूटर विज्ञान के शिक्षकों ने दावा किया था कि उनके पास उस प्रकार का उपकरण है, लेकिन मुझे अब संदेह है कि उनके पास कुछ बहुत ही सरल था)
मुझे लगता है कि सॉफ्टवेयर विकास से वकील को उस प्रकार के मुद्दे भी हैं (1000 छात्रों के साथ नहीं, लेकिन 2 बड़े कोड के साथ ... जो चीजों को कठिन बनाता है)?