एक चर के लिए एक वजन असाइन करने का एक तरीका है इसके पैमाने को बदलना। ट्रिक आपके द्वारा उल्लिखित क्लस्टर एल्गोरिदम के लिए काम करता है, अर्थात। k- साधन, भारित-औसत लिंकेज और औसत-लिंकेज।
कॉफमैन, लियोनार्ड और पीटर जे। रूसुव। " डेटा में समूह खोजना: क्लस्टर विश्लेषण का परिचय ।" (2005) - पेज 11:
माप इकाइयों की पसंद चर के सापेक्ष भार को जन्म देती है। छोटी इकाइयों में एक चर को व्यक्त करने से उस चर के लिए एक बड़ी सीमा हो जाएगी, जिसके परिणामस्वरूप परिणामस्वरूप संरचना पर एक बड़ा प्रभाव पड़ेगा। दूसरी ओर, वस्तुनिष्ठता प्राप्त करने की आशा में, सभी चर को एक समान भार देने के लिए एक प्रयास को मानकीकृत करके। जैसे, इसका उपयोग किसी ऐसे चिकित्सक द्वारा किया जा सकता है, जिसके पास कोई पूर्व ज्ञान नहीं है। हालांकि, यह अच्छी तरह से हो सकता है कि कुछ चर किसी विशेष अनुप्रयोग में दूसरों की तुलना में आंतरिक रूप से अधिक महत्वपूर्ण हैं, और फिर भार का असाइनमेंट विषय-वस्तु ज्ञान (देखें, उदाहरण के लिए, अब्राहोविकेज़, 1985) पर आधारित होना चाहिए।
दूसरी ओर, ऐसी क्लस्टरिंग तकनीकों को विकसित करने का प्रयास किया गया है जो चर (फ़्रीडमैन और रुबिन, 1967) के पैमाने से स्वतंत्र हैं। हार्डी और रैसन (1982) का प्रस्ताव एक विभाजन की खोज करना है जो समूहों के उत्तल पतवारों की कुल मात्रा को कम करता है। सिद्धांत रूप में इस तरह की एक विधि डेटा के रैखिक परिवर्तनों के संबंध में अपरिवर्तनीय है, लेकिन दुर्भाग्य से इसके कार्यान्वयन के लिए कोई एल्गोरिथ्म मौजूद नहीं है (एक अनुमान के अलावा जो दो आयामों तक सीमित है)। इसलिए, वर्तमान में मानकीकरण की दुविधा अपरिहार्य प्रतीत होती है और इस पुस्तक में वर्णित कार्यक्रम उपयोगकर्ता के लिए विकल्प छोड़ देते हैं
इब्राहीमिकोज़, एम। (1985), गैर-संख्यात्मक के उपयोग के लिए असमानताओं को मापने के लिए एक पेंसिल जानकारी, साइकोमेट्रिक सोसायटी की चौथी यूरोपीय बैठक में प्रस्तुत किया गया पेपर और 2-5 जुलाई, कैम्ब्रिज (यूके)।
फ्रीडमैन, एचपी, और रुबिन, जे (1967), डेटा को समूहीकृत करने के कुछ अपरिवर्तनीय मानदंडों पर। जे । आमेर। सांख्यिकीविद। ASSOC6।, 2, 1159-1178
हार्डी, ए।, और रासन, जेपी (1982), उने नौवेल्ले डेस डेस प्रॉब्लम्स डे क्लासिफिकेशन ऑटोमैटिक, स्टेटिस्ट। गुदा। डोनियों, 7, 41-56।