मान लीजिए हम औसत दर्जे का चर, , हम एक नंबर करने के माप की, और उसके बाद प्रदर्शन करना चाहते विलक्षण मूल्य अपघटन के लिए उच्चतम विचरण के कुल्हाड़ियों को खोजने के लिए परिणामों पर , -डायमेंशनल स्पेस में पॉइंट करता है। ( नोट: मान लेते हैं कि के माध्यम पहले से ही घटाया गया है, इसलिए सभी के लिए ।)
अब मान लीजिए कि चर में से एक (या अधिक) बाकी की तुलना में काफी अलग है। उदाहरण के लिए श्रेणी में मान हो सकता है , जबकि बाकी चारों ओर हो सकता है । इस दिशा में उच्चतम विचरण की धुरी परिवर्तित कर देगा के अक्ष बहुत ज्यादा।
परिमाण में अंतर केवल माप की इकाई के एक दुर्भाग्यपूर्ण विकल्प के कारण हो सकता है (यदि हम भौतिक डेटा के बारे में बात कर रहे हैं, जैसे किलोमीटर बनाम मीटर), लेकिन वास्तव में विभिन्न चर बिल्कुल भिन्न आयाम (जैसे वजन बनाम मात्रा) हो सकते हैं, इसलिए उनके लिए "तुलनीय" इकाइयों को चुनने का कोई स्पष्ट तरीका नहीं हो सकता है।
प्रश्न: मैं जानना चाहूंगा कि क्या इस समस्या से बचने के लिए डेटा को सामान्य करने के लिए कोई मानक / सामान्य तरीके मौजूद हैं। मैं मानक तकनीकों में अधिक रुचि रखता हूं लिए तुलनीय परिमाण पैदा करते हैं - इस उद्देश्य के लिए एक एन कुछ नया के साथ आने के बजाय।
EDIT: एक संभावना यह है कि प्रत्येक चर को उसके मानक विचलन या कुछ इसी तरह से सामान्य किया जाए। हालाँकि, निम्न समस्या तब प्रकट होती है: चलो डेटा को -डायमेंशनल स्पेस में बिंदु क्लाउड के रूप में व्याख्या करते हैं। इस बिंदु बादल को घुमाया जा सकता है, और इस तरह के सामान्यीकरण रोटेशन के आधार पर अलग-अलग अंतिम परिणाम (एसवीडी के बाद) देगा। (सबसे चरम मामले में मुख्य अक्षों के साथ प्रमुख अक्षों को संरेखित करने के लिए डेटा को ठीक से घुमाने की कल्पना करें।)
मुझे उम्मीद है कि ऐसा करने के लिए कोई रोटेशन-इनवेरिएंट तरीका नहीं होगा, लेकिन अगर कोई मुझे साहित्य में इस मुद्दे की कुछ चर्चा के लिए विशेष रूप से परिणामों की व्याख्या में कैवियट के बारे में बात कर सकता है, तो मैं सराहना करूंगा।