डीसीटी और पीसीए के बीच संबंध


12

मुझे छवि और वीडियो संपीड़न में उपयोग किए गए 2D 8x8 DCT का एक बुनियादी कार्यान्वयन ज्ञान है। प्रिंसिपल कंपोनेंट एनालिसिस के बारे में पढ़ते हुए, मैं बहुत कुछ समानता देख सकता हूं, यद्यपि पीसीए स्पष्ट रूप से अधिक सामान्य है। जब मैंने DCT के बारे में पढ़ा है तो पहले इसे DFT के संबंध में हमेशा प्रस्तुत किया गया था। तो मेरा सवाल यह है कि डीसीटी को पीसीए के नजरिए से कैसे प्राप्त किया जा सकता है? (यहां तक ​​कि एक हाथ से लहर की व्याख्या पर्याप्त है)

बहुत धन्यवाद

जवाबों:


19

डीसीटी और पीसीए के बीच मुख्य अंतर (अधिक सटीक रूप से, इसके सहसंबंध मैट्रिक्स के आईजेनवेक्टर द्वारा निर्मित आधार में एक डाटासेट का प्रतिनिधित्व करता है - जिसे करहुनेन लोवे ट्रांसफॉर्म के रूप में भी जाना जाता है ) यह है कि पीसीए को किसी दिए गए डेटासेट के संबंध में परिभाषित किया जाना चाहिए (जिसमें से सहसंबंध मैट्रिक्स का अनुमान है), जबकि डीसीटी "निरपेक्ष" है और केवल इनपुट आकार द्वारा परिभाषित किया गया है। यह पीसीए को "अनुकूली" रूपांतरित करता है, जबकि डीसीटी डेटा-स्वतंत्र है।

किसी को आश्चर्य हो सकता है कि पीसीए का उपयोग छवि या ऑडियो संपीड़न में अधिक बार क्यों नहीं किया जाता है, इसकी अनुकूलता के कारण। इसके दो कारण हैं:

  1. एक एनकोडर को एक डेटासेट के पीसीए की गणना करने और गुणांक को एन्कोडिंग करने की कल्पना करें। डेटासेट को फिर से संगठित करने के लिए, डिकोडर को न केवल स्वयं गुणांक की आवश्यकता होगी, बल्कि ट्रांसफ़ॉर्म मैट्रिक्स (यह डेटा पर निर्भर करता है, जिसमें इसकी पहुंच नहीं है!)। DCT या कोई अन्य डेटा-स्वतंत्र ट्रांसफ़ॉर्म इनपुट डेटा में सांख्यिकीय निर्भरता को दूर करने में कम कुशल हो सकता है, लेकिन ट्रांसफॉर्म मैट्रिक्स को कोडर और डिकोडर दोनों द्वारा अग्रिम में इसे प्रसारित करने की आवश्यकता के बिना जाना जाता है। एक "अच्छा पर्याप्त" परिवर्तन जिसे थोड़ा पक्ष जानकारी की आवश्यकता होती है, कभी-कभी एक इष्टतम परिवर्तन से बेहतर होता है जिसके लिए अतिरिक्त जानकारी की आवश्यकता होती है ...

  2. एनएन×64इन टाइलों की चमक के साथ मैट्रिक्स। इस डेटा पर एक पीसीए की गणना करें, और अनुमानित किए जाने वाले प्रमुख घटकों की साजिश रचें। यह बहुत ही ज्ञानवर्धक प्रयोग है! इस बात की बहुत अच्छी संभावना है कि अधिकांश उच्च श्रेणी के आइजनवेक्टर वास्तव में डीसीटी आधार के संशोधित साइन-वे पैटर्न की तरह दिखेंगे। इसका मतलब यह है कि छवि टाइलों के पर्याप्त रूप से बड़े और सामान्य सेट के लिए, डीसीटी आइजनबैसिस का एक बहुत अच्छा अनुमान है। एक ही चीज़ को ऑडियो के लिए भी सत्यापित किया गया है, जहाँ ऑडियो रिकॉर्डिंग की एक बड़ी मात्रा के अनुमान में, मेल-स्पेस फ़्रीक्वेंसी बैंड में लॉग-सिग्नल ऊर्जा के लिए आइजनबेसिस, DCT आधार के करीब है (इसलिए एक सजावट के रूप में DCT का उपयोग परिवर्तन के रूप में होता है) जब कंप्यूटिंग MFCC)।


1
यह दिलचस्प है, हालांकि, DCT के बजाय उपयोग की जाने वाली छवियों के 'सामान्य' आंकड़ों के आधार पर एक अलग आधार सेट का निर्माण नहीं किया जा सकता है? मुझे लगता है कि ऐसा आधार पीसीए जितना अच्छा नहीं होगा, लेकिन बेहतर तो डीसीटी नं?
स्पेसी

@ Pichenettes - DCT के संबंध में, क्षैतिज और ऊर्ध्वाधर आवृत्ति (यानी goo.gl/XLMt5 ) को बढ़ाने की आमतौर पर देखी जाने वाली छवियां क्या हैं ? क्या यह डीसीटी आधार कार्यों का एक छवि प्रतिनिधित्व है? अगर ऐसा है, अगर मैं इन छवियों के सहसंयोजक मैट्रिक्स से पीसीए / ईजेनवेक्टरों की गणना करता हूं - तो क्या यह अनिवार्य रूप से मुझे डीसीटी गुणांक मैट्रिक्स देगा?
trican

Btw @pichenettes आपके सुखद जवाब के लिए बहुत धन्यवाद। मुझे बिंदु 1 के बारे में पता था, लेकिन वास्तव में बिंदु 2 पर विचार नहीं किया गया था
trican

1
@ मोहम्मद: यह एक अच्छा सवाल है, और मुझे इसका जवाब नहीं पता है। मुझे DCT का उपयोग करने में फायदे दिखाई देते हैं: चश्मा लिखना आसान ("हमारा ट्रांसफ़ॉर्म" हमारे ट्रांसफ़ॉर्म इस बंद फ़ॉर्म फ़ंक्शन को प्रिंट करना आसान है "" हमारे ट्रांसफ़ॉर्म इस एनेक्स में प्रकाशित 64x64 मैट्रिक्स है) की तुलना में, कोई मानकीकरण समितियों की बैठक नहीं होती है जिसके बारे में डेटासेट को प्रशिक्षित करना है डिकोडर्स रोम में एम्बेड करने के लिए कम लुकअप टेबल, और शायद ट्रांसफॉर्म मैट्रिक्स में "समरूपता" जो एक क्रूर 64x64 मैट्रिक्स गुणन की तुलना में इसके हार्डवेयर त्वरण को संभव बनाते हैं - ये फायदे मार्जरीन संपीड़न लाभ को पछाड़ सकते हैं।
pichenettes

1
@trican: आपके द्वारा लिंक की गई छवि 8x8 टाइलों के लिए 2-D DCT आधार का प्रतिनिधित्व करती है। 64 छोटी टाइलों में से प्रत्येक एक आधार फ़ंक्शन है। यदि आप वास्तविक छवियों से 8x8 टाइलों का एक बड़ा संग्रह लेते हैं और डेटा पर एक पीसीए करते हैं, तो आपको जो ईजीनबैसिस मिलेगा वह काफी हद तक समान होगा।
pichenettes
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.