पूर्णांक कारक द्वारा एक छवि को डाउनसम्पलिंग करना


16

जब किसी छवि को पूर्णांक कारक घटाया जाता है , तो स्पष्ट विधि इनपुट छवि के संबंधित ब्लॉक के औसत पर आउटपुट छवि के पिक्सेल सेट करने के लिए होती है ।nn×n

मुझे याद है कि कहीं-कहीं पढ़ा जा रहा है कि यह तरीका इष्टतम नहीं है (क्षमा करें मुझे कोई विवरण याद नहीं है)

क्या यह सच है कि एक बेहतर तरीका है (और यदि हां, तो उपरोक्त विधि विफल नहीं है, हालांकि यह "स्पष्ट रूप से सही" लगता है) मैं सिग्नल प्रोसेसिंग के बारे में बहुत कुछ नहीं जानता, यह सवाल सिर्फ मुझे दिलचस्पी देता है।


यदि आपके पास सिग्नल प्रोसेसिंग बैकग्राउंड नहीं है, तो लैमन्स स्पष्टीकरण है: डाउनसमलिंग के लिए बेहतर तरीके हैं। आपका डाउनसमॉप एल्गोरिथ्म तकनीकी रूप से N BUT के द्वारा चित्र पिक्सेल के आकार को छोटा बना देगा जो कि ऊपर वर्णित एल्गोरिदम की तुलना में बेहतर होने पर गुणवत्ता में बहुत नीचे गिर जाएगा।
ट्रेवर बॉयड स्मिथ

जवाबों:


16

एक छवि के डाउनसैंपलिंग से नमूनों की संख्या कम हो जाती है जो सिग्नल का प्रतिनिधित्व कर सकते हैं। फ़्रीक्वेंसी डोमेन के संदर्भ में, जब एक सिग्नल को डाउनस्म्पल्ड किया जाता है, तो सिग्नल के उच्च-आवृत्ति वाले हिस्से को कम-आवृत्ति वाले हिस्से के साथ अलियास किया जाएगा। जब छवि प्रसंस्करण के लिए आवेदन किया जाता है, तो वांछित परिणाम केवल कम-आवृत्ति वाले हिस्से को संरक्षित करना है। ऐसा करने के लिए, उच्च-आवृत्ति वाले हिस्से को निकालने के लिए मूल छवि को प्रीप्रोसेस किया जाना चाहिए (उपनाम-फ़िल्टर्ड) ताकि एलियासिंग न हो।


उच्च आवृत्ति वाले हिस्से (सबसे तेज कटऑफ के साथ) को निकालने के लिए इष्टतम डिजिटल फिल्टर sinc फ़ंक्शन है । कारण यह है कि Sinc फ़ंक्शन की आवृत्ति डोमेन प्रतिनिधित्व पूरे निम्न-आवृत्ति क्षेत्र पर लगभग 1 निरंतर है, और पूरे उच्च-आवृत्ति क्षेत्र में लगभग निरंतर 0 है।

sinc(एक्स)=पाप(πएक्स)πएक्स

सिन फ़िल्टर की आवेग प्रतिक्रिया अनंत है। Lanczos फ़िल्टर एक संशोधित sinc फ़िल्टर है, जो sinc गुणांक को दर्शाता है और मान के घटने के बाद एक बार उन्हें काट देता है।


हालांकि, आवृत्ति डोमेन में इष्टतम होने का मतलब यह नहीं है कि मानव आंखों में इष्टतम है। अपसमप्लिंग और डाउनसम्पलिंग तरीके हैं जो रैखिक परिवर्तनों का पालन नहीं करते हैं लेकिन रैखिक लोगों की तुलना में बेहतर परिणाम देते हैं।


n×n

निर्देशांक पत्राचार में न्यूनतम आवश्यकता वह है

  1. किसी पूर्णांक कारक द्वारा मनमाने ढंग से यादृच्छिक मानों वाली छवि को अपसम्पलिंग करना, फिर एक ही पूर्णांक कारक द्वारा डाउनस्मलिंग करना, एक ही छवि को संख्यात्मक रूप से न्यूनतम परिवर्तन के साथ परिणामित करना चाहिए।
  2. एक छवि को अपसम्प्लिमेंटिंग / डाउनसम्पलिंग करना, जिसमें केवल एक समान मूल्य शामिल है, इसके बाद विपरीत ऑपरेशन, समान छवि में न्यूनतम संख्यात्मक विचलन के साथ समान छवि होनी चाहिए।
  3. बार-बार अपसैंपलिंग / डाउनसमलिंग के जोड़े लगाने से छवि सामग्री में बदलाव को कम से कम करना चाहिए।

संबंधित क्षेत्रों में "लगभग" 1 और 0 होने के sinc फ़ंक्शन के रूपांतरण से आपका क्या मतलब है?

@ टिम: गिंक घटना के पास सिन फ़िल्टर की कटऑफ आवृत्ति।
21

2
Sinc resampling केवल उन संकेतों पर समझ में आता है जो ऑडियो के रूप में आवृत्ति डोमेन में कथित / संसाधित होते हैं। छवियाँ माना जाता है, कम से कम लगभग, spacial डोमेन (इस बहस का मुद्दा है, तो संभव है कि बार-बार पैटर्न के कुछ धारणा आवृत्ति डोमेन में है) और किसी भी आवृत्ति-डोमेन-आधारित परिवर्तन पैदा करता है बुरा विकृतियों (बज, आदि) में स्थानिक डोमेन। मूल रूप से, किसी भी नकारात्मक गुणांक के साथ कोई भी कनवल्शन / लीनियर ऑपरेशन गंदा कलाकृतियों का उत्पादन करेगा, और सभी गैर-गुणांक गुणांकों के साथ कोई भी धुंधलापन पैदा करेगा।
आर .. गिटहब स्टॉप हेल्पिंग ICE

6

आप सही हैं कि क्षेत्र-औसत आपको "सबसे सही" के करीब मिल सकता है, लेकिन एन के एक कारक द्वारा एक तेज चौड़ाई-एन लाइन को डाउन करने पर समस्या असंगत व्यवहार है। यदि लाइन का स्थान मोड्यूलो संरेखित है एन, आपको एक तेज 1-पिक्सेल लाइन मिलेगी, लेकिन अगर यह लगभग एन / 2 मॉड एन है, तो आपको बहुत धुंधली रेखा मिलेगी (आधी तीव्रता पर 2 पिक्सेल चौड़ी)। यह बहुत बुरा लग सकता है, और नॉनलाइनर गामा के साथ, यहां तक ​​कि तीव्रता में अंतर भी होगा। (आदर्श रूप से सभी रेज़मैपलिंग को एक रैखिक तीव्रता पैमाने के लिए सुधारा गामा के साथ लेना होता है, लेकिन व्यवहार में लगभग कोई भी ऐसा नहीं करता है क्योंकि यह वास्तव में महंगा है।)

यदि आप इस पर सुधार करना चाहते हैं, तो आपको पहले इस तथ्य को स्वीकार करने की आवश्यकता है कि कुछ मामलों में धुंधलापन को कम करना असंभव है, इसलिए वर्दी उत्पादन प्राप्त करने का एकमात्र तरीका धुंधला बढ़ाना शामिल है । आदर्श तरीका यह है कि एक स्टेप फंक्शन के बजाय, सोर्स इमेज के साथ कनवल्शन फंक्शन के बजाय, एन / 2 से बड़ा त्रिज्या के साथ एक गाऊसी कर्नेल का उपयोग करें। सन्निकटन से निपटने का एक सस्ता तरीका, हालांकि, यदि आपके पास पहले से ही एन-बाय-एन क्षेत्र का औसत कार्यान्वयन है, तो बस एक (1 / 4,1 / 2,1 / 4) परिणामी डाउनसम्प्लेट के लिए कलंक दोष को लागू करना है छवि।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.