अलग-अलग बायर डिमोसालाइजिंग एल्गोरिदम के पेशेवरों और विपक्ष क्या हैं?


25

बायर सेंसर लाल, हरे, और नीले रंग के पिक्सेल के पैटर्न का उपयोग करते हैं, और उन सभी को एक अंतिम रंग छवि में मिलाते हैं, जिसमें हर एक रंग सेंसर के लिए एक पिक्सेल होता है। यह पड़ोसी सेंसर के "भोले" सम्मिश्रण के माध्यम से किया जा सकता है, लेकिन मैंने AHD, HPHD और AMAZE जैसे नामों के साथ अधिक जटिल दृष्टिकोणों के बारे में सुना है।

ये अन्य दृष्टिकोण क्या हैं, और वे क्या फायदे लाते हैं? क्या उनके पास गणना जटिलता से परे कमजोरियां हैं?

मुझे लगता है कि इन-कैमरा जेपीईजी के लिए इस्तेमाल किया जाने वाला दृष्टिकोण अधिक कड़ा पहरा है, लेकिन स्पष्ट रूप से बहुत सारे अनुसंधान और विकास इस क्षेत्र में जाते हैं। क्या इन-कैमरा में उपलब्ध सीमित प्रसंस्करण शक्ति इस क्षेत्र में कोई समझौता करने को बाध्य करती है?


मैं गलत हो सकता हूं लेकिन मैं इस धारणा के तहत था कि कैमरे में डेमोकास्टिंग होती है अन्यथा छवि अलियासिंग से पीड़ित होगी। इस बारे में एक दिलचस्प लेख हाल ही में लोकप्रिय फोटोग्राफी में से एक सिग्मा (फोवॉन एक्स 3 सेंसर) के बारे में बात कर रहा था, जो उन कुछ कैमरों में से एक है जिनमें बायर सेंसर नहीं है।
जैकब सिसक जियोग्राफिक्स

1
खैर, जांच का एक त्वरित बिट AHD, या अनुकूली समरूपता-निर्देशित डेमोकास्टिंग इंगित करता है, "उद्योग मानक" है, और ऐसा लगता है कि ACR / LR (कम से कम एक युगल संस्करणों के रूप में उपयोग किया जाता है ... जो जानता है कि अगर उनके पास है ACR 6.x और LR4.x) के साथ अधिक उन्नत कुछ पेश किया। यह एक भारित एल्गोरिथ्म की तरह लगता है जिसका उद्देश्य झूठे रंग को कम करना है।
jrista

7
@ याकूब: जेपीईजी छवियों के लिए कैमरे में प्रदर्शन होता है। RAW छवि का संपूर्ण बिंदु यह है कि इसे अभी तक डेमोस्क्राइब नहीं किया गया है, और बिना किसी अतिरिक्त प्रसंस्करण के सेंसर से सीधे पिक्सेल डेटा की "कच्ची" रिकॉर्डिंग होती है (आवश्यक आईएसओ प्राप्त करने के लिए आपके मूल प्रवर्धन के बाहर।) एक ऑप्टिकल कम। -पास फिल्टर (एए फिल्टर) सेंसर के नाइक्विस्ट दर के नीचे शारीरिक रूप से "धुंधला" स्थानिक आवृत्तियों द्वारा उपनाम को समाप्त करता है।
jrista

ध्यान रखें कि हमारे बायर एरेज़ पर "रेड", "ग्रीन" और "ब्लू कलर फिल्टर हमारे RGB डिवाइस पर Red, Green और Blue emitters के बराबर नहीं हैं । यह दुर्भाग्यपूर्ण है कि हम दोनों के लिए समान नामों का उपयोग करते हैं।
माइकल सी

एह, वे वास्तव में उस तरह से इलाज करने के लिए काफी करीब हैं। आप सही रंग नहीं मिलेगा, लेकिन यह है बॉलपार्क में। उदाहरण के लिए petpegel.com/2013/02/12/… पर आवर्धित दृश्य देखें - बस नेत्रहीन, फिल्टर के रंग निश्चित रूप से वही होते हैं जिनकी हम पहचान करते हैं।
Mattdm

जवाबों:


19

मुझे कुछ महीने पहले आश्चर्य हुआ कि मेरे मशीन विज़न कैमरा एसडीके ने अपने अंतर्निहित बायर फ़ंक्शन में निकटतम पड़ोसी "इंटरपोलेशन" का उपयोग किया। यह सबसे तेज़ है, लेकिन सबसे खराब प्रकार है, कठोर किनारों को दे रहा है, खासकर जब आप छवि चैनल पर रंग कांस्टेंसी या ब्राइट इनविरेंस के लिए गणित करना शुरू करते हैं। मुझे एल्गोरिदम की यह समीक्षा मिली:

http://www.arl.army.mil/arlreports/2010/ARL-TR-5061.pdf

अगला कदम बिलिनियर और बाइबिक इंटरपोल हैं जो काफी तेजी से गणना की जा सकती हैं क्योंकि वे केवल गुठली के लिए मात्रा में हैं। ये कटे हुए किनारों पर रंगीन आरी-दाँत देते हैं - बाइबिक की तुलना में बिलिनियर।

इस पेपर में देखा जा सकता है, और 5 अलग-अलग एल्गोरिदम पर मात्रात्मक गुणवत्ता डेटा के साथ:

http://research.microsoft.com/en-us/um/people/lhe/papers/icassp04.demosaicing.pdf

यही कारण है कि उन्होंने बढ़त दिशा आधारित प्रक्षेप किए। हालांकि, ये हरे रंग को एक अधिक "महत्वपूर्ण चैनल" मानते हैं (क्योंकि इसमें हमारी दृश्य संवेदनशीलता और हमारी आंखों के संकल्प के लिए सबसे अच्छा रिज़ॉल्यूशन और खाता है)। और फिर वे हरे रंग के चैनल के एक समारोह के रूप में नीले और लाल रंग बनाते हैं, एक फैशन संरक्षण में। यह बदले में ग्रीन चैनल उच्च आवृत्ति सामग्री को त्रुटियों के लिए अधिक प्रवण बनाता है। जटिलता अधिक है क्योंकि उन्हें पता लगाना है कि क्या चल रहा है और कई पास की आवश्यकता है। इन प्रकार के प्रक्षेप से मोइयर और मक्का सामान्य कलाकृतियाँ हैं।

यहाँ वे अनुकूली समरूपता प्रदर्शन और बिलिनियर संस्करणों के उदाहरणों के साथ और बिना संरक्षण के और बिना किसी संरक्षण के किनारे के उदाहरण दिखाते हैं:

http://math.auburn.edu/~kilgota/ahd_bayer.pdf

वह कागज AHD का पक्षधर है और नकारात्मक भाग नहीं दिखाता है। इस पृष्ठ पर आप अलग-अलग पैटर्न की कलाकृतियों को अडैप्टिव होमोगेनेसिटी डेमोसाइलिंग, पैटर्न वाले पिक्सेल ग्रुपिंग, और ग्रैडिएटर्स की संख्या (नामों पर हॉवर माउस) देख सकते हैं:

http://www.ruevski.com/rawhistogram/40D_Demosaicing/40D_DemosaicingArtifacts.html

सारांश में, इन एल्गोरिदमों में कई मान्यताओं को नियोजित किया गया है, और कलाकृतियाँ तब होती हैं जब धारणा पकड़ में नहीं आती है:

  • प्रति चैनल चिकनाई। यदि निकटतम पड़ोसी समान नहीं हैं, तो संक्रमण को सुचारू बनाएं। विरूपण साक्ष्य: आरी / जिपर, कोमलता
  • निर्देशित किनारों (बिलिनियर दिशा) के साथ चमक निरंतरता। कलाकृतियों: उच्च आवृत्ति बनावट मौआ, रंग फ्रिंजिंग
  • निरंतरता। अगर एक पड़ोस में एक ही है, तो अगर एक चैनल बदल जाता है तो दूसरों को पालन करना होगा। कलाकृतियाँ: रंग किनारों पर रंगीन ज़िपर
  • साग से निरंतरता की भविष्यवाणी की जा सकती है। कलाकृति: mazes

त्वरित प्रश्न - अंतिम पंक्ति पर, क्या आपका मतलब है "मक्का" (मकई के प्रकार?) या "माज़"? या तो मामले में, मैं इस तरह के विरूपण साक्ष्य के थोड़े और विस्तार की सराहना करूंगा।
Mattdm

एक भूलभुलैया में माउस।
माइकल नील्सन

कूल :) मुझे लगता है कि मुझे पता है कि यह कलाकृतियों को संदर्भित करता है, लेकिन मुझे यकीन नहीं है। यह छोटी क्षैतिज और ऊर्ध्वाधर रेखाओं का एक यादृच्छिक पिक्सेल-स्तरीय पैटर्न (संभवतः शोर के साथ मिश्रित) है, है ना? यह जानना दिलचस्प है कि यह कहां से आता है - वास्तव में, मैंने लगभग दूसरे दिन इसके बारे में एक सवाल पूछा, क्योंकि मेरी धारणा यह थी कि यह एनआर विरूपण साक्ष्य है।
Mattdm

यह उन पंक्तियों को हां करता है और यह उस तरह से आता है जिस तरह से बायर एल्गोरिथ्म डेटा का अनुमान लगाने की कोशिश करता है।
माइकल नील्सन

5

मैंने इसके साथ थोड़ा खेलना शुरू कर दिया, और पाया कि भोली दृष्टिकोण यह सब बुरा नहीं है। यह बस प्रत्येक रंग को अलग-अलग व्यवहार कर रहा है और पिक्सेल के बीच में लाने के लिए प्रक्षेप कर रहा है। इसका मुख्य पहलू यह है कि यदि आप पिक्सेल को ऐसी जगह पर झाँक रहे हैं, जहाँ उच्च कंट्रास्ट है, तो आप थोड़ा सा रंग देख सकते हैं। एक और तरीका रखो, अगर आपके पास एक काले क्षेत्र को हल्के भूरे रंग का क्षेत्र है, तो आपको सीमा पर कुछ रंगीन पिक्सेल दिखाई देंगे। सौभाग्य से ये सामान्य रूप से औसत निकलते हैं, लेकिन यदि किनारे लगभग लंबवत या लगभग क्षैतिज हैं, तो वे कम आवृत्ति पर औसत निकलते हैं। एक ही प्रभाव पतली उज्ज्वल रेखाओं पर और भी अधिक स्पष्ट हो सकता है जो लगभग ऊर्ध्वाधर या क्षैतिज हैं।

यहाँ एक उदाहरण है। यह तस्वीर जानबूझकर एक परीक्षण शॉट के रूप में ली गई थी:

क्रोम ट्रिम की रेखा के स्पष्ट बैंडिंग पर ध्यान दें। इसे परिप्रेक्ष्य में रखने के लिए, यहाँ पूर्ण फ्रेम है:

मैंने एक वैकल्पिक दृष्टिकोण के बारे में सोचा है, लेकिन अभी तक हमेशा पहले करने के लिए अन्य चीजें हैं। यह योजना पहले सिर्फ चमक खोजने की कोशिश करेगी । यह छवि डेटा का एकल चैनल होगा यदि छवि काली और सफेद थी। प्रत्येक संवेदी इसमें कुछ योगदान देता है, हालांकि रंग समान रूप से योगदान नहीं करते हैं। एक बार तीव्रता निर्धारित हो जाने के बाद, आप रंगों को भोले तरीके से प्रक्षेपित करेंगे, लेकिन परिणाम को केवल इस तरह से रंगों को सेट करने के लिए उपयोग करें जैसे कि तीव्रता को संरक्षित करना। तीव्रता की बैंडविड्थ अधिक होगी, या ह्यू की जानकारी की तुलना में फोटोग्राफिक शब्दों में तेज होगी। एनालॉग टीवी ने एक कलर इमेज की बैंडविड्थ आवश्यकताओं को कम करने के लिए इस ट्रिक का उपयोग किया। वे इसके साथ दूर हो गए क्योंकि मानव दृश्य प्रणाली रंगों की तुलना में तीव्रता पर अधिक महत्व रखती है, विशेष रूप से लाल।

वैसे भी, वे सिर्फ कुछ विचार हैं। जैसा मैंने कहा, मैंने वास्तव में अभी तक कोशिश नहीं की है या विवरण तैयार नहीं किया है। किसी दिन।


3

यह मेरी समझ है कि लाइटरूम में विभिन्न प्रक्रिया संस्करण (अब तक हमारे पास 2003, 2010 और 2012 हैं) अन्य चीजों के बीच अलग-अलग डिमोसेरिंग एल्गोरिदम के अनुरूप हैं। एक और दिलचस्प सॉफ्टवेयर UFRaw है जो निम्नलिखित प्रदान करता है (वेबपेज से उद्धरण):


सफेद संतुलन स्थापित करने के बाद UFRaw बायर पैटर्न को प्रक्षेपित करता है।

  • एएचडी प्रक्षेप, अनुकूली समरूपता-निर्देशित प्रक्षेप है। यह डिफ़ॉल्ट प्रक्षेप है।
  • VNG इंटरपोलेशन थ्रेशोल्ड-आधारित वैरिएबल नंबर ऑफ़ ग्रैडिएर्स इंटरपोलेशन का उपयोग करता है। यह डिफ़ॉल्ट प्रक्षेप हुआ करता था और यह अभी भी बहुत अच्छा है
  • अगर आपको अपनी तस्वीर में बेयर पैटर्न की कलाकृतियां मिलती हैं तो VNG चार रंग प्रक्षेप का उपयोग किया जाना चाहिए (देखें अन्य विवरणों के लिए DCRaw के FAQ )।
  • PPG इंटरपोलेशन का अर्थ है पैटर्नेड पिक्सेल ग्रुपिंग इंटरपोलेशन। यह ऊपर के सभी के रूप में लगभग अच्छा है और बहुत तेज है।
  • बिलिनियर प्रक्षेप एक बहुत ही बुनियादी प्रक्षेप है लेकिन यह बहुत तेज है।

यह प्रयोग करने के लिए कुछ सामग्री प्रदान कर सकता है। वैसे, UFRaw खुला स्रोत है, जो आप की सुविधा देता है प्रतीत होता है झांक सकते एल्गोरिदम खुद को पर।


0

एस्ट्रोफोटोग्राफी में, इस विषय की गहराई से जांच की जाती है, क्योंकि एक-शॉट रंग सेंसर का उपयोग करते समय, डिबगिंग द्वारा बहुत सारे खोए हुए रिज़ॉल्यूशन होते हैं। उल्टा, रॉ फ़ाइल का उपयोग करके अभी भी मूल डेटा तक पहुंच प्राप्त होती है और इसे रंग अनुप्रयोग से पहले संसाधित किया जा सकता है। यह विषय चीजों के सॉफ्टवेयर पक्ष के करीब आता है।

संक्षेप में, यदि आपके पास एक ही विषय डेटा (जो सेंसर शोर को कम करने के लिए कुछ किया जाता है) के साथ बहुत सारी छवियों तक पहुंच है, तो आप ड्रिपल दृष्टिकोण के लिए एएचडी के साथ एकल फ्रेम रूपांतरण का व्यापार कर सकते हैं जो खोए हुए रिज़ॉल्यूशन को पुनर्प्राप्त कर सकता है। चुनाव इस बात पर निर्भर करता है कि आपके पास किस प्रकार का स्रोत डेटा उपलब्ध है। अधिकांश फ़ोटोग्राफ़रों के पास उपयोग करने के लिए केवल एक ही छवि है।

कुछ सॉफ्टवेयर जो मैंने डिबियरिंग प्रक्रियाओं के विकल्पों के साथ उपयोग किए हैं, वे हैं: डीप स्काई स्टेकर और पिक्स इनसाइट। वहां अन्य लोग भी हैं। कई DCRAW पर आधारित हैं ।

यहां दीप स्काई स्टेकर पेज पर लेख के लिए लिंक दिया गया है जहां वे कुछ विकल्पों पर चर्चा करते हैं: डिबाइरिंग विकल्प


1
यह दिलचस्प है (धन्यवाद!), लेकिन मुझे नहीं लगता कि यह सवाल का जवाब देता है। वह आखिरी कड़ी आशाजनक लगती है, लेकिन सभी पर डिमोस्टिंग के लिए विकल्पों पर ध्यान केंद्रित करती है। हाथ में विषय पर, यह केवल कहता है "अच्छे परिणाम (रैखिक, ढाल ...) के लिए बहुत सारे अलग-अलग प्रक्षेप तरीके खराब पैदा कर रहे हैं, लेकिन सभी अंतिम तस्वीर की गुणवत्ता को कम करके यह अनुमान लगा रहे हैं कि लापता रंग क्या होना चाहिए। " लेकिन यह व्यावहारिक विवरण में आगे नहीं जाता है।
Mattdm
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.