एक असंसाधित रॉ फ़ाइल कैसी दिखती है?

84

मुझे पता है कि लोग अपने RAW फ़ाइलों को पोस्ट-प्रोसेस करने के लिए लाइटरूम या डार्कटेबल जैसे फैंसी सॉफ्टवेयर का उपयोग करते हैं। लेकिन क्या होगा अगर मैं नहीं? फ़ाइल कैसा दिखता है, बस, y'know, RAW ?

raw image-processing file-format

— mattdm
स्रोत

21

साँचा। यह मैट्रिक्स की तरह दिखता है।

— ह्यूको

2

सम्बंधित; RAW फाइलें प्रति पिक्सेल 3 रंग, या केवल एक ही स्टोर करती हैं? और लाल, हरे और नीले प्रकाश के प्राथमिक रंग क्यों हैं? जो बताते हैं कि कैसे डिजिटल कैमरा सेंसर Minic रास्ता या आंखों / दिमाग मानता रंग कि एक अर्थ में वास्तव में जिस तरह से हम अक्सर यह मान यह होता है मौजूद नहीं है।

— माइकल सी

3

@ ह्यूको, एक बायर मैट्रिक्स, शायद।

— मार्क

मैंने चर्चा को स्थानांतरित कर दिया है कि चैट करने के लिए एक विहित प्रश्न के रूप में इसे कैसे संभालना है । कृपया इसे वहां जारी रखें, ताकि जो भी निर्णय समाप्त हो रहा है, उसकी टिप्पणियों में हमारे पास शोर न हो।

— ए जे हेंडरसन

1

यह जो नहीं दिखता है वह है "स्ट्रेट-आउट-ऑफ-कैमरा कच्ची छवि" जो कि कई लोगों को लगता है कि उनके पास कच्ची प्रोसेसिंग एप्लिकेशन में कच्ची छवि फ़ाइल खोलने पर है। यही इस सवाल का आधार है।

— माइकल सी।

183

एक उपकरण है जिसे dcraw कहा जाता है जो विभिन्न RAW फ़ाइल प्रकारों को पढ़ता है और उनसे पिक्सेल डेटा को निकालता है - यह वास्तव में बहुत सारे खुले स्रोत और यहां तक कि वाणिज्यिक RAW रूपांतरण सॉफ़्टवेयर के निचले तल पर मूल कोड है।

मेरे पास मेरे कैमरे से एक रॉ फ़ाइल है, और मैंने एक मोड में dcraw का उपयोग किया है जो इसे शाब्दिक, फ़ाइल से 16-बिट मानों का उपयोग करके एक छवि बनाने के लिए कहता है। मैंने इसे अवधारणात्मक गामा (और अपलोड के लिए छोटा कर दिया) का उपयोग करके साझा करने के लिए 8-बिट JPEG में परिवर्तित कर दिया। यह इस तरह दिखता है:

जाहिर है परिणाम, बहुत अंधेरा है, हालांकि विस्तार करने के लिए यदि आप क्लिक करें, और यदि आपके मॉनिटर सभ्य है, आप में से कुछ संकेत देख सकते हैं कुछ ।

यहां उसी RAW फ़ाइल से प्रस्तुत किया गया कैमरा-रंग JPEG है:

(फोटो क्रेडिट: मेरी बेटी मेरे कैमरे का उपयोग करके, वैसे)

पूरी तरह से अंधेरा नहीं है। जहां सभी डेटा छिपा रहे हैं, उसका विवरण एक गहन प्रश्न द्वारा सर्वोत्तम रूप से कवर किया गया है , लेकिन संक्षेप में, हमें एक वक्र की आवश्यकता होती है, जो एक विशिष्ट स्क्रीन पर 8-बिट जेपीईजी में उपलब्ध अंधेरे और रोशनी की सीमा पर डेटा का विस्तार करता है ।

सौभाग्य से, dcraw प्रोग्राम की एक और विधा है जो अधिक "उपयोगी" लेकिन फिर भी बमुश्किल संसाधित छवि में परिवर्तित होती है। यह गहरे काले और चमकीले सफेद रंग के स्तर को समायोजित करता है और डेटा को उचित रूप से बचाता है। यह स्वचालित रूप से या RAW फ़ाइल में रिकॉर्ड किए गए कैमरा सेटिंग से सफेद संतुलन भी सेट कर सकता है , लेकिन इस मामले में मैंने इसे नहीं बताया है, क्योंकि हम कम से कम प्रसंस्करण की जांच करना चाहते हैं।

आउटपुट में सेंसर और पिक्सल पर फ़ोटोग्राफ़रों के बीच एक-से-एक पत्राचार अभी भी है (हालांकि फिर से मैंने इसे अपलोड के लिए छोटा कर दिया है)। यह इस तरह दिखता है:

अब, यह स्पष्ट रूप से एक छवि के रूप में अधिक पहचानने योग्य है - लेकिन अगर हम इस पर ज़ूम करते हैं (यहाँ, इसलिए प्रत्येक पिक्सेल वास्तव में 10 × बढ़ाई गई है), हम देखते हैं कि यह सब है ... dotty:

ऐसा इसलिए है क्योंकि सेंसर को कलर फिल्टर ऐरे द्वारा कवर किया जाता है - प्रत्येक फोटोसाइट के छोटे छोटे रंगीन फिल्टर। क्योंकि मेरा कैमरा एक Fujifilm कैमरा है, यह एक पैटर्न का उपयोग करता है Fujifilm "X-Trans" कहता है, जो इस तरह दिखता है:

विशेष पैटर्न के बारे में कुछ विवरण हैं जो दिलचस्प हैं, लेकिन कुल मिलाकर यह अति-महत्वपूर्ण नहीं है। अधिकांश कैमरे आज एक बायर पैटर्न नामक चीज का उपयोग करते हैं (जो 6 × 6 के बजाय हर 2 × 2 को दोहराता है)। दोनों पैटर्न में लाल या नीले रंग की तुलना में अधिक हरे-फ़िल्टर साइट हैं। मानव आंख उस सीमा में प्रकाश के प्रति अधिक संवेदनशील है, और इसलिए उसके लिए अधिक पिक्सेल का उपयोग करना कम शोर के साथ अधिक विस्तार की अनुमति देता है।

ऊपर के उदाहरण में, केंद्र अनुभाग आकाश का एक पैच है, जो सियान की एक छाया है - आरजीबी में, यह बहुत सारे नीले और हरे रंग के बिना बहुत लाल है। तो डार्क डॉट्स रेड-फिल्टर साइट हैं - वे अंधेरे हैं क्योंकि उस क्षेत्र में वेवलेंग्थ में उतना प्रकाश नहीं है जो उस फिल्टर से मिलता है। शीर्ष दाएं कोने में विकर्ण पट्टी एक गहरे हरे रंग की पत्ती है, इसलिए जब सब कुछ थोड़ा अंधेरा होता है तो आप हरे रंग को देख सकते हैं - इस सेंसर पैटर्न के साथ 2 × 2 के बड़े ब्लॉक - उस क्षेत्र में अपेक्षाकृत सबसे उज्ज्वल हैं।

तो, वैसे भी, यहां 1: 1 (जब आप पूर्ण संस्करण प्राप्त करने के लिए क्लिक करते हैं, तो छवि में एक पिक्सेल स्क्रीन पर एक पिक्सेल होगा) आउट-ऑफ-कैमरा जेपीईजी का अनुभाग:

... और यहाँ उपर्युक्त त्वरित-ग्रेस्केल रूपांतरण से एक ही क्षेत्र है। आप एक्स-ट्रांस पैटर्न से स्टीपलिंग देख सकते हैं:

हम वास्तव में ऐसा कर सकते हैं और पिक्सेल को रंगीन कर सकते हैं ताकि सरणी में हरे रंग के अनुरूप उन ग्रे के बजाय हरे रंग के स्तर तक मैप किए जा सकें, लाल से लाल और नीले से नीले। यह हमें देता है:

... या, पूर्ण छवि के लिए:

हरे रंग की कास्ट बहुत स्पष्ट है, जो कोई आश्चर्य की बात नहीं है क्योंकि लाल या नीले रंग की तुलना में 2 more × अधिक हरे रंग के पिक्सेल हैं। प्रत्येक 3 × 3 ब्लॉक में दो लाल पिक्सेल, दो नीले पिक्सेल और पांच हरे पिक्सेल होते हैं। इसका प्रतिकार करने के लिए, मैंने एक बहुत ही सरल स्केलिंग प्रोग्राम बनाया, जो उन 3 × 3 ब्लॉकों में से प्रत्येक को एक पिक्सेल में बदल देता है। उस पिक्सेल में, हरा चैनल पाँच हरे पिक्सेल का औसत है, और लाल और नीला चैनल संबंधित दो लाल और नीले पिक्सेल का औसत है। यह हमें देता है:

... जो वास्तव में आधा बुरा नहीं है। सफेद संतुलन बंद है, लेकिन जब से मैंने जानबूझकर उस के लिए समायोजित नहीं करने का फैसला किया, यह कोई आश्चर्य की बात नहीं है। एक इमेजिंग प्रोग्राम में "ऑटो व्हाइट-बैलेंस" को मारना उसके लिए क्षतिपूर्ति करता है (जैसा कि पहले में dcraw सेट करने देता है):

कैमरों और RAW प्रसंस्करण कार्यक्रमों में उपयोग किए जाने वाले अधिक परिष्कृत एल्गोरिदम की तुलना में विवरण महान नहीं है, लेकिन स्पष्ट रूप से मूल बातें हैं। बेहतर दृष्टिकोण बड़े ब्लॉकों द्वारा जाने के बजाय प्रत्येक पिक्सेल के चारों ओर विभिन्न मूल्यों को भारित करके पूर्ण-रंग की छवियां बनाते हैं। चूंकि रंग आमतौर पर तस्वीरों में धीरे-धीरे बदलता है, यह बहुत अच्छी तरह से काम करता है और उन चित्रों का निर्माण करता है जहां पिक्सेल आयामों को कम किए बिना छवि पूर्ण रंग होती है। किनारे की कलाकृतियों, शोर, और अन्य समस्याओं को कम करने के लिए चतुर चालें भी हैं। इस प्रक्रिया को "डिमोसाशिंग" कहा जाता है, क्योंकि रंगीन फिल्टर का पैटर्न एक टाइल मोज़ेक जैसा दिखता है।

मुझे लगता है कि यह दृश्य (जहां मैंने वास्तव में कोई निर्णय नहीं लिया था, और कार्यक्रम स्वचालित रूप से स्मार्ट कुछ भी नहीं करता था) को RAW फ़ाइल के "मानक डिफ़ॉल्ट रूप" के रूप में परिभाषित किया जा सकता है, इस प्रकार कई इंटरनेट तर्क समाप्त हो सकते हैं। लेकिन, ऐसा कोई मानक नहीं है - ऐसा कोई नियम नहीं है कि यह विशेष "भोली" व्याख्या विशेष है।

और, यह एकमात्र संभव शुरुआती बिंदु नहीं है। सभी वास्तविक दुनिया RAW प्रसंस्करण कार्यक्रमों में लोड पर एक ताजा RAW फ़ाइल को लागू करने के लिए एक मूल डिफ़ॉल्ट राज्य के अपने विचार हैं। उन्हें कुछ करने के लिए मिला है (अन्यथा हम इस पोस्ट के शीर्ष पर उस अंधेरे, बेकार चीज को पसंद करेंगे), और आमतौर पर वे मेरे सरल मैनुअल रूपांतरण की तुलना में कुछ अधिक चालाक करते हैं, जो समझ में आता है, क्योंकि इससे आपको बेहतर परिणाम मिलते हैं।

— mattdm
स्रोत

4

सुन्दर चित्र। और शानदार जवाब।

— मार्क.2377

10

यह संख्याओं का वास्तव में बहुत बड़ा ग्रिड है। बाकी सब प्रसंस्करण है।

— WolfgangGroiss
स्रोत

टिप्पणियाँ विस्तारित चर्चा के लिए नहीं हैं; इस वार्तालाप को बातचीत में स्थानांतरित कर दिया गया है ।

— ए जे हेंडरसन

7

मुझे पता है कि यह पहले से ही mattdm द्वारा काफी अच्छी तरह से उत्तर दिया गया है, लेकिन मुझे लगा कि आपको यह लेख दिलचस्प लग सकता है :

डेटा जेनेटिक्स: डिजिटल कैमरे कैसे काम करते हैं

यदि लिंक नीचे चला जाता है, तो यहां एक सारांश दिया गया है:

मानव की आंखें हरे रंग की तरंग दैर्ध्य क्षेत्र में रंगों के लिए सबसे अधिक संवेदनशील होती हैं (इस तथ्य के साथ संयोग है कि हमारा सूर्य हरे क्षेत्र में सबसे अधिक तीव्रता से निकलता है)।

कैमरा आंख (चार्ज कपल्ड डिवाइस (सीसीडी) या मानार्थ धातु ऑक्साइड सेमीकंडक्टर (CMOS)) केवल प्रकाश की तीव्रता के प्रति संवेदनशील है, रंग के लिए नहीं।

प्रकाश के विभिन्न तरंग दैर्ध्य को छानने के लिए ऑप्टिकल फिल्टर का उपयोग किया जाता है। उदाहरण के लिए, एक हरे रंग का पास फिल्टर केवल हरे रंग की रोशनी को अंदर जाने देगा।

डिजिटल कैमरों में उपयोग किए जाने वाले ऑप्टिकल फिल्टर व्यक्तिगत पिक्सेल सेंसर के आकार के होते हैं, और सेंसर सरणी से मेल खाने के लिए ग्रिड में व्यवस्थित होते हैं। लाल, हरे और नीले (हमारे शंकु कोशिकाओं की तरह) फिल्टर का उपयोग किया जाता है। हालाँकि, क्योंकि हमारी आँखें हरे रंग के प्रति अधिक संवेदनशील हैं, बेयर एरे फिल्टर में प्रत्येक लाल और नीले पिक्सेल के लिए 2 हरे रंग के पिक्सेल फिल्टर हैं। बायर एरे में हरे रंग के फिल्टर होते हैं जो पैटर्न की तरह एक बिसात बनाते हैं, जबकि लाल और नीले फिल्टर बारी-बारी से पंक्तियों पर कब्जा कर लेते हैं।

अपने मूल प्रश्न पर वापस जाना: एक असंसाधित रॉ फ़ाइल कैसी दिखती है?

यह काले रंग का एक सफेद चेकर्ड मूल छवि का जाली जैसा दिखता है।

RAW फ़ाइलों को पोस्ट-प्रोसेसिंग के लिए फैंसी सॉफ्टवेयर पहले बायर फिल्टर को लागू करता है। यह सही तीव्रता और स्थानों में रंग के साथ, इसके बाद वास्तविक छवि की तरह दिखता है। हालांकि, अभी भी बायर फिल्टर से आरजीबी ग्रिड की कलाकृतियां हैं, क्योंकि प्रत्येक पिक्सेल केवल एक रंग है।

रंग कोडित RAW फ़ाइल को स्मूथ करने के लिए कई तरीके हैं। पिक्सेल को चिकना करना, धुंधला होने के समान है, इसलिए बहुत अधिक चौरसाई करना एक बुरी बात हो सकती है।

डिमोसालाइजिंग विधियों में से कुछ का वर्णन यहाँ किया गया है:

निकटतम पड़ोसी: एक पिक्सेल (एकल रंग) का मूल्य उसके अन्य रंगीन पड़ोसियों पर लागू होता है और रंग संयुक्त होते हैं। इस प्रक्रिया में कोई "नया" रंग नहीं बनाया जाता है, केवल वे रंग जिन्हें मूल रूप से कैमरा सेंसर द्वारा माना जाता था।

रेखीय प्रक्षेप: उदाहरण के लिए, दो आसन्न नीले मूल्यों को औसत करें और आसन्न नीले पिक्सेल के बीच के हरे रंग के पिक्सेल के लिए औसत नीला मान लागू करें। इससे धार तेज हो सकती है।

द्विघात और क्यूबिक इंटरपोलेशन: रैखिक प्रक्षेप के समान, इन-बीच रंग के लिए उच्च आदेश सन्निकटन। वे बेहतर फिट बनाने के लिए अधिक डेटा बिंदुओं का उपयोग करते हैं। रैखिक केवल दो को देखता है, तीन में द्विघात और चार को घन से रंग के बीच में उत्पन्न करता है।

कैटमुल-रोम स्प्लिन्स: क्यूबिक के समान, लेकिन इन-बीच रंग उत्पन्न करने के लिए प्रत्येक बिंदु के ग्रेडिएंट को ध्यान में रखता है।

आधा कोसाइन: एक प्रक्षेप विधि के एक उदाहरण के रूप में उपयोग किया जाता है, यह प्रत्येक जोड़े को समान रंगों के बीच आधा कोसाइन बनाता है और उनके बीच एक चिकनी अछूता वक्र होता है। हालांकि, जैसा कि लेख में कहा गया है, यह रंगों की व्यवस्था के कारण बायर सरणियों के लिए कोई लाभ नहीं देता है। यह रैखिक प्रक्षेप के बराबर है लेकिन उच्च कम्प्यूटेशनल लागत पर है।

उच्च अंत पोस्ट-प्रोसेसिंग सॉफ्टवेयर में बेहतर डीमॉस्सिंग तरीके और चतुर एल्गोरिदम हैं। उदाहरण के लिए, वे तेज किनारों या उच्च विपरीत परिवर्तनों की पहचान कर सकते हैं और रंग चैनलों के संयोजन के दौरान उनके तेज को संरक्षित कर सकते हैं।

— jreese
स्रोत

-6

मुझे लगता है कि बहुत से लोग कल्पना करते हैं कि कच्ची फाइलें सीधे कैमरे के सेंसर से सीधे पिक्सेल मूल्यों की एक सरणी होती हैं। ऐसे मामले हैं जो वास्तव में ऐसा है, और आपको सॉफ़्टवेयर की छवि की व्याख्या करने के लिए सेंसर के बारे में कुछ जानकारी प्रदान करनी होगी। लेकिन बहुत सारे उपभोक्ता कैमरे आमतौर पर "कच्ची फाइलें" देते हैं जो वास्तव में कम या ज्यादा TIFF फ़ाइल विनिर्देश के अनुरूप होती हैं (कुछ मामलों में, रंग बंद हो सकते हैं)। कोई फ़ाइल एक्सटेंशन को ".tif" में बदलने की कोशिश कर सकता है और देख सकता है कि फ़ाइल खोलने पर क्या होता है। मुझे लगता है कि आप में से कुछ एक अच्छी तस्वीर देखेंगे, लेकिन हर कोई नहीं, क्योंकि इस बात को लेकर मतभेद हैं कि अलग-अलग कैमरेंड्र्स इसे कैसे हल करते हैं।

एक "वास्तविक कच्ची फ़ाइल" के बजाय एक TIFF फ़ाइल एक अच्छा समाधान है। एक TIFF फ़ाइल में 16 बिट प्रति रंग हो सकते हैं। मुझे पता है कि सभी कैमरों के लिए पर्याप्त है।

Ed: मुझे आश्चर्य है कि क्यों यह जवाब नीचा हो गया। उत्तर अनिवार्य रूप से सही है (इस तथ्य के लिए आरक्षण के साथ कि कैमरा निर्माताओं को टीआईएफएफ संरचनाओं का उपयोग करने की आवश्यकता नहीं है, लेकिन उनमें से कई करते हैं)।

सेंसर से सीधे पिक्सेल के सरणी के बारे में भाग के बारे में, ऐसा कुछ होने की उम्मीद करना हास्यास्पद नहीं है। क्योंकि यह है कि उपभोक्ता कैमरा बाजार के बाहर बहुत सारे सेंसर कैसे काम करते हैं। इन मामलों में, आपको एक अलग फ़ाइल प्रदान करनी होगी जो सेंसर का वर्णन करती है।

वैसे, "रॉ" शब्द का उपयोग किया जाता है क्योंकि इसका मतलब यह होना चाहिए कि हमें असंसाधित सेंसर डेटा मिलता है। लेकिन यह उचित है कि कैमरा निर्माता वास्तविक के लिए कच्ची फाइलों के बजाय एक संरचित प्रारूप का उपयोग करते हैं। इस तरह से फोटोग्राफर को सटीक सेंसर डेटा की जानकारी नहीं होती है।

— उल्फ टेनफोर्स
स्रोत

2

मेरे पास फ़ाइल पुनर्प्राप्ति अनुप्रयोग हैं जो TIFF के रूप में "पुनर्प्राप्त" .cr2 फ़ाइलें हैं। उन फ़ाइलों को TIFF के साथ काम करने वाले किसी भी एप्लिकेशन का उपयोग करके नहीं खोला जाएगा। फ़ाइल एक्सटेंशन को वापस .cr2 में बदलना उन्हें पूरी तरह से उपयोग करने योग्य बना देता है .cr2 फ़ाइलें।

— माइकल सी

5

यह कहना नहीं है कि रॉ फाइलें अक्सर TIFF प्रारूप कंटेनरों का उपयोग नहीं कर रही हैं - यह बिल्कुल सही है। यह सिर्फ इतना है कि जिस चीज को आप देख रहे हैं वह संभवतः "रॉ" डेटा नहीं है, जिस अर्थ में मैं देख रहा हूं।

— mattdm

2

ठीक है, स्पष्ट करने के लिए, फ़ाइल TIFF फ़ाइल स्वरूप से संरचनाओं का उपयोग करती है। लेकिन चूंकि यह टीआईएफएफ विनिर्देश के अनुसार बिल्कुल नहीं करता है, इसलिए यह एक सख्त टीआईएफएफ फाइल नहीं है। लेकिन मुद्दा यह है कि फ़ाइल को पढ़ने के लिए एक TIFF लाइब्रेरी का उपयोग किया जा सकता है। किसी को उस फ़ाइल को पढ़ने के लिए स्क्रैच से सब कुछ नहीं करना पड़ता है।

— उल्फेन टेन्फोर्स

5

किसी भी भावना के साथ कोई भी RAW फ़ाइल को सेंसर से दूर रखने के लिए किसी भी समय, कैमरा जानकारी आदि जैसे किसी भी मेटाडेटा के बिना डेटा की उम्मीद नहीं करेगा। तथ्य यह है कि डेटा को संरचित करने के लिए टीआईएफएफ जैसे प्रारूप उपयोगी हैं, वास्तव में महत्वपूर्ण नहीं है, न ही यह वैचारिक सिद्धांत को कम करता है कि डेटा पोस्ट-प्रोसेसिंग के बिना सेंसर से "सीधे" है।

— whatsisname

3

टीआईएफएफ एक कंटेनर है, वास्तव में एक छवि प्रारूप नहीं है। आप टीआईएफएफ में डेटा स्टोर कर सकते हैं और फिर भी यह एक छवि के बजाय कच्चे सेंसर डेटा हो सकता है बिना कैमरा विशिष्ट ज्ञान के कोई भी उपयोग नहीं कर सकता है।

— चौथाई