आज की स्क्रीन में गामा सुधार का उद्देश्य क्या है और यह ग्राफिक्स और फोटोग्राफी से कैसे संबंधित है?


15

मैं गामा सुधार के उद्देश्य और ग्राफिक्स और फोटोग्राफी के साथ-साथ सामान्य और रंग प्रबंधन के संदर्भ में गामा सही और बिना सही छवियों के बीच के संबंध में काफी भ्रमित हो रहा हूं (रैखिक आरजीबी से गामा-सही आरजीबी स्थानों में रूपांतरण और फिर इसे प्रदर्शित करना स्क्रीन)।

कई स्रोतों से, मुख्य रूप से http://www.guillermoluijk.com/article/gamma/index.htm और सवाल # 23026151 StackOverflow पर (क्या मुझे आधुनिक कंप्यूटर / मॉनिटर पर अंतिम रंग आउटपुट को सही करने की आवश्यकता है?) , I ' ? इस निष्कर्ष पर पहुंचा हूँ कि:

गामा सुधार मूल रूप से इनपुट सिग्नल के लिए सीआरटी मॉनिटर की गैर-रैखिक प्रतिक्रिया के लिए क्षतिपूर्ति करने के लिए डिज़ाइन किया गया था। CRTs इनपुट सिग्नल को स्वयं बढ़ाने में सक्षम नहीं थे और इस प्रकार पीसी से आउटपुट सिग्नल को समायोजित करने की आवश्यकता थी (आज के रूप में) मानक गामा 2.2 सुधार और sRGB रंग स्थान।

आधुनिक स्क्रीन , हालांकि, सीआरटी की तरह सिग्नल हानि से ग्रस्त नहीं हैं। वे कुछ गैर-रैखिकताएं भी दिखा सकते हैं, लेकिन यह देखते हुए कि इनपुट सिग्नल को सबसे अधिक बार केवल 8 बिट्स प्रति चैनल (256 शेड्स) द्वारा किया जाता है, उन्हें अपने रंग प्रजनन में कुछ गैर-रैखिकताओं के लिए स्वयं को सक्षम करने में सक्षम होना चाहिए क्योंकि वे संभवतः सक्षम हैं एक चैनल में 256 से अधिक रंगों को पुन: प्रस्तुत करना। इसका मतलब यह होगा कि गामा सुधार के साथ-साथ sRGB और सभी गामा-सही रंग रिक्त स्थान सीआरटी युग से सिर्फ एक विरासत हैं और इसका एकमात्र उद्देश्य इनपुट सिग्नल को रैखिक रूप से प्रदर्शित करना था।

ऐसे लेख भी हैं जो दावा करते हैं कि मानव दृष्टि की गैर-रैखिकता की भरपाई के लिए गामा सुधार यहाँ है(CambridgeInColour.com - गामा सुधार को समझना) जो मोटे तौर पर गामा वक्र के अनुरूप होना चाहिए क्योंकि हम गहरे रंगों में छोटे अंतर को पहचानने में सक्षम हैं, लेकिन उज्जवल लोगों के साथ ऐसा नहीं करते हैं (एक बिंदु की चमक इसके लिए पर्याप्त रूप से बढ़नी चाहिए) उज्जवल दिखना)। यह कैसे कैमरा सेंसर दृश्य रिकॉर्ड नहीं है। एक सेंसर से कच्चा डेटा रैखिक आरजीबी में प्राप्त किया जाता है और गामा-सही आरजीबी रंग अंतरिक्ष (छाया उठाया और रोशनी गहरा) में विकसित होता है। गामा सुधार का मतलब हालांकि आउटपुट सिग्नल के नुकसान की भरपाई करना था, इसलिए मेरा मानना ​​है कि आधुनिक स्क्रीनें हैं, वे बस गामा सुधार को रद्द करने के लिए सीआरटी के व्यवहार का अनुकरण करते हैं और दृश्य को उसी तरह प्रदर्शित करते हैं जैसे कि कैमरे द्वारा कैप्चर किया गया था - मोटे तौर पर बोलना, कैमरा बदलना शेड्स 1: 1 स्क्रीन वालों के लिए। कुंआ,

क्या इसका मतलब यह है कि आरजीबी रंग अंतरिक्ष में हर शेड का रैखिक आरजीबी सहित हर दूसरे आरजीबी अंतरिक्ष में बिल्कुल वैसा ही आरजीबी मान होना चाहिए (जैसे # 010A1F sRGB में, बिटमैप फ़ाइल में भंडारण के संदर्भ में रैखिक आरजीबी में # 010A1F के लिए बिल्कुल अनुवाद करता है। 8bpc) और यह केवल स्क्रीन और ग्राफिक्स एडॉप्टर पर निर्भर है कि वे रंग हस्तांतरण की व्यवस्था कैसे करते हैं और क्या छवि को गंतव्य स्थान में बदलने के लिए किसी भी अतिरिक्त पुनर्संरचना का प्रदर्शन करना है? दूसरे शब्दों में, ग्राफिक्स एडिटर में बदलते रंग की जगह वास्तव में आरजीबी मूल्यों के साथ कुछ नहीं करना है, केवल छवि मेटाडेटा में नए रंग स्थान का ध्यान रखता है? मेरा मानना ​​है कि यह मामला नहीं है क्योंकि रंग प्रबंधन इस तरह बेकार हो जाएगा जहां डिजिटल ग्राफिक्स एडॉप्टर / स्क्रीन इंटरफेस का उपयोग किया जाता है - ग्राफिक्स एडेप्टर सादे आरजीबी डेटा भेज सकता है, भले ही कोई एनालॉग लाभ (गामा) के रूप में इस्तेमाल किए गए रंग अंतरिक्ष की परवाह किए बिना हो। उन मानों पर लागू किया जाता है जो 0 से 255 तक एक रेखीय पैमाने पर जाते हैं। साथ ही विभिन्न रंग प्रोफाइलों का सरगम ​​एक ही होगा यदि कोई गोल त्रुटियां पेश नहीं की गईं, या?

मेरा अंतिम सा भ्रम संभवतः रंग प्रोफ़ाइल रूपांतरण की गलतफहमी और लेख http://www.guillermoluijk.com/article/superhdr/index.htm ( एक्सपोजर के पहले स्तर) की तालिका का उपयोग करके अनुवादित किया जा सकता है। गूगल अनुवाद)। क्या मैं इसे सही ढंग से समझता हूं कि रेखीय मान एक घातीय फ़ंक्शन (या उलटा गामा) का उपयोग करके बदल दिया जाता है, जो तानवाला सीमा को छाया की ओर सिकोड़ता है और इस प्रकार छवि को काला कर देता है? क्या ऐसा होता है अगर हम रैखिक आरजीबी को बचाते हैं और इसे कंप्यूटर स्क्रीन पर एक गामा-सही छवि के रूप में पेश करते हैं?

मैं इस तरह के एक जटिल सवाल पूछने के लिए माफी मांगता हूं, लेकिन यह बहुत मुश्किल साबित होता है कि सूचना का एक अच्छा स्रोत खोजने के लिए सभी अनिश्चितताएं उत्पन्न होती हैं। किसी भी उत्तर के लिए अग्रिम धन्यवाद, जो मेरी गलतफहमी को दूर करने में मदद कर सकता है।


4
आप इस प्रश्न को संक्षेप में प्रस्तुत करने का प्रयास कर सकते हैं। हालांकि अकेले शीर्षक से इसका जवाब देना अभी भी संभव है, लेकिन मुझे लगता है कि इसे संपादित करना एक अच्छा तरीका होगा जो आपको विषय को समझने में मदद करेगा।
जेनएससीडीसी

1
मैं एक उत्तर पर काम करना शुरू कर रहा हूं, किसी भी छोटे हिस्से में नहीं क्योंकि मुझे एहसास हुआ कि मैं बहुत कुछ भूल गया हूं, और किसी के सवाल का जवाब देना एक अच्छा तरीका है।
जेएनएनसीडीसी

मुख्य कारण बस पीछे-संगतता है। आप पुराने सीआरटी मॉनिटर और आधुनिक एलसीडी मॉनिटर के साथ एक ही कंप्यूटर और एक ही सॉफ्टवेयर का उपयोग करने में सक्षम होना चाहते हैं। सॉफ्टवेयर वही काम करता है जो उसने पुराने दिनों में किया था: यह sRGB कलर स्पेस में इमेज बनाता है। बेशक, इसमें सामान्य गामा सुधार शामिल है। तब पुराने CRT मॉनिटर छवियों का उपयोग करेंगे, जबकि आधुनिक डिस्प्ले मूल रूप से रैखिक रंग अंतरिक्ष से sRGB रंग स्थान में रूपांतरण को "पूर्ववत" करेगा।
जुका सूमेला

और यह फोटोग्राफी से कैसे संबंधित है: सही उपकरण दिए गए हैं, यह नहीं है। गामा सुधार (और आमतौर पर विभिन्न रंग स्थानों के बीच रूपांतरण) स्वचालित रूप से होता है; सामान्य उपयोगकर्ताओं को इसे देखने में सक्षम नहीं होना चाहिए। यह सिर्फ एक तकनीकी है जिसे कंप्यूटर प्रोग्रामर को जानना होगा, लेकिन अंतिम उपयोगकर्ताओं को इसके बारे में जानने की आवश्यकता नहीं है। (जब तक, निश्चित रूप से, आप स्पष्ट रूप से sRGB रंग अंतरिक्ष में हेक्साडेसिमल रंग मूल्यों जैसे कुछ दर्ज करना चाहते हैं, जिस स्थिति में आप सबसे अधिक संभावना जानते हैं कि आप क्या कर रहे हैं।)
जुका सूकोला

जवाबों:


10

से चार्ल्स पोयनटन "गामा के पुनर्वास" :

गलतफहमी: एक CRT मॉनिटर की गैर- शुद्धता एक दोष है जिसे ठीक करने की आवश्यकता है।

तथ्य: CRT की गैर-मौजूदगी मानव दृष्टि की हल्की संवेदनशीलता के विलोम है। नॉनक्लियरिटी के कारण CRT की प्रतिक्रिया मोटे तौर पर अवधारणात्मक रूप से समान होती है। दोष होने से दूर, यह सुविधा अत्यधिक वांछनीय है।

गलतफहमी: गामा सुधार का मुख्य उद्देश्य सीआरटी की गैर-हीनता की भरपाई करना है।

तथ्य: वीडियो, डेस्कटॉप ग्राफिक्स, प्रीप्रेस, जेपीईजी, और एमपीईजी में गामा सुधार का मुख्य उद्देश्य एक समान रूप से समान डोमेन में ल्यूमिनेंस या ट्रिस्टिमुलस मान (तीव्रता के अनुपात) को कोड करना है, ताकि सीमित संख्या के बिट्स के अवधारणात्मक प्रदर्शन को अनुकूलित किया जा सके। प्रत्येक RGB (या CMYK) घटक में।

बाकी लेख बहुत ही ज्ञानवर्धक है, :)


प्रकृति में दृश्य रैखिक गामा में है, और इसे एक स्क्रीन पर या उसी तरह से कागज पर प्रस्तुत किया जाना चाहिए, जो भड़कने के लिए क्षतिपूर्ति करने के लिए गामा की थोड़ी सी वृद्धि के साथ - आमतौर पर गामा 1.1 या 1.2।
इलैया बोर्ग

1
डॉ । पॉयटन की पीएचडी थीसिस अब ऑनलाइन है: poynton.ca/PDFs/Poynton-2018-PhD.pdf । अध्याय 3 और 4 शास्त्रीय वक्रों के साथ सौदा करते हैं, अध्याय 8 "बार्टन लाइटनेस" ओईटीएफ का परिचय देता है जिसका आकार डॉल्बी पीक्यू वक्र (एसएमपीटीई -2084) के समान है। पैमाने के उच्च अंत में यह गामा से एक लॉग वक्र में मूल रूप से होता है, जो कि हम वास्तव में उम्मीद करते हैं। पूरी किताब बहुत ज्ञानवर्धक है!
वैन ड्युन

7

रंग में कैम्ब्रिज से इस उदाहरण पर विचार करें :

यहाँ छवि विवरण दर्ज करें

गामा एन्कोडिंग को लागू करके, हम मूल छवि को अधिक सटीक रूप से प्रस्तुत करने में सक्षम हैं, एक ही बिट गहराई (5, इस उदाहरण में) के साथ।

यह एक तरह से 32 स्तरों का उपयोग करके प्राप्त किया जाता है जो मानव आंख के अधिक निकटता से मेल खाता है। दूसरे शब्दों में, यह संपीड़न का एक रूप है। उदाहरण के लिए, JPEGs वास्तव में केवल 8 बिट्स प्रति चैनल का उपयोग करने के बावजूद डायनेमिक रेंज के लगभग 11 स्टॉप को स्टोर कर सकते हैं ।

और संपीड़न के किसी भी अन्य रूप की तरह, यह कोई फर्क नहीं पड़ता कि आप फ़ाइल आकार के बारे में परवाह नहीं करते हैं (और कम गति जिसके साथ आप फ़ाइलों को पढ़ या लिख ​​सकते हैं)। आप सिद्धांत रूप में, जेपीईजी जैसे प्रारूप का उपयोग कर सकते हैं जो रैखिक गामा का उपयोग करता है, यदि आप 8 के बजाय प्रत्येक चैनल पर 11 बिट्स आवंटित करने के लिए तैयार थे।

इसलिए, संक्षेप में, गामा केवल संपीड़न का एक रूप है: यह एक निश्चित मात्रा में जानकारी संग्रहीत करने के लिए आवश्यक फ़ाइल आकार को कम कर देता है क्योंकि आंख इसे मानती है। वैकल्पिक रूप से, यह आपको एक ही बिट गहराई में अधिक सूक्ष्म उन्नयन स्टोर करने देता है।


7

मैं एक पूर्व प्रसारण इंजीनियर हूं, और मैं वर्तमान में एक संपादक और वीएफएक्स पर्यवेक्षक के रूप में फीचर फिल्मों और टेलीविजन में काम करता हूं।

यहाँ पर कई कथन गलत हैं। सिग्नल पथ में गामा एक वांछित लाभ है , और ट्रांसमिशन में कथित शोर को कम करने के लिए शुरुआती वीडियो इंजीनियरों द्वारा एक डिजाइन विकल्प है।

सभी वैक्यूम ट्यूब, सीआरटी शामिल हैं, विभिन्न गैर-रैखिकता प्रदर्शित करते हैं (लैंगमुइर-चाइल्ड कानून देखें) सीआरटी विभिन्न डिजाइन अंतरों के आधार पर 1.5 से 3.5 (जब एक वोल्टेज सिग्नल द्वारा संचालित) के "गामा" से भिन्न हो सकते हैं। Nonlinearities मोनोक्रोम के साथ एक समस्या के कम थे, लेकिन रंग के साथ और अधिक महत्वपूर्ण हो गए, इसलिए NTSC ने 1 / 2.2 का संकेत गामा निर्दिष्ट किया। सीआरटी डिज़ाइन और सपोर्टिंग सर्किट लैंगमुइर-चाइल्ड लॉ से वास्तविक गामा को समायोजित करते हैं (आमतौर पर 1.5 के रूप में समझा जाता है, लेकिन आमतौर पर सीआरटी के साथ कई कारकों के कारण अधिक है) ~ 2.5 की मानव धारणा "गामा" के अनुरूप एक स्तर तक। एनटीएसआर के लिए, टेलीविजन सेट को ~ 2.4 का एक गामा लक्ष्य माना गया था, ** जबकि पाल ने संकेत दिया ~ 2.8

पुराने एनालॉग प्रसारण सिग्नल मानकों में उच्च गामा विशेष रूप से मानव शोर पर गैर-रैखिक होने के आधार पर कथित शोर को कम करने के लिए है। इस उपयोग के मामले में, सिग्नल को गामा एन्कोडिंग के "मजबूर" प्रभाव से शोर को छिपाने के लिए गैर-रैखिकता का लाभ उठाते हुए। यह काफी अकादमिक है।

गामा-प्रकार वक्र के विपरीत, रैखिकता प्राप्त करने के लिए CRT TV और मॉनिटर डिज़ाइन में कुछ तरीके बदल दिए जा सकते हैं, लेकिन एनालॉग प्रसारण में एक गामा वक्र 30 dB तक स्पष्ट शोर को कम कर देता है। गामा तब वांछनीय था, जैसा कि अब है

अगर एलसीडी मॉनिटर का उपयोग रेखीय (गामा 1.0) तरीके से किया जा सकता है तो भी गामा की जरूरत है। यहां दावा किया गया है कि गामा की अब आवश्यकता नहीं है , यह पूरी तरह से चारपाई हैं, और पूर्व-जोर वक्र लगाने के वर्तमान उद्देश्य को समझने में विफल हैं।

गामा वह है जो sRGB (या Rec709) को "अच्छा" देखने की अनुमति देता है, भले ही बिट गहराई प्रति चैनल केवल 8 बिट्स हो। यहाँ एक उदाहरण है:

यह sRGB, 8 बिट में एक इमेज है, जिसमें गामा प्री-जोर (सामान्य वेब इमेज) है। साधारण

यहां बताया गया है कि यह छवि गामा के लाभ के बिना कैसे दिखाई देगी (अर्थात यदि यह रैखिक मान और रैखिक प्रदर्शन, कोई गामा पूर्व-जोर नहीं है)। खराब

गामा चिकनी ढालों और कम शोर के लिए गहरे क्षेत्रों में अधिक बिट्स के लिए प्रदान करता है।

यदि आप पूरी तरह से रैखिक जाना चाहते हैं, तो आपके पूरे सिग्नल पथ को प्रति चैनल कम से कम 12 बिट्स की आवश्यकता होगी। 8 बीपीसी पर्याप्त नहीं है। एक वक्र के साथ एन्कोडिंग और डिस्प्ले पर डिकोडिंग से प्रति चैनल एक बाइट के छोटे डेटा चंक के उपयोग की अनुमति मिलती है।

फिल्म में, हम एक कार्यक्षेत्र के रूप में रैखिक का उपयोग करते हैं , लेकिन रैखिक के साथ काम करते समय हम 32 बिट प्रति चैनल फ्लोटिंग पॉइंट में होते हैं । जब हम रैखिक छवि फ़ाइलों का आदान-प्रदान करते हैं, तो हम EXR हाफ का उपयोग करते हैं, जो प्रति चैनल फ्लोट 16 बिट है। (और अगर हम 10 बिट डीपीएक्स फ़ाइलों का उपयोग करते हैं, तो छवि डेटा एक लॉग वक्र का उपयोग करके एन्कोडेड है)।

परंतु

कंप्यूटर मॉनिटर जो हम उपयोग करते हैं, वे अभी भी प्रदर्शन के लिए 8 या 10 बिट के हैं, इसलिए सभी रेखीय छवियों को अभी भी मॉनिटर पर भेजे जाने से पहले गामा-समायोजित करने की आवश्यकता है। क्यों?

अधिकांश "अच्छे" मॉनिटर प्रति बिट केवल 8 बिट हैं, और कई "6 बिट आंतरिक" हैं, जिसका अर्थ है कि वे प्रति चैनल 8 बिट और प्रति चैनल 6 बिट के रूप में प्रदर्शित करते हैं। वे एक स्वीकार्य छवि कैसे बना सकते हैं?

GAMMA!

10 बिट प्रति चैनल मॉनिटर दुर्लभ और महंगे हैं (जैसे मेरा NEX PA271W)। मेरा NEC 10 बिट संकेत ले सकता है, और प्रोफाइलिंग के लिए 14 बिट आंतरिक LUT का उपयोग करता है। लेकिन 10 बिट्स अभी भी रैखिक के लिए पर्याप्त नहीं हैं!

गामा या कुछ प्रकार के प्रीमेम्फ / डीम्फ कर्व 10 बिट के लिए भी आवश्यक हैं । 12 बिट उचित रैखिक प्रदर्शन के लिए नंगे न्यूनतम है, और फिर भी फीचर फिल्म उद्योग के लिए अस्वीकार्य है।

हम DCDM (डिजिटल सिनेमा) के लिए 12 बिट प्रोजेक्टर का उपयोग करते हैं और क्या अनुमान लगाते हैं? न केवल DCDM CIE X´Y´Z we का उपयोग कर रहा है, हम भी 2.6 की प्रोजेक्टर गामा का उपयोग करते हैं !!!

DCI सिनेमाघरों के लिए बनाया गया था और इसका अपना इको-सिस्टम बंद है, जिसमें CRT जैसी पुरानी तकनीकों पर कोई निर्भरता नहीं है। यदि रैखिक (गामा 1.0) स्थान का उपयोग करने के लिए कुछ "लाभ" था, तो इसका उपयोग किया जाता, लेकिन यह नहीं है।

डिजिटल सिनेमा में रैखिक का उपयोग नहीं किया जाता है क्योंकि ADVANTAGE एक गामा वक्र का उपयोग कर रहा है

इसलिए, कृपया यह कहना बंद कर दें कि हम केवल विरासत कारणों से गामा का उपयोग करते हैं, क्योंकि यह गलत है।

कृपया पोयटन को इस विषय पर पढ़ें , क्योंकि वह इन मुद्दों को समझने के आसान तरीके से स्पष्ट करता है।

पढ़ने के लिए धन्यवाद।

फुटनोट: ** जबकि NTSC ने 1 / 2.2 का सिग्नल गामा निर्दिष्ट किया था, टीवी से सिस्टम गामा लाभ के लिए 2.4 गामा होने की उम्मीद थी। यह इंगित करना उपयोगी है कि Rec709 (HDTV) और sRGB ट्रांसफर वक्र को छोड़कर समान हैं। और दिलचस्प है, Rec709 (BT1886 के माध्यम से) 2.4 का एक "भौतिक प्रदर्शन गामा" निर्दिष्ट करता है (यानी स्वयं मॉनिटर का गामा) और sRGB मॉनिटर आमतौर पर 2.4 या उच्चतर पर सेट होते हैं (सर्वेक्षण बताते हैं कि अधिकांश उपयोगकर्ता उन्हें 2.5 और ऊपर सेट करते हैं)। लेकिन SIGNAL गामा अलग है, लगभग। SRGB के लिए 1 / 2.2 और Rec709 के लिए लगभग 1 / 2.0। दोनों ही मामलों में, एक सिस्टम गामा लाभ है जो अपेक्षित देखने के वातावरण के आधार पर जानबूझकर है।


मैं हमेशा सोचता था कि ऑडियो उद्योग एक ही दृष्टिकोण का उपयोग क्यों नहीं करता है, बल्कि प्रति नमूना 16+ बिट्स इस पर फेंकता है ...
ज़ीउस

हाय @Zeus, कई कारण हैं (यदि आप इसे एक प्रश्न के रूप में पूछते हैं तो मैं गहराई से उत्तर दे सकता हूं)। असल में, यहां तक ​​कि 16 या 24 बिट पर, ऑडियो स्ट्रीम वीडियो (सामान्य रूप से) की तुलना में काफी कम बैंडविड्थ हैं, और कम्प्यूटेशनल रूप से संभालने के लिए आसान है। फिर भी, ऑडियो कई मामलों (विशेष रूप से कम बिट दर) में पूर्व-जोर और डे-जोर के इन प्रकारों का उपयोग करता है। और वास्तव में श्रवण भी गैर-रैखिक है (जैसा कि सभी धारणा है) लेकिन 8 बिट ऑडियो "प्रकार" है प्रति चैनल 4 बिट की तरह। याद रखें कि 8 बिट प्रति चान वीडियो प्रति पिक्सेल 24 बिट का उपयोग करता है, इसलिए 16 बिट ऑडियो की तुलना सेब / संतरे से होती है।
मायएंडएक्स

धन्यवाद @Myndex, दुर्भाग्य से यह एक सवाल के रूप में यहाँ विषय होगा। मुझे बस उत्सुकता है कि इस तरह के प्री-डे-जोर का उपयोग ऑडियो के लिए शुरू से ही नहीं किया गया था, यह देखते हुए कि यह देखने के लिए सुनने के लिए उतना ही स्वाभाविक है। वैसे, मेरा मतलब था प्रति चैनल 16 बिट (बेशक सीडी पर); रैखिक 8-बिट ऑडियो (जो औपचारिक रूप से मौजूद है) आपके उदाहरण से रैखिक 8-बिट वीडियो की तुलना में अधिक भयानक है (जो मानक के रूप में भी मौजूद नहीं है)। मैं समझता हूं कि ट्रेडऑफ कम है, लेकिन लाभ अधिक हैं: हर 3 डीबी में संकल्प का आधा खोना पागल लगता है ...
ज़ीउस

मुझे लगता है कि एक स्टैक एक्सचेंज से संबंधित साइट है जो ऑडियो प्रश्नों का स्वागत करेगी। भले ही: 16 बिट ऑडियो में प्रत्येक बिट 6 डीबी (वोल्टेज) के बराबर होता है, इसलिए 96 डीबी की कुल गतिशील सीमा होती है। 6dB (वोल्टेज) वोल्टेज में "दो बार" (या आधा) जोर से होता है, लेकिन BUT इंसान 10 dB को शाब्दिक "आधा जितना लाउड" राशि मानते हैं। ऑडियो में Pre / De emph का इस्तेमाल शुरू से ही किया जाता रहा है। अभिलेखों में RIAA वक्र, चुंबकीय टेप का उपयोग किया गया NAB वक्र, इत्यादि इत्यादि। आपका क्या मतलब है कि प्रत्येक 3 dB में आधा संकल्प खोना है ???
Myndex

रैखिक डिजिटल एन्कोडिंग में, वोल्टेज का आधा डिजिटल रेंज (परिभाषा के अनुसार) का आधा होता है, अर्थात 1 बिट रिज़ॉल्यूशन का नुकसान। यह किसी ऐसी चीज के लिए बहुत कुछ है जिसे 'थोड़ा नरम' (-6 डीबी) माना जाता है, यह मेरा मतलब है, न कि 3)। यदि हम आवश्यक ~ 35dB कम से कम (भाषण या ऑर्केस्ट्रा के लिए) कैप्चर करना चाहते हैं, तो यह पहले से ही नरम ध्वनियों के लिए 6 बिट का नुकसान है (और फिर भी, यदि ठीक से सामान्यीकृत है)। मैं 'एनालॉग' जोर (जो थोड़ा अलग और आवृत्ति पर निर्भर था) से अवगत हूं, लेकिन कभी भी डिजिटल के लिए इस्तेमाल नहीं किया गया है, इसलिए मेरे सवाल ...
ज़ीउस

3

गामा और मानव दृष्टि के कई अस्पष्ट संदर्भों के साथ गामा सुधार पर बहुत सारे भ्रमित करने वाले लेख हैं। गामा का कारण ऐतिहासिक है और पुराने सीआरटी-प्रकार के मॉनिटर (मानव दृष्टि के साथ कुछ भी नहीं करने) की प्रतिक्रिया वक्र का एक परिणाम है। आधुनिक दिन फ्लैट स्क्रीन के साथ गामा एन्कोडिंग और बाद में सुधार के लिए कोई तार्किक कारण नहीं है, लेकिन यह उद्योग मानक बन गया है।

संयोग से गामा वक्र और मानव दृष्टि की प्रतिक्रिया वक्र छवि के बिट गहराई के रूप में फ़ाइल के आकार पर कटौती नीचे की मदद करने में कुछ लाभ उपज है के बीच समान संबंध को प्रभावित किए बिना कम किया जा सकता कथित छवि गुणवत्ता।


1

ओपी सब बहुत सही है, सिवाय इसके कि गामा अंधेरे टन को उज्जवल बनाता है, न कि धुंधला। यह केवल फ़ाइल में मौजूद है, आंख में नहीं। डेटा को हमेशा मूल रेखीय में वापस डिकोड किया जाता है इससे पहले कि कोई भी आंख इसे देखती है। मूल दृश्य को देखने में आंखों में कोई अंतर, और पुनरुत्पादित डीकोड किए गए डेटा को देखना, बस एक अवांछित प्रजनन त्रुटि है।

गामा केवल CRT मॉनिटर के गंभीर नुकसान को ठीक करने के लिए किया जाता है। CRT नॉनलाइनर है, यह चमकीले टोन दिखाता है, लेकिन गहरे टोन को खो देता है। तो गामा गहरे स्वर को उज्ज्वल बनाता है, फिर सीआरटी नुकसान के बाद उम्मीद है कि फिर से सामान्य (रैखिक) के बारे में दिखाई देगा। हालांकि, एलसीडी मॉनिटर रैखिक हैं, और इसलिए गामा को और अधिक की आवश्यकता नहीं है, लेकिन सभी पुरानी पुरानी आरजीबी छवियों के साथ संगतता बनाए रखने के लिए, सभी मानकों में अभी भी एक ही गामा शामिल है। एलसीडी मॉनिटर के लिए केवल डिकोड करना और उसे त्यागना आसान है। और डेटा अभी भी CRT पर काम करता है।

गामा मानव आंख के बारे में कोई रास्ता नहीं है .. इसके अलावा हम सही रैखिक मूल डेटा को देखने की इच्छा रखते हैं। आंख में एक समान उलटा प्रतिक्रिया होती है, जो विशुद्ध रूप से संयोग है, लेकिन मानव आंख कभी भी गामा डेटा नहीं देखती है। यह हमेशा पहले डिकोड किया जाता है (या तो CRT नुकसान, या एक एलसीडी चिप द्वारा), और मानव आंख केवल रैखिक डेटा (आशा) फिर से देखती है। जैसा कि इसने मूल दृश्य को देखा था, मूल दृश्य में कोई गामा की आवश्यकता नहीं थी। आंख को मदद की जरूरत नहीं है। बाहर जाओ और एक पेड़ को देखो। वहां कोई गामा नहीं है। क्या हम वास्तव में कल्पना करते हैं कि हमारी आंख पेड़ को अच्छी तरह से नहीं देख सकती है? :) इसके बारे में थोड़ा और सोचें। मस्तिष्क आंखों की प्रतिक्रिया को डीकोड करता है, और सीआरटी या एलसीडी डेटा एन्कोडिंग को डिकोड करता है। गामा का दावा है कि आंख के बारे में बस पता नहीं है, वे सिर्फ गलत सामान दोहरा रहे हैं जो उन्होंने सुना है। यह सुनना मुश्किल नहीं है, लेकिन यह बहुत गलत है। इन लोगों को यह बताना चाहिए कि मानव आंख कब और कैसे कभी भी देख सकती है जिसकी वे कल्पना करते हैं। यह नहीं हो सकता, इसका कोई मौका नहीं है।

गामा लगभग 8 बिट्स नहीं है। डेटा एनकोडेड है, और फिर डिकोड किया गया है, और उम्मीद है कि समान होने के लिए, इसलिए हम मूल रैखिक दृश्य का एक सटीक प्रजनन देख सकते हैं। किसी भी बिट के होने से पहले गामा को वापस NTSC टीवी (1940) में किया गया था, लेकिन हमारे पास सीआरटी था। :) गामा केवल CRT नुकसान के बारे में है। शुद्ध व सरल। और सीआरटी के दिन में, गामा अत्यंत आवश्यक था।

गामा को जोड़ने से पहले आरजीबी डेटा को सामान्यीकृत किया जाता है (0..1 प्रतिशत मान), आमतौर पर घातांक 1 / 2.2 (लगभग वर्गमूल) के साथ। 18% है (0.18 ^ 1 / 2.2) = 0.46, या हिस्टोग्राम पर 46%, या 0..255 पैमाने पर 117। (लोग छवि 18% 50% भी होनी चाहिए। :) 18% 18% है, लेकिन हम लगभग 50% देखते हैं, केवल इसलिए कि हिस्टोग्राम डेटा गामा एन्कोडेड है।) लेकिन ध्यान दें कि किसी भी घातांक का 0 अभी भी 0 है, और 1 है। कोई भी घातांक अभी भी 1 है, इसलिए कोई गतिशील रेंज वृद्धि नहीं है। और गामा के कारण कोई क्लिपिंग नहीं है, अंतिम बिंदु हिल नहीं सकते। और निश्चित रूप से, क्योंकि डेटा किसी को भी देखने से पहले डिकोड किया जाता है। पूरी बात (सांकेतिक शब्दों में बदलना, फिर डिकोड) सिर्फ एक सेशन नहीं है। आंख में कोई बदलाव नहीं, उम्मीद है। लेकिन फ़ाइलों में, सामान्यीकृत डेटा (जो एक अभिव्यक्ति है) एक घातांक के लिए एक बड़ी संख्या, उज्जवल बन जाता है, सिवाय इसके कि कोई आंख वहां कभी नहीं देख सकती है।

गामा केवल CRT मॉनिटर की प्रतिक्रिया को सही करने के लिए किया जाता है।


1

मेरा मानना ​​है कि हमारी आंखों में यह प्रतिक्रिया वक्र है, लेकिन प्रकाश की मात्रा में अचानक परिवर्तन के लिए यह प्रतिक्रिया, खासकर अगर यह अधिक हो गई, लेकिन एक ही समय में मस्तिष्क डिकोड करता है कि हम उसी (रैखिक धारणा) को बनाए रखने के लिए हमारी परितारिका को संकुचित करके प्रतिक्रिया करते हैं जब तक नई देखने की स्थिति में संक्रमण सुचारू रूप से न हो जाए, तब तक स्थिर देखने की स्थिति में होते हैं।

गामा सुधार अनिवार्य रूप से CRT इलेक्ट्रॉन बंदूक गैर-रैखिकता से आया है जिसे समान उत्पादन (रैखिक उत्पादन) भेजने के लिए अधिक एन्कोडिंग (यानी .45 गामा लागू) की आवश्यकता थी क्योंकि CRT इलेक्ट्रॉन बंदूक की विशेषताओं को संकेत देता है जैसे कि यह डिकोड किया गया था (यानी एक 2.2 मीटर) वक्र लागू)। CRT दिनों में उन्होंने इंटरनेट पर डेटा को देखने और आदान-प्रदान की एकरूपता बनाए रखने के लिए सभी डिजिटल डेटा को एन्कोड किया, इसलिए इमेज फाइल फॉर्मेट मुख्य रूप से sRGB के गामा कर्व के साथ एन्कोड किया गया जो कि .45455 गामा कर्व के समान है) और जिसने CRT गन इशू को रद्द कर दिया। ।

अब जब इंटरनेट पर सभी डेटा एन्कोडेड हो गए थे और उस एलसीडी तकनीक के कारण रैखिक व्यवहार (यानी इनपुट सिग्नल = आउटपुट वैल्यू) के कारण उन्होंने पाया कि सभी डिजिटल डेटा को फिर से डिकोड करने में बहुत देर हो गई है क्योंकि यह एक मानक बन गया है, इसलिए वे एक के साथ आए हैं तार्किक समाधान! और यह फिर से CRT दोष की नक़ल करना है और उन्होंने एक ऐसी चिप के साथ LCD का निर्माण किया जो सिग्नल को डीकोड करता है (यानी 2.2 गामा कर्व लगाता है) एक विरासत प्रणाली के रूप में :) अन्यथा उन्हें इंटरनेट पर मौजूद सभी डेटा को डीकोड करना चाहिए।

तो आँख के इस भ्रम में न फंसें कि गैर-रैखिकता आपके पास निराशाजनक सोच का अंतहीन चक्र होगा।

और यहाँ गामा और हमारी आँखों के साथ संबंध है

कैमरे के सेंसर RAW फाइल्स द्वारा निर्मित रैखिक इमेजरी डेटा, जिसमें डिफ़ॉल्ट गामा = 1.00 (कैमरा सेंसर प्रकृति) है (अर्थात कोई डिकोडिंग या एनकोडिंग = कोई सुधार नहीं) जब मॉनिटर पर रॉ फाइलें "प्रदर्शित" हो जाती हैं तो यह केवल "अंधेरे को देखा" और वहां 10 हो गया। & 12 बिट प्रति चैनल बड़ी फाइलें हैं लेकिन दुख की बात है कि हम इस गहराई को बिल्कुल भी लाभ नहीं पहुंचा रहे हैं क्योंकि हमारी आंखें उज्ज्वल मूल्यों के प्रति संवेदनशील नहीं हैं, क्योंकि यह अंधेरे मूल्यों के प्रति बहुत संवेदनशील है और अंधेरे में किसी भी सूक्ष्म परिवर्तन को अलग कर सकती है (और मैं करूँगा) नीचे समझा जा रहा है)।

क्योंकि छवि को "अंधेरा देखा जाता है" क्योंकि मॉनिटर्स की प्रकृति के कारण चमक का स्तर मोड़ों और अंधेरे मूल्यों की तुलना में अधिक उज्ज्वल मूल्यों पर बर्बाद हो जाता है (क्योंकि मॉनिटर गामा ने नीचे खींचे गए मध्य स्वर को देखा था "तो हमें अंधेरा होने पर अधिक लाभ होगा मूल्यों में एक ही मौका था।

तो उन्होंने पाया कि गामा करेक्शन (पूर्व में कच्चे डेटा को किसी प्रारूप में JPEG जैसे .45455 गामा के साथ एनकोडिंग द्वारा लागू करना) भाग्य द्वारा इसे 8 बिट प्रति चैनल में परिवर्तित करना, जिसका अर्थ है चमक मूल्यों के उचित देखने या प्रदर्शन के अलावा कम फ़ाइल आकार। है (जो कि .45455 गामा पिक्सेल में जलाया जाता है) और अंधेरे और मध्य स्वर फिर से होने से) आंख की प्रकृति के अनुरूप है।

मेरी व्याख्या यह है कि आंखों में रॉड कोशिकाएं हमारे पास रात्रि दृष्टि की क्षमता है और अंधेरे मूल्यों को अलग करने की भी संवेदनशील प्रकृति >> हम लगभग 120 मिलियन रॉड सेल बनाम कोन कोशिकाओं के लिए केवल 6 या मिलियन हैं जो मोनोक्रोमैटिक रंगों और संवेदनशील रंगों के लिए संवेदनशील है। तरंग दैर्ध्य

मुझे लगता है कि यह आई रिस्पॉन्स कर्व नहीं है जो इसके लिए जिम्मेदार है और किसी अन्य तरीके से आई के गामा और मॉनिटर गामा के बीच लिंक करने की कोशिश न करें और अगर मैं गलत हूं तो कृपया मुझे सुधारें :)। मैंने गामा मुद्दों को समझने में संघर्ष किया है ताकि मुझे इसके बारे में मिल गया हो।

यह गामा कारणों और समाधानों के बारे में सबसे अच्छे संदर्भों पर है

http://www.w3.org/TR/PNG-GammaAppendix.html


0

यहां उत्तर का मेरा पहला मसौदा है- समय की अनुमति के रूप में मैं और अधिक विस्तार में आऊंगा, लेकिन मैं ओपी को कुछ उत्तर देना चाहता हूं। टिप्पणियाँ स्वागत से अधिक हैं।

CRTs के बारे में सामान वास्तव में अब लागू नहीं होता है। लेकिन गामा एन्कोडेड छवियों का उपयोग जारी रखने के लिए एक बहुत अच्छा व्यावहारिक कारण है। गामा एन्कोडिंग के उपयोग से एडिट्स जैसे कर्व्स "सामान्य" दिखते हैं क्योंकि आंख प्रकाश के लिए रैखिक रूप से प्रतिक्रिया नहीं करती है - इस पर अधिक के लिए एलएबी स्थान का निर्माण देखें।

एक उदाहरण के लिए, इस स्क्रीनशॉट को देखें:यहाँ छवि विवरण दर्ज करें

बाईं छवि मूल है, मध्य छवि गामा 2.2 में एक प्रति है, और दाईं छवि गामा 1.0 में एक प्रति है। प्रत्येक प्रतियों पर लागू वक्र को देखा जा सकता है। वक्र के आकार को देखते हुए, क्या 2.2 या 1.0 संस्करण वैसा ही दिखता है जैसा आप उम्मीद करेंगे?


0

तथ्य की बात है कि इन दिनों गामा आवश्यक नहीं है, खासकर जब छवि के उच्च बिट अभ्यावेदन में काम कर रहे हों। हालांकि इसका मतलब है कि एक पूर्ण सॉफ्टवेयर अभी तक बहुत से मामलों में फिर से लिखना है - या संक्रमण सहज से दूर है (कहते हैं, परिचित वक्र पूरी तरह से आकार बदलते हैं, जैसा कि श्री ब्लैंकेर्टज़ ने अभी उल्लेख किया है)।


-1

एलसीडी मॉनिटर "रैखिक" हैं, और आज गामा की आवश्यकता नहीं है, लेकिन सीआरटी मॉनिटर नॉनलाइनर हैं, और अभी भी करते हैं। और सभी दुनिया के मौजूदा चित्रों के अभिलेखागार में CRT के लिए गामा है, इसलिए सभी सॉफ्टवेयर को बदलने की तुलना में गामा को जोड़ना जारी रखना बहुत आसान है, और सभी मौजूदा छवियों को अप्रचलित करता है।

मानव आंख बिल्कुल गामा के लिए कोई फायदा नहीं है। आंख गामा के बिना मूल दृश्य को ठीक से देखती है। गामा केवल CRT मॉनिटर के अपेक्षित नुकसान को ठीक करने के लिए है (इसलिए हम मूल दृश्य का पुनरुत्पादन देखते हैं)। एलईडी मॉनिटर केवल गामा को डिकोड करना जानते हैं और इसे छोड़ना चाहते हैं, कोई बड़ी बात नहीं है (क्योंकि मानव आंख को गामा के बिना मूल दृश्य डेटा के एक विश्वासपूर्ण प्रजनन को देखने की उम्मीद है, प्रजनन को समान दिखना चाहिए)। इसे गामा डेटा के रूप में देखना बुरी बात होगी। शुक्र है कि किसी भी गामा डेटा को देखने के लिए मानव आंख के पास शून्य अवसर है। हमें बताने वाली साइटों को गामा की जरूरत है सिर्फ गामा के बारे में नहीं जानते।

हमारे हिस्टोग्राम्स गामा एन्कोडेड हैं, क्योंकि डेटा एन्कोडेड है (ऊपर कारण के लिए), ऊपर जब तक कि यह मानव आंख को दिखाया गया है। हमारे एन्कोडेड डेटा का मिडपॉइंट 50% नहीं है, लेकिन गामा डेटा में लगभग 73% (सफेद संतुलन जैसे कैमरा समायोजन और इसके विपरीत इसे थोड़ा और बदलाव करते हैं)। यदि आप एक छवि को बिल्कुल बंद कर देते हैं, तो 255 बिंदु लगभग 3/4 पैमाने पर शिफ्ट हो जाते हैं, और 50% के पैमाने पर नहीं। एक 18% ग्रे कार्ड लाइनर डेटा में 18% है, लेकिन गामा डेटा में लगभग 46% है। लोग गलत तरीके से मान रहे हैं कि किसी तरह 50% होना चाहिए, यहां तक ​​कि अपने प्रकाश मीटर को कैलिब्रेट करने के बारे में भी सोच सकते हैं। :) लेकिन आंख कभी गामा डेटा नहीं देखती है, यह हमेशा पहले, एक ही रास्ता या दूसरे को डिकोड किया जाता है। उम्मीद है कि आंख हमेशा मूल दृश्य के एक वफादार प्रजनन को देखती है।

लेकिन FWIW, प्रिंटर को गामा परिवर्तन की सबसे अधिक आवश्यकता होती है। मूल्य 2.2 नहीं, बल्कि इससे बहुत दूर नहीं (डॉट गेन आदि के कारण)। Apple अब दुनिया के 2.2 मानकों का पालन करता है, लेकिन हम सभी जानते हैं कि शुरुआती मैक कंप्यूटर गामा 1.8 का उपयोग करते थे। यह मॉनीटर के लिए नहीं था, उन्होंने वही मॉनीटर का उपयोग किया जो विंडोज का उपयोग किया गया (मॉनीटर विनिमेय हैं)। लेकिन Apple उस समय लेजर प्रिंटर बेचता था, और उनके प्रिंटर के लिए गामा 1.8 था। तब मैक वीडियो हार्डवेयर ने इसे 2.2 तक लाने के लिए थोड़ा और जोड़ा, जिसे सीआरटी की जरूरत थी। आज, प्रिंटर को प्राप्त होने वाले 2.2 डेटा से इसे थोड़ा कम करना है, लेकिन उन्हें अभी भी इसकी बहुत आवश्यकता है।

आज, मानक गामा 2.2 है, ताकि सभी दुनिया में मौजूदा आरजीबी डेटा अभी भी संगत है।


1
एलईडी बैकलाइट प्रकार है। गामा सुधार का मुख्य कारण सीआरटी के लिए अनुकूलन नहीं है, भले ही वह कभी भी था।
यूरी पिनहोल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.