क्यों सक्रिय हेडफ़ोन एक फ्लैट आवृत्ति प्रतिक्रिया के बराबर नहीं हैं?


11

कुछ हेडफ़ोन 'सक्रिय' हैं, कप में निर्मित एम्पलीफायरों और एक शक्ति स्रोत (आमतौर पर एएए बैटरी) की आवश्यकता होती है।

फिर मैं कई ऑडीओफाइल्स को आवृत्ति प्रतिक्रिया पर चर्चा करते हुए देखता हूं कि हेडफ़ोन कितने अच्छे हैं, और वे ड्रे बीट्स स्टूडियो जैसे अधिकांश 'सक्रिय' हेडफ़ोन को स्पष्ट रूप से खारिज कर देते हैं।

हालांकि, कुछ ऑप एम्प्स के साथ, यह इनपुट सिग्नल, पूर्व-प्रवर्धित, जैसे कि ड्राइवर की आवृत्ति प्रतिक्रिया के लिए पूरी तरह से सही हो सकता है, को बराबर करना आसान होगा और इस तरह बास (जैसे, या नहीं) एक बेहद सपाट आवृत्ति प्रतिक्रिया का उत्पादन करना आसान होगा बढ़ावा देना या काटना)।

क्या ऐसा करने में कुछ विशेष मुश्किल है?

फ़्रीक्वेंसी रिस्पॉन्स ग्राफ़ http://graphs.headphone.com/graphCompare.php?graphType=0&graphID Isiding=1383&graphID Isiding=193&graphID Isiding=1263&graphid=d=853&scale=20

उदाहरण के लिए, Dre Beats Studio (नीली रेखा) के लिए, शायद EQ सर्किट + 3db @ 750Hz, -5dB @ 1100Hz, +6.5dB@1300Hz, + 5dB @ 1550Hz, -4dB@8.5kHz, और + 14dB प्रदान कर सकता है @ 15kHz, ढलान के साथ 500d से 20kHz से 0db की आवृत्ति प्रतिक्रिया को सबसे अच्छा संरेखित करने के लिए।

जवाबों:


20

जब आप मानक स्टीरियो रिकॉर्डिंग को दोहराते हुए अपने कान में कुछ डालते हैं, तो आप एक फ्लैट आवृत्ति प्रतिक्रिया नहीं चाहते हैं क्योंकि सिर से संबंधित स्थानांतरण फ़ंक्शन जो आम तौर पर एक ध्वनि स्रोत के लिए खेल में आता है बहुत दूर बहुत अलग दिखता है जब स्रोत आपके कान के खिलाफ होता है। ।

मुझे एक पुस्तक से कुछ पैराग्राफ उद्धृत करें :

इलेक्ट्रोकॉस्टिक ट्रांसमिशन श्रृंखला के सभी घटकों में से, हेडफ़ोन सबसे विवादास्पद हैं। अपने वास्तविक अर्थों में उच्च निष्ठा, जिसमें न केवल टिमबर, बल्कि स्थानिक स्थानीयकरण भी शामिल है, हेडफोन के प्रसिद्ध-इन-हेड स्थानीयकरण के कारण लाउडस्पीकर स्टीरियोफ़ोनी के साथ अधिक जुड़ा हुआ है। और फिर भी एक डमी सिर के साथ द्विअक्षीय रिकॉर्डिंग, जो सच्चे-से-जीवन उच्च निष्ठा के लिए सबसे आशाजनक हैं, हेडफोन प्रजनन के लिए नियत हैं। यहां तक ​​कि अपने सुनहरे दिनों में भी उन्हें नियमित रिकॉर्डिंग और प्रसारण में कोई जगह नहीं मिली। उस समय कारण अविश्वसनीय ललाट स्थानीयकरण, लाउडस्पीकर प्रजनन के साथ असंगति, साथ ही साथ उनकी प्रवृत्ति के बारे में असंवेदनशील होना था। चूंकि डिजिटल सिग्नल प्रोसेसिंग (डीएसपी) बीनायुरल हेड-संबंधित ट्रांसफर फ़ंक्शन, एचआरटीएफ का उपयोग करके नियमित रूप से फ़िल्टर कर सकता है, डमी हेड्स की अब आवश्यकता नहीं है।

फिर भी हेडफ़ोन का सबसे आम अनुप्रयोग उन्हें स्टीरियो सिग्नल के साथ खिलाना है जो मूल रूप से लाउडस्पीकर के लिए अभिप्रेत है। यह आदर्श आवृत्ति प्रतिक्रिया का प्रश्न उठाता है। ट्रांसमिशन श्रृंखला (छवि। 14.1) में अन्य उपकरणों के लिए, जैसे कि माइक्रोफोन, एम्पलीफायरों और लाउडस्पीकर, एक सपाट प्रतिक्रिया आमतौर पर डिजाइन उद्देश्य होती है, विशेष मामलों में इस प्रतिक्रिया से आसानी से निश्चित प्रस्थान के साथ। आमतौर पर 1 मीटर की दूरी पर सपाट एसपीएल प्रतिक्रिया उत्पन्न करने के लिए लाउडस्पीकर की आवश्यकता होती है। इस बिंदु पर मुक्त-क्षेत्र SPL, एक कॉन्सर्ट रिकॉर्ड किए जाने के ध्वनि क्षेत्र में माइक्रोफ़ोन स्थान पर SPL को पुन: पेश करता है। एक एलएस के सामने रिकॉर्डिंग सुनकर, श्रोता का सिर एसपीएल को विवर्तन द्वारा रैखिक रूप से विकृत करता है। उसके कानों के संकेत अब सपाट प्रतिक्रिया नहीं दिखाते हैं। तथापि, यह लाउडस्पीकर निर्माता को चिंतित करने की आवश्यकता नहीं है, क्योंकि यह तब भी होता है जब श्रोता लाइव प्रदर्शन में उपस्थित होते थे। दूसरी ओर, हेडफोन निर्माता सीधे इन कान संकेतों का उत्पादन करने से चिंतित है। मानकों में निर्धारित आवश्यकताओं ने मुक्त क्षेत्र के कैलिब्रेटेड हेडफ़ोन को जन्म दिया है, जिसकी आवृत्ति प्रतिक्रिया सामने लाउडस्पीकर के लिए कान के संकेतों को दोहराती है, साथ ही साथ फैल क्षेत्र के अंशांकन, जिसमें उद्देश्य एसपीएल को कान में दोहराने के लिए है सभी दिशाओं से आने वाली ध्वनि के लिए श्रोता। यह माना जाता है कि कई लाउडस्पीकरों में एक फ्लैट वोल्टेज प्रतिक्रिया के साथ प्रत्येक स्रोत के आसन्न स्रोत होते हैं। हेडफोन निर्माता सीधे इन कान संकेतों का उत्पादन करने से चिंतित है। मानकों में निर्धारित आवश्यकताओं ने मुक्त क्षेत्र के कैलिब्रेटेड हेडफ़ोन को जन्म दिया है, जिसकी आवृत्ति प्रतिक्रिया सामने लाउडस्पीकर के लिए कान के संकेतों को दोहराती है, साथ ही साथ फैल क्षेत्र के अंशांकन, जिसमें उद्देश्य एसपीएल को कान में दोहराने के लिए है सभी दिशाओं से आने वाली ध्वनि के लिए श्रोता। यह माना जाता है कि कई लाउडस्पीकरों में एक फ्लैट वोल्टेज प्रतिक्रिया के साथ प्रत्येक स्रोत के आसन्न स्रोत होते हैं। हेडफोन निर्माता सीधे इन कान संकेतों का उत्पादन करने से चिंतित है। मानकों में निर्धारित आवश्यकताओं ने मुक्त क्षेत्र के कैलिब्रेटेड हेडफ़ोन को जन्म दिया है, जिसकी आवृत्ति प्रतिक्रिया सामने लाउडस्पीकर के लिए कान के संकेतों को दोहराती है, साथ ही साथ फैल क्षेत्र के अंशांकन, जिसमें उद्देश्य एसपीएल को कान में दोहराने के लिए है सभी दिशाओं से आने वाली ध्वनि के लिए श्रोता। यह माना जाता है कि कई लाउडस्पीकरों में एक फ्लैट वोल्टेज प्रतिक्रिया के साथ प्रत्येक स्रोत के आसन्न स्रोत होते हैं। जिसमें उद्देश्य सभी दिशाओं से आने वाली ध्वनि के लिए एक श्रोता के कान में एसपीएल को दोहराने के लिए है। यह माना जाता है कि कई लाउडस्पीकरों में एक फ्लैट वोल्टेज प्रतिक्रिया के साथ प्रत्येक स्रोत के आसन्न स्रोत होते हैं। जिसमें उद्देश्य सभी दिशाओं से आने वाली ध्वनि के लिए एक श्रोता के कान में एसपीएल को दोहराने के लिए है। यह माना जाता है कि कई लाउडस्पीकरों में एक फ्लैट वोल्टेज प्रतिक्रिया के साथ प्रत्येक स्रोत के आसन्न स्रोत होते हैं।

यहाँ छवि विवरण दर्ज करें

(ए) मुक्त क्षेत्र की प्रतिक्रिया: किसी भी बेहतर संदर्भ के लिए, विभिन्न अंतरराष्ट्रीय और अन्य मानकों ने उच्च-निष्ठा वाले हेडफ़ोन के लिए निम्नलिखित आवश्यकता निर्धारित की है: एक निरंतर वोल्टेज मोनो सिग्नल इनपुट के लिए आवृत्ति प्रतिक्रिया और कथित जोर की अनुमानित है एनीकोनिक परिस्थितियों में श्रोता के सामने एक सपाट प्रतिक्रिया लाउडस्पीकर। किसी दिए गए फ़्रीक्वेंस में हेडफ़ोन का फ़्री-फ़ील्ड (FF) ट्रांसफ़र फ़ंक्शन (1000 Hz को 0 dB संदर्भ के रूप में चुना गया) dB में उस राशि के बराबर है जिसके द्वारा हेडफ़ोन सिग्नल को समान ज़ोर देने के लिए प्रवर्धित किया जाना है। विषयों की एक न्यूनतम संख्या (आमतौर पर आठ) पर लाभ उठाने की आवश्यकता होती है। [...] चित्र 14.76 एक विशिष्ट सहिष्णुता क्षेत्र दिखाता है।

यहाँ छवि विवरण दर्ज करें

(b) डिफ्यूज़-फील्ड रिस्पॉन्स: 1980 के दशक के दौरान फ्री-फील्ड स्टैंडर्ड रिक्वायरमेंट को दूसरे के साथ बदलने के लिए एक आंदोलन शुरू हुआ, जहां डिफ्यूज़ फील्ड (DF) संदर्भ है। जैसा कि यह निकला, इसने मानकों में अपना रास्ता बना लिया है, लेकिन पुराने को बदलने के बिना। दोनों अब साथ-साथ खड़े हैं। एफएफ संदर्भ के साथ असंतोष मुख्य रूप से 2 kHz चोटी के परिमाण से उत्पन्न हुआ। इसे छवि के रंग के लिए जिम्मेदार ठहराया गया था, क्योंकि ललाट स्थानीयकरण एक मोनो सिग्नल के लिए भी प्राप्त नहीं किया गया है। जिस तरह से श्रवण तंत्र रंगाई को मानता है, उसका वर्णन थाइल के मॉडल मॉडल (चित्र 14.62) द्वारा किया गया है। फैल क्षेत्र और मुक्त क्षेत्र के लिए कान प्रतिक्रियाओं की तुलना अंजीर में दिखाया गया है। 14.77। [...] व्यक्तिपरक सुनने के परीक्षण के बाद से वह है जो मायने रखता है, एफएफ हेडफोन अब तक नियम से अधिक अपवाद हैं। अलग-अलग फ़्रीक्वेंसी प्रतिक्रियाओं का एक तालू व्यक्तिगत वरीयताओं को पूरा करने के लिए उपलब्ध है, और प्रत्येक निर्माता के पास फ़्रीडम फ़्रीज़ से लेकर फ़्री फ़्री फ़ील्ड और उसके बाद तक का अपना हेडफ़ोन दर्शन है।

यहाँ छवि विवरण दर्ज करें

यह एचआरटीएफ अंतर मुद्दा यह भी है कि एंगल्ड ड्राइवर (हेडफ़ोन में) पर्याप्त लोगों को बेहतर लगता है कि सेन्हाइज़र जैसी कंपनियां ऐसे बेचती हैं। हालांकि एंगल्ड ड्राइवर पूरी तरह से स्पीकर की तरह हेडफोन की आवाज नहीं करते हैं।

आवृत्ति प्रतिक्रिया को मापते समय कारखाने या प्रयोगशाला में एक कृत्रिम कान का उपयोग किया जाता है। नीचे एक लैब-लेवल एक है; कारखाने-स्तर वाले थोड़े अधिक सरल होते हैं।

यहाँ छवि विवरण दर्ज करें

मुझे उस HeadRoom साइट द्वारा उपयोग की जाने वाली कार्यप्रणाली भी मिली :

हम आवृत्ति प्रतिक्रिया का परीक्षण कैसे करते हैं: इस परीक्षण को करने के लिए हम एक ही वोल्टेज पर और कभी-कभी बढ़ती आवृत्ति पर 200 टन की श्रृंखला के साथ हेडफ़ोन चलाते हैं। फिर हम प्रत्येक आवृत्ति पर अत्यधिक-विशिष्ट (और pricey!) हेड ध्वनिकी माइक्रोफोन के माध्यम से आउटपुट को मापते हैं। उसके बाद हम एक ऑडियो करेक्शन कर्व लगाते हैं जो सिर से संबंधित ट्रांसफर फ़ंक्शन को हटाता है और डिस्प्ले के लिए डेटा को सटीक रूप से तैयार करता है।

इस्तेमाल किया माइक्रोफोन शायद यह एक है । ऐसा लगता है कि वे वास्तव में सॉफ़्टवेयर के माध्यम से डमी हेड / कानों के हस्तांतरण समारोह को उल्टा करते हैं क्योंकि वे इससे ठीक पहले कहते हैं कि "सैद्धांतिक रूप से, यह ग्राफ़ 0dB पर एक फ्लैट लाइन होना चाहिए।" ... लेकिन मुझे पूरी तरह से यकीन नहीं है कि वे क्या करते हैं। ... क्योंकि इसके बाद वे कहते हैं कि "ए" नेचुरल साउंडिंग "हेडफोन 40Hz और 500Hz के बीच बास (लगभग 3 या 4 dB) में थोड़ा अधिक होना चाहिए।" और "हेडफ़ोन को भी उच्च-स्तर पर रोल-ऑफ करने की आवश्यकता होती है ताकि ड्राइवरों को कान के करीब होने के लिए क्षतिपूर्ति की जा सके, 20kHz पर 8-10dB डाउन के बारे में 1kHz से धीरे से ढलान वाली सपाट रेखा सही है।" एचआरटीएफ को हटाने / हटाने के बारे में उनके पिछले बयान के संबंध में मेरे लिए काफी संकलन नहीं है।

उस हेडरूम उदाहरण में इस्तेमाल किए गए हेडफोन मॉडल (HD800) के लिए निर्माता (सेन्हाइसर) से लोगों को मिले कुछ प्रमाणपत्रों को देखते हुए , ऐसा लगता है कि हेडरूम खुद हेडफोन के लिए बिना किसी अनुमान के सुधार मॉडल के डेटा को प्रदर्शित करता है (जो यह बताता है कि वे अपना विवरण देते हैं) बाद में व्याख्या के सुझाव, इसलिए उनका प्रारंभिक "फ्लैट" सुझाव भ्रामक है), जबकि सेन्हाइज़र डीएफ (फैल क्षेत्र) सुधार का उपयोग करता है ताकि उनके रेखांकन लगभग सपाट दिखें।

यहाँ छवि विवरण दर्ज करें

यहाँ छवि विवरण दर्ज करें

यह सिर्फ एक अनुमान है, हालांकि माप उपकरण (और / या हेडफ़ोन नमूनों के बीच) में अंतर उन अंतरों के लिए अच्छी तरह से हो सकता है क्योंकि वे बड़े नहीं हैं।


वैसे भी, यह सक्रिय और चल रहे अनुसंधान का एक क्षेत्र है (जैसा कि आपने शायद डीएफ के बारे में ऊपर उद्धृत अंतिम वाक्यों से अनुमान लगाया है)। इसमें कुछ एचके शोधकर्ताओं द्वारा किया गया काफी कुछ है; मैं (मुक्त) उनके एईएस कागजात के लिए पहुँच नहीं है, लेकिन कुछ काफी व्यापक सारांश innerfidelity ब्लॉग पर पढ़ा जा सकता 2013 , 2014 के साथ-साथ मुख्य एच लेखक के ब्लॉग, लिंक का अनुसरण शॉन जैतून ; शॉर्टकट के रूप में, उनकी हाल की (नवंबर 2015) प्रस्तुति से कुछ मुफ्त स्लाइड्स मिलीं। यह सामग्री का एक सा है ... मैंने केवल इसे संक्षेप में देखा है, लेकिन विषय लगता है कि डीएफ पर्याप्त नहीं है।

यहां उनकी पहले की प्रस्तुतियों में से एक दिलचस्प स्लाइड है । सबसे पहले, HD800 की पूर्ण आवृत्ति प्रतिक्रिया (12KHz से कम नहीं) और अधिक स्पष्ट रूप से खुलासा उपकरण पर:

यहाँ छवि विवरण दर्ज करें

और शायद ओपी के लिए सबसे अधिक दिलचस्पी, बीट्स की बेसनी ध्वनि सभी आकर्षक नहीं है, हेडफ़ोन के साथ तुलना में दी गई है, जिसकी लागत चार से छह गुना है।

यहाँ छवि विवरण दर्ज करें


मैं आपकी पुस्तक से असहमत हूँ जहाँ यह कहती है "और फिर भी डमी सिर के साथ द्विअर्थी रिकॉर्डिंग, जो कि सच्चे-से-उच्च जीवन निष्ठा के लिए सबसे अधिक आशाजनक हैं, हेडफोन के प्रजनन के लिए किस्मत में हैं। यहां तक ​​कि अपने हेयड में वे रूटीन रिकॉर्डिंग और में कोई स्थान नहीं है। प्रसारण। " हर लाइव टेलीविज़न स्पोर्टिंग ईवेंट, जिस पर मैंने काम किया है, चारों ओर ध्वनि ऑडियो मिक्स में उपयोग के लिए परिवेशी ध्वनि को पकड़ने के लिए "हॉल्फोन" माइक ऐरे का उपयोग करता है। www.holophone.com
ड्वेन रीड

@ ड्वेनराइड: दिलचस्प। हालांकि उस रिकॉर्डिंग हेडफ़ोन का अंतिम लक्ष्य है या यह स्पीकर के साथ 5.1 या 7.1 है? हेडफ़ोन के लिए डाउनटिक्स 5.1 / 7.1 पर टेक भी है, लेकिन मैंने यहां नहीं देखा है।
फिज़ा

खैर, उनके मुख्य पृष्ठ पर विज्ञापित उत्पाद कहते हैं, "एकमात्र पेटेंट माइक्रोफोन है जो विशेष रूप से सराउंड साउंड के असतत 7.1 चैनलों को कैप्चर करने के लिए डिज़ाइन किया गया है" इसलिए स्पीकर या स्टीरियो हेडफ़ोन पर "अविश्वसनीय रूप से आजीवन 3-डी ऑडियो प्लेबैक अनुभव" शायद एक डाउनडिक्सिंग विधि का उपयोग करता है ( 7.1 से) हेडफोन के लिए।
फिज़ा

धन्यवाद, यह जवाब वास्तव में जानकारीपूर्ण रहा है। क्या मैं यह कहने के लिए ठीक से सारांशित कर रहा हूं: हेडफोन आवृत्ति प्रतिक्रिया विरूपण का अनुकरण करने की कोशिश कर रही है जो कि एक ललाट श्रव्य स्रोत से आपके चेहरे के चारों ओर और आपके कान नहरों में फैलता है, और एक पूरी तरह से फ्लैट आवृत्ति प्रतिक्रिया 'अप्राकृतिक' ध्वनि होगी?
एह्रीक

यह अभी भी थोड़ा स्पष्ट नहीं है कि यदि वे उलटा परिवर्तन लागू कर रहे हैं, तो लक्ष्य फिर से पूरे आवृत्ति स्पेक्ट्रम में एक फ्लैट 0dB लाइन होगा, जो सिद्धांत में एक तुल्यकारक (आदर्श पूर्व-प्रवर्धन) के माध्यम से डाला जा सकता है। सक्रिय हेडफ़ोन निर्माता इस पर कोई विचार क्यों नहीं कर रहे हैं कि एक फ्लैट -० डीबी वक्र-हेड-हेड-डिस्टॉर्शन सुधार हो, या शायद उनके साथ समर्पित हेडफ़ोन एम्प बेच रहे हैं जो इस ईक्यू को सेन्हाइज़र ऑर्फ़ियस की तरह लागू करते हैं, लेकिन शायद $ 30k से कम समय में ? वे तब प्रतीत होता है कि आदर्श हेडफ़ोन होंगे ...
एह्रीक

4

सरल उत्तर यह है कि ड्राइवर प्रतिक्रिया को सही करने के लिए op-amps के साथ निर्मित एक फ्लैट आवृत्ति प्रतिक्रिया प्रणाली को पास बैंड में एक बहुत ही गैर-फ्लैट चरण प्रतिक्रिया आवश्यक रूप से होगी। इस गैर-समतलता का अर्थ है कि क्षणिक ध्वनियों के घटक आवृत्तियां असमान रूप से विलंबित हो जाती हैं, जिसके परिणामस्वरूप एक सूक्ष्म क्षणिक विकृति होती है जो उचित ध्वनि घटक मान्यता को रोकती है, जिसका अर्थ है कि कम विशिष्ट ध्वनियों को देखा जा सकता है।

नतीजतन, यह भयानक लगता है। मानो सारी ध्वनि एक फजी बॉल से आ रही हो जो किसी के कान के बिल्कुल बीच में हो।

ऊपर दिए गए उत्तर में HRTF मुद्दा केवल इसका एक हिस्सा है - दूसरा यह है कि एक सादृश्य एनालॉग डोमेन सर्किट में केवल एक कारण समय प्रतिक्रिया हो सकती है, और चालक को ठीक करने के लिए एक acausal फ़िल्टर की आवश्यकता होती है।

यह एक ड्राइवर-मिलान फिनाइट इंपल्स रिस्पांस फिल्टर के साथ डिजिटल रूप से अनुमानित किया जा सकता है, लेकिन इसके लिए एक छोटे से समय की देरी की आवश्यकता होती है जो फिल्मों को बहुत कम आउट-ऑफ-सिंक करने के लिए पर्याप्त है।

और यह अभी भी लगता है कि यह आपके सिर के अंदर से आ रहा है, जब तक कि एचआरटीएफ को भी वापस नहीं जोड़ा जाता है।

तो, यह सब के बाद इतना आसान नहीं है।

एक "पारदर्शी" प्रणाली बनाने के लिए, आपको मानव श्रवण सीमा पर केवल एक फ्लैट पास बैंड की आवश्यकता नहीं है, आपको एक रैखिक चरण की भी आवश्यकता है - एक फ्लैट समूह विलंब साजिश - और यह बताने के लिए कुछ सबूत हैं कि इस रैखिक चरण की आवश्यकता है आश्चर्यजनक रूप से उच्च आवृत्ति तक जारी रखने के लिए ताकि दिशात्मक संकेत खो न जाएं।

प्रयोग द्वारा यह सत्यापित करना आसान है: कुछ ऐसे संगीतों को खोलें, जिन्हें आप साउंड फाइल एडिटर से जानते हैं, जैसे कि ऑडेसिटी या सैंड, और सिर्फ एक चैनल से एक सिंगल 44100 हर्ट्ज सैंपल को डिलीट करें, और दूसरे चैनल को रिजेक्ट करें, ताकि पहला नमूना अब संपादित चैनल के दूसरे भाग के साथ होता है, और इसे वापस खेलता है।

आप बहुत ध्यान देने योग्य अंतर सुनेंगे, भले ही अंतर एक सेकंड के केवल 1/44100 वें समय की देरी हो।

इस पर विचार करें: ध्वनि 340 मिमी / एमएस के बारे में जाती है, इसलिए 20 kHz पर यह प्लस माइनस एक नमूना विलंब या 50 माइक्रोसेकंड की समय त्रुटि है। यह 17 मिमी की ध्वनि यात्रा है, फिर भी आप उस लापता 22.67 माइक्रोसेकंड के अंतर को सुन सकते हैं, जो ध्वनि यात्रा का केवल 7.7 मिमी है।

मानव श्रवण की पूर्ण कट-ऑफ को आम तौर पर लगभग 20 kHz माना जाता है, तो क्या हो रहा है?

इसका उत्तर यह है कि श्रवण परीक्षण परीक्षण स्वर के साथ आयोजित किए जाते हैं, जिसमें अधिकतर एक बार में केवल एक आवृत्ति होती है, परीक्षण के प्रत्येक भाग में काफी लंबे समय तक। लेकिन हमारे आंतरिक कानों में एक शारीरिक संरचना होती है, जो ध्वनि का एक प्रकार का FFT प्रदर्शन करती है, जबकि न्यूरॉन्स को उजागर करते हुए, ताकि विभिन्न पदों पर न्यूरॉन्स अलग-अलग आवृत्तियों पर सहसंबंधित हों।

व्यक्तिगत न्यूरॉन्स केवल इतनी तेजी से फिर से आग लगा सकते हैं, इसलिए कुछ मामलों में कुछ को रखने के लिए एक-के-बाद-एक का उपयोग किया जाता है ... लेकिन यह केवल लगभग 4 kHz या ऐसा करने के लिए काम करता है ... जो कि सही है जहां हमारे स्वर की धारणा समाप्त होती है। अभी तक मस्तिष्क में कुछ भी नहीं है एक न्यूरॉन फायरिंग को रोकने के लिए किसी भी समय यह इतना झुकाव महसूस करता है, इसलिए उच्चतम आवृत्ति क्या मायने रखती है?

मुद्दा यह है कि कानों के बीच का छोटा चरण अंतर बोधगम्य है, लेकिन यह बदलने के बजाय कि हम ध्वनियों की पहचान कैसे करते हैं (उनके स्पेक्ट्रोग्राफिक संरचना द्वारा) यह प्रभावित करता है कि हम उनकी दिशा को कैसे समझते हैं। (जिसे एचआरटीएफ भी बदलता है!) भले ही ऐसा लगता है कि यह हमारी श्रवण सीमा से बाहर "लुढ़का" होना चाहिए।

इसका उत्तर यह है कि -3 डीबी या यहां तक ​​कि -10 डीबी बिंदु अभी भी बहुत कम है - आपको यह सब प्राप्त करने के लिए -80 डीबी बिंदु पर जाने की आवश्यकता है। और अगर आप तेज आवाज के साथ-साथ शांत भी संभालना चाहते हैं, तो आपको -100 डीबी से बेहतर होने की जरूरत है। एक एकल स्वर सुनने का परीक्षण कभी भी देखने की संभावना नहीं है, मोटे तौर पर क्योंकि ऐसी आवृत्तियों केवल "गिनती" होती हैं जब वे एक तेज क्षणिक ध्वनि के हिस्से के रूप में अपने अन्य हार्मोनिक्स के साथ चरण में पहुंचते हैं - इस मामले में उनकी ऊर्जा एक साथ जोड़ती है, एक एकाग्रता के पर्याप्त तक पहुंच जाती है एक तंत्रिका प्रतिक्रिया को ट्रिगर करने के लिए, भले ही अलग-अलग आवृत्ति घटकों के अलगाव में वे गिनती के लिए बहुत छोटे हो सकते हैं।

एक और मुद्दा यह है कि हम लगातार अल्ट्रासोनिक शोर के कई स्रोतों द्वारा बमबारी कर रहे हैं, शायद यह हमारे स्वयं के आंतरिक कानों में टूटे हुए न्यूरॉन्स से, हमारे जीवन में कुछ पूर्व बिंदु पर अत्यधिक ध्वनि स्तर से क्षतिग्रस्त हो। इस तरह के जोर से "स्थानीय" शोर पर एक सुनने वाले परीक्षण के पृथक आउटपुट टोन को समझना मुश्किल होगा!

इसके लिए "पारदर्शी" सिस्टम डिज़ाइन की आवश्यकता होती है ताकि बहुत अधिक कम-पास फ़्रीक्वेंसी का उपयोग किया जा सके ताकि मानव लो-पास के लिए फीका पड़ने के लिए जगह हो (यह स्वयं के चरण मॉड्यूलेशन के साथ है जो आपके मस्तिष्क को सिस्टम से पहले "कैलिब्रेटेड" किया गया है) फेज़ मॉड्यूलेशन, ट्रांज़ेक्टर्स के आकार को बदलना शुरू कर देता है, और उन्हें समय के साथ-साथ ऐसे स्थानांतरित कर देता है कि मस्तिष्क पहचान नहीं पाता कि वे किस ध्वनि से संबंधित हैं।

हेडफ़ोन के साथ बस एक ब्रॉडबैंड ड्राइवर के लिए पर्याप्त बैंडविड्थ के साथ निर्माण करना बहुत आसान है, और अस्थायी विरूपण को रोकने के लिए 'बिना पिए' ड्राइवर की बहुत उच्च प्राकृतिक आवृत्ति प्रतिक्रिया पर भरोसा करते हैं। यह इयरफ़ोन के साथ कहीं बेहतर काम करता है, क्योंकि ड्राइवर का छोटा द्रव्यमान खुद को इस स्थिति में अच्छी तरह से उधार देता है।

चरण-रेखीयता की आवश्यकता का कारण समय-डोमेन आवृत्ति-डोमेन द्वैतता में गहराई से निहित है, यही कारण है कि आप एक शून्य-विलंबित फिल्टर का निर्माण नहीं कर सकते हैं जो किसी भी वास्तविक भौतिक प्रणाली को "पूरी तरह से सही" कर सकता है।

इसका कारण "चरण रैखिकता" है जो मायने रखता है और "चरण सपाटता" नहीं है क्योंकि चरण वक्र का समग्र ढलान कोई फर्क नहीं पड़ता - द्वैतता द्वारा, किसी भी चरण ढलान बस एक निरंतर समय देरी के बराबर है।

हर किसी के बाहरी कान का आकार अलग होता है, और इस तरह एक अलग हस्तांतरण फ़ंक्शन होता है जो थोड़ा अलग आवृत्तियों पर होता है। आपके मस्तिष्क का उपयोग उसके पास होता है, जिसके पास स्वयं के विशिष्ट अनुनाद होते हैं। यदि आप गलत एक का उपयोग करते हैं, तो यह वास्तव में सिर्फ बदतर ध्वनि करेगा, क्योंकि आपके मस्तिष्क को जो सुधार करने के लिए उपयोग किया जाता है वह अब ईयरफोन के हस्तांतरण समारोह में लोगों के अनुरूप नहीं होगा, और आपके पास प्रतिध्वनि रद्द करने की कमी से भी बदतर कुछ होगा - आप दो बार के रूप में कई असंतुलित डंडे / शून्य अपने चरण देरी बंद कर रहे हैं, और पूरी तरह से अपने समूह देरी और घटक का प्रबंधन समय संबंधों तक पहुँचने।

यह बहुत अस्पष्ट लगेगा, और आप रिकॉर्डिंग द्वारा एन्कोडेड स्थानिक इमेजिंग को बाहर करने में सक्षम नहीं होंगे।

यदि आप एक अंधे ए / बी श्रवण परीक्षण करते हैं, तो हर कोई बिना सोचे-समझे हेडफ़ोन का चयन करेगा जो कम से कम समूह में देरी नहीं करता है, ताकि उनका दिमाग खुद को उन में फिर से शामिल कर सके।

और यह वास्तव में क्यों सक्रिय हेडफ़ोन को बराबर करने की कोशिश नहीं है। यह सही होना बहुत मुश्किल है।

यह भी क्यों डिजिटल कमरे में सुधार यह आला है: क्योंकि इसे ठीक से उपयोग करने के लिए लगातार माप की आवश्यकता होती है, जो कि जीना मुश्किल / असंभव है, और जो उपभोक्ता आम तौर पर इसके बारे में जानना नहीं चाहते हैं।

ज्यादातर क्योंकि सुधार के तहत कमरे में ध्वनिक प्रतिध्वनियां, जो कि ज्यादातर बास प्रतिक्रिया का हिस्सा होती हैं, हवा के दबाव, तापमान और आर्द्रता के रूप में थोड़ा परिवर्तन करती रहती हैं, इस प्रकार ध्वनि की गति में थोड़ा बदलाव होता है, इस प्रकार प्रतिध्वनि को बदलने से वे दूर हो जाते हैं। जब माप लिया गया था।


एफ डोमिन में फ़िल्टर करने से चरण विकृति का कारण बनता है। इसे ऑफसेट करने के लिए सभी पास चरण समीकरण का उपयोग किया जा सकता है। डिजिटल सिद्धांत या एनालॉग में अच्छा चरण हो सकता है। इन दिनों डिजिटल बेहतर लचीलापन देता है।
ऑटिस्टिक

आह आपका धन्यवाद। यह स्पष्ट करता है कि यह सक्रिय हेडफ़ोन में क्यों नहीं किया गया है जो एनालॉग सिग्नल (वायर्ड हेडफ़ोन) से गुज़रे हैं। यह प्रतीत होता है कि संभावना को खुला छोड़ देता है, फिर, बिना किसी चरण विरूपण के स्रोत के साथ डिजिटल रूप से (कंप्यूटर या फोन की तरह) या वायरलेस हेडफ़ोन पर डिजिटल रूप से बिना किसी देरी के वास्तविक समय में समायोजित किए जाने वाले स्तरों के लिए; क्या यह अभी भी 'पूरी तरह से सपाट' (एचआरटीएफ) की प्रतिक्रिया के लिए एक व्यवहार्यता के रूप में खुला है?
एह्रीक

नहीं। कुछ देरी होनी चाहिए। अन्यथा आपको सचमुच एक टाइम मशीन की आवश्यकता होती है, क्योंकि बिना किसी देरी के एक वास्तविक (कारण) प्रणाली के चरण को सही करने का एकमात्र तरीका, बिल्कुल उल्टे, विरोधी-कारण समय प्रतिक्रिया के साथ एक फिल्टर का उपयोग करना होगा। और इसका मतलब यह है कि समय पर 0. लैंड होने से पहले सिग्नल का "भविष्य" जानना आवश्यक है। 0.
RGD2

-1

एक दिलचस्प लेख और चर्चा। हमें लगता है कि Nyquist प्रमेय एक नियम है जो हर जगह लागू होता है, और हम तब पता लगाते हैं कि यह नहीं है। आप साइन तरंगों का उपयोग करके मानव श्रवण की सीमा को 20kHz तक मापते हैं, और फिर 44.1 या 48 kHz पर इस विश्वास के साथ नमूना लेते हैं कि आपने वह सब कुछ पकड़ लिया है जो कान सुन सकते हैं। एक नमूना द्वारा एक चैनल को स्थानांतरित करने से महत्वपूर्ण परिवर्तन का कारण बनता है, हालांकि अंतर, अस्थायी रूप से, 20kHz से ऊपर है।

चलती छवियों में, हमें लगता है कि आंख 20 फ्रेम प्रति सेकंड से ऊपर फ्रेम दर के साथ छवियों को एकीकृत करती है। इसलिए फिल्म को 24fps पर शूट किया जाता है और झिलमिलाहट (48 एफपीएस) को कम करने के लिए 2x शटर के साथ वापस खेला जाता है; क्षेत्र के आधार पर टीवी 50 या 60 हर्ट्ज फ्रेम दर है। हम में से कुछ 50 हर्ट्ज फ्रेम दर झिलमिलाहट देख सकते हैं, खासकर अगर हम 60 हर्ट्ज के साथ बड़े हो गए हैं। लेकिन यहां पर यह दिलचस्प है। पिछले कुछ वर्षों में हॉलीवुड प्रोफेशनल एसोसिएशन टेक रिट्रीट और एसएमपीटीई सम्मेलनों में, यह दिखाया गया है कि एक औसत दर्शक गुणवत्ता में महत्वपूर्ण सुधार देखता है जब देशी फ्रेम 60 हर्ट्ज से 120 हर्ट्ज तक बढ़ाया जाता है। इससे भी अधिक आश्चर्य की बात यह है कि समान दर्शकों ने 120 से 240 हर्ट्ज तक फ्रेम दर में वृद्धि करते समय एक समान सुधार देखा। Nyquist हमें बताएगा कि अगर हम 24 पर फ्रेम दर नहीं देख सकते हैं, हमें केवल उन सभी को कैप्चर करने की गारंटी देने के लिए फ्रेम दर को दोगुना करने की आवश्यकता है जो आंखें हल कर सकती हैं; अभी तक हम 10x फ्रेम दर पर हैं और अभी भी ध्यान देने योग्य अंतर देख रहे हैं।

जाहिर है यहां ज्यादा चल रहा है। गति इमेजिंग के मामले में, छवि में गति आवश्यक फ्रेम दर को प्रभावित करती है। और ऑडियो में, मुझे उम्मीद है कि साउंडस्केप की जटिलता और घनत्व आवश्यक ऑडियो रिज़ॉल्यूशन निर्धारित करेगा। उन सभी ध्वनियों को इमेजिंग के लिए आवश्यक अभिव्यक्ति प्रदान करने के लिए आवृत्ति प्रतिक्रिया की तुलना में उनके चरण सुसंगतता पर अधिक निर्भर करता है।


मैं यहां कुछ भी खोजने में विफल हूं जो सवाल का जवाब देता है। नमूना दर और Nyquist नमूना प्रमेय का हेडफ़ोन समतुल्यता के साथ क्या करना है?
पाइप

मनुष्यों में कोई एडीसी नहीं है। मानव श्रवण की दृष्टि कुछ भी "नमूना" नहीं करती है, यह न्यूरॉन्स का उपयोग करती है जो एनालॉग और डिजिटल के बीच एक प्रकार का मिश्रण है और व्यावहारिक रूप से निरंतर है। कान में एक भौतिक कटऑफ है। दृश्य धारणा भी सीमित है कि मस्तिष्क कितनी तेजी से जानकारी को संसाधित कर सकता है।
वोल्टेज स्पाइक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.