सरल उत्तर यह है कि ड्राइवर प्रतिक्रिया को सही करने के लिए op-amps के साथ निर्मित एक फ्लैट आवृत्ति प्रतिक्रिया प्रणाली को पास बैंड में एक बहुत ही गैर-फ्लैट चरण प्रतिक्रिया आवश्यक रूप से होगी। इस गैर-समतलता का अर्थ है कि क्षणिक ध्वनियों के घटक आवृत्तियां असमान रूप से विलंबित हो जाती हैं, जिसके परिणामस्वरूप एक सूक्ष्म क्षणिक विकृति होती है जो उचित ध्वनि घटक मान्यता को रोकती है, जिसका अर्थ है कि कम विशिष्ट ध्वनियों को देखा जा सकता है।
नतीजतन, यह भयानक लगता है। मानो सारी ध्वनि एक फजी बॉल से आ रही हो जो किसी के कान के बिल्कुल बीच में हो।
ऊपर दिए गए उत्तर में HRTF मुद्दा केवल इसका एक हिस्सा है - दूसरा यह है कि एक सादृश्य एनालॉग डोमेन सर्किट में केवल एक कारण समय प्रतिक्रिया हो सकती है, और चालक को ठीक करने के लिए एक acausal फ़िल्टर की आवश्यकता होती है।
यह एक ड्राइवर-मिलान फिनाइट इंपल्स रिस्पांस फिल्टर के साथ डिजिटल रूप से अनुमानित किया जा सकता है, लेकिन इसके लिए एक छोटे से समय की देरी की आवश्यकता होती है जो फिल्मों को बहुत कम आउट-ऑफ-सिंक करने के लिए पर्याप्त है।
और यह अभी भी लगता है कि यह आपके सिर के अंदर से आ रहा है, जब तक कि एचआरटीएफ को भी वापस नहीं जोड़ा जाता है।
तो, यह सब के बाद इतना आसान नहीं है।
एक "पारदर्शी" प्रणाली बनाने के लिए, आपको मानव श्रवण सीमा पर केवल एक फ्लैट पास बैंड की आवश्यकता नहीं है, आपको एक रैखिक चरण की भी आवश्यकता है - एक फ्लैट समूह विलंब साजिश - और यह बताने के लिए कुछ सबूत हैं कि इस रैखिक चरण की आवश्यकता है आश्चर्यजनक रूप से उच्च आवृत्ति तक जारी रखने के लिए ताकि दिशात्मक संकेत खो न जाएं।
प्रयोग द्वारा यह सत्यापित करना आसान है: कुछ ऐसे संगीतों को खोलें, जिन्हें आप साउंड फाइल एडिटर से जानते हैं, जैसे कि ऑडेसिटी या सैंड, और सिर्फ एक चैनल से एक सिंगल 44100 हर्ट्ज सैंपल को डिलीट करें, और दूसरे चैनल को रिजेक्ट करें, ताकि पहला नमूना अब संपादित चैनल के दूसरे भाग के साथ होता है, और इसे वापस खेलता है।
आप बहुत ध्यान देने योग्य अंतर सुनेंगे, भले ही अंतर एक सेकंड के केवल 1/44100 वें समय की देरी हो।
इस पर विचार करें: ध्वनि 340 मिमी / एमएस के बारे में जाती है, इसलिए 20 kHz पर यह प्लस माइनस एक नमूना विलंब या 50 माइक्रोसेकंड की समय त्रुटि है। यह 17 मिमी की ध्वनि यात्रा है, फिर भी आप उस लापता 22.67 माइक्रोसेकंड के अंतर को सुन सकते हैं, जो ध्वनि यात्रा का केवल 7.7 मिमी है।
मानव श्रवण की पूर्ण कट-ऑफ को आम तौर पर लगभग 20 kHz माना जाता है, तो क्या हो रहा है?
इसका उत्तर यह है कि श्रवण परीक्षण परीक्षण स्वर के साथ आयोजित किए जाते हैं, जिसमें अधिकतर एक बार में केवल एक आवृत्ति होती है, परीक्षण के प्रत्येक भाग में काफी लंबे समय तक। लेकिन हमारे आंतरिक कानों में एक शारीरिक संरचना होती है, जो ध्वनि का एक प्रकार का FFT प्रदर्शन करती है, जबकि न्यूरॉन्स को उजागर करते हुए, ताकि विभिन्न पदों पर न्यूरॉन्स अलग-अलग आवृत्तियों पर सहसंबंधित हों।
व्यक्तिगत न्यूरॉन्स केवल इतनी तेजी से फिर से आग लगा सकते हैं, इसलिए कुछ मामलों में कुछ को रखने के लिए एक-के-बाद-एक का उपयोग किया जाता है ... लेकिन यह केवल लगभग 4 kHz या ऐसा करने के लिए काम करता है ... जो कि सही है जहां हमारे स्वर की धारणा समाप्त होती है। अभी तक मस्तिष्क में कुछ भी नहीं है एक न्यूरॉन फायरिंग को रोकने के लिए किसी भी समय यह इतना झुकाव महसूस करता है, इसलिए उच्चतम आवृत्ति क्या मायने रखती है?
मुद्दा यह है कि कानों के बीच का छोटा चरण अंतर बोधगम्य है, लेकिन यह बदलने के बजाय कि हम ध्वनियों की पहचान कैसे करते हैं (उनके स्पेक्ट्रोग्राफिक संरचना द्वारा) यह प्रभावित करता है कि हम उनकी दिशा को कैसे समझते हैं। (जिसे एचआरटीएफ भी बदलता है!) भले ही ऐसा लगता है कि यह हमारी श्रवण सीमा से बाहर "लुढ़का" होना चाहिए।
इसका उत्तर यह है कि -3 डीबी या यहां तक कि -10 डीबी बिंदु अभी भी बहुत कम है - आपको यह सब प्राप्त करने के लिए -80 डीबी बिंदु पर जाने की आवश्यकता है। और अगर आप तेज आवाज के साथ-साथ शांत भी संभालना चाहते हैं, तो आपको -100 डीबी से बेहतर होने की जरूरत है। एक एकल स्वर सुनने का परीक्षण कभी भी देखने की संभावना नहीं है, मोटे तौर पर क्योंकि ऐसी आवृत्तियों केवल "गिनती" होती हैं जब वे एक तेज क्षणिक ध्वनि के हिस्से के रूप में अपने अन्य हार्मोनिक्स के साथ चरण में पहुंचते हैं - इस मामले में उनकी ऊर्जा एक साथ जोड़ती है, एक एकाग्रता के पर्याप्त तक पहुंच जाती है एक तंत्रिका प्रतिक्रिया को ट्रिगर करने के लिए, भले ही अलग-अलग आवृत्ति घटकों के अलगाव में वे गिनती के लिए बहुत छोटे हो सकते हैं।
एक और मुद्दा यह है कि हम लगातार अल्ट्रासोनिक शोर के कई स्रोतों द्वारा बमबारी कर रहे हैं, शायद यह हमारे स्वयं के आंतरिक कानों में टूटे हुए न्यूरॉन्स से, हमारे जीवन में कुछ पूर्व बिंदु पर अत्यधिक ध्वनि स्तर से क्षतिग्रस्त हो। इस तरह के जोर से "स्थानीय" शोर पर एक सुनने वाले परीक्षण के पृथक आउटपुट टोन को समझना मुश्किल होगा!
इसके लिए "पारदर्शी" सिस्टम डिज़ाइन की आवश्यकता होती है ताकि बहुत अधिक कम-पास फ़्रीक्वेंसी का उपयोग किया जा सके ताकि मानव लो-पास के लिए फीका पड़ने के लिए जगह हो (यह स्वयं के चरण मॉड्यूलेशन के साथ है जो आपके मस्तिष्क को सिस्टम से पहले "कैलिब्रेटेड" किया गया है) फेज़ मॉड्यूलेशन, ट्रांज़ेक्टर्स के आकार को बदलना शुरू कर देता है, और उन्हें समय के साथ-साथ ऐसे स्थानांतरित कर देता है कि मस्तिष्क पहचान नहीं पाता कि वे किस ध्वनि से संबंधित हैं।
हेडफ़ोन के साथ बस एक ब्रॉडबैंड ड्राइवर के लिए पर्याप्त बैंडविड्थ के साथ निर्माण करना बहुत आसान है, और अस्थायी विरूपण को रोकने के लिए 'बिना पिए' ड्राइवर की बहुत उच्च प्राकृतिक आवृत्ति प्रतिक्रिया पर भरोसा करते हैं। यह इयरफ़ोन के साथ कहीं बेहतर काम करता है, क्योंकि ड्राइवर का छोटा द्रव्यमान खुद को इस स्थिति में अच्छी तरह से उधार देता है।
चरण-रेखीयता की आवश्यकता का कारण समय-डोमेन आवृत्ति-डोमेन द्वैतता में गहराई से निहित है, यही कारण है कि आप एक शून्य-विलंबित फिल्टर का निर्माण नहीं कर सकते हैं जो किसी भी वास्तविक भौतिक प्रणाली को "पूरी तरह से सही" कर सकता है।
इसका कारण "चरण रैखिकता" है जो मायने रखता है और "चरण सपाटता" नहीं है क्योंकि चरण वक्र का समग्र ढलान कोई फर्क नहीं पड़ता - द्वैतता द्वारा, किसी भी चरण ढलान बस एक निरंतर समय देरी के बराबर है।
हर किसी के बाहरी कान का आकार अलग होता है, और इस तरह एक अलग हस्तांतरण फ़ंक्शन होता है जो थोड़ा अलग आवृत्तियों पर होता है। आपके मस्तिष्क का उपयोग उसके पास होता है, जिसके पास स्वयं के विशिष्ट अनुनाद होते हैं। यदि आप गलत एक का उपयोग करते हैं, तो यह वास्तव में सिर्फ बदतर ध्वनि करेगा, क्योंकि आपके मस्तिष्क को जो सुधार करने के लिए उपयोग किया जाता है वह अब ईयरफोन के हस्तांतरण समारोह में लोगों के अनुरूप नहीं होगा, और आपके पास प्रतिध्वनि रद्द करने की कमी से भी बदतर कुछ होगा - आप दो बार के रूप में कई असंतुलित डंडे / शून्य अपने चरण देरी बंद कर रहे हैं, और पूरी तरह से अपने समूह देरी और घटक का प्रबंधन समय संबंधों तक पहुँचने।
यह बहुत अस्पष्ट लगेगा, और आप रिकॉर्डिंग द्वारा एन्कोडेड स्थानिक इमेजिंग को बाहर करने में सक्षम नहीं होंगे।
यदि आप एक अंधे ए / बी श्रवण परीक्षण करते हैं, तो हर कोई बिना सोचे-समझे हेडफ़ोन का चयन करेगा जो कम से कम समूह में देरी नहीं करता है, ताकि उनका दिमाग खुद को उन में फिर से शामिल कर सके।
और यह वास्तव में क्यों सक्रिय हेडफ़ोन को बराबर करने की कोशिश नहीं है। यह सही होना बहुत मुश्किल है।
यह भी क्यों डिजिटल कमरे में सुधार यह आला है: क्योंकि इसे ठीक से उपयोग करने के लिए लगातार माप की आवश्यकता होती है, जो कि जीना मुश्किल / असंभव है, और जो उपभोक्ता आम तौर पर इसके बारे में जानना नहीं चाहते हैं।
ज्यादातर क्योंकि सुधार के तहत कमरे में ध्वनिक प्रतिध्वनियां, जो कि ज्यादातर बास प्रतिक्रिया का हिस्सा होती हैं, हवा के दबाव, तापमान और आर्द्रता के रूप में थोड़ा परिवर्तन करती रहती हैं, इस प्रकार ध्वनि की गति में थोड़ा बदलाव होता है, इस प्रकार प्रतिध्वनि को बदलने से वे दूर हो जाते हैं। जब माप लिया गया था।