किसी खेल में किसी घटना को देखते हुए, ऑडियो के निर्माण में अधिकतम देरी क्या होती है कि खिलाड़ी ऑडियो को उस घटना के साथ ठीक से जोड़ देगा (और नहीं देख सकता)?
किसी खेल में किसी घटना को देखते हुए, ऑडियो के निर्माण में अधिकतम देरी क्या होती है कि खिलाड़ी ऑडियो को उस घटना के साथ ठीक से जोड़ देगा (और नहीं देख सकता)?
जवाबों:
निम्न परिणाम की गणना लिप सिंक्रोनाइज़ेशन के लिए की जाती है, जिसे "सबसे अधिक ध्यान देने योग्य ए / वी सिंक त्रुटि" माना जाता है ।
विकिपीडिया कहता है
टेलीविजन अनुप्रयोगों के लिए, ऑडियो को 15 मिलीसेकंड से अधिक नहीं वीडियो का नेतृत्व करना चाहिए और ऑडियो को 45 मिलीसेकंड से अधिक नहीं होना चाहिए। फिल्म के लिए, स्वीकार्य होंठ सिंक को किसी भी दिशा में 22 मिलीसेकंड से अधिक नहीं माना जाता है।
द मीडिया एंड एकाउटिक्स परसेप्शन लैब कहती है
प्रयोग के परिणामों ने निर्धारित किया कि 42.32 एमएस के मानक विचलन के साथ / v सिंक पता लगाने के लिए औसत ऑडियो अग्रणी सीमा 185.19 एमएस थी।
ACS का कहना है
पहली नज़र में यह ढीला लगता है: +90 एमएस टू -185 एमएस एक "स्वीकार्यता की खिड़की" के रूप में
तथा
- अंडरटेक करने योग्य -100 एमएस से लेकर एनवाई एमएस तक
- पता लगाने योग्य -125 एमएस और +45 एमएस
- -185 एमएस और +90 एमएस में अस्वीकार्य हो जाता है
(- ध्वनि में देरी, + ध्वनि उन्नत)
समाप्त करने के लिए
परिणाम अब तक एक दूसरे से नहीं हैं। ऐसा लगता है कि अधिकतम स्वीकार्य देरी 150ms के आसपास है, जो 60 फ्रेम प्रति सेकंड पर 9 फ्रेम है।
यह महसूस करना कि, कहना, एक विस्फोट जिसे आप देखते और सुनते हैं, वह एक घटना है, जिसमें अन्य उत्तरों में वर्णित सहनशीलता होगी - ~ 50ms से अधिक नहीं; कुछ लोग अधिक संवेदनशील हो सकते हैं (जैसे संगीतकार), इसलिए मैं 30ms या 60fps पर 2 से अधिक फ्रेम करने का लक्ष्य नहीं रखूंगा।
मेरा मानना है कि कथित दूरी को उन सहिष्णुताओं को प्रभावित करना चाहिए। लोगों को उम्मीद है कि दूर की आवाज़ें थोड़ी देरी से होंगी, क्योंकि वास्तविक जीवन में ध्वनि प्रत्येक पैर की दूरी पर लगभग 1ms है। इसलिए एक ज़ूम आउट आरटीएस गेम 'मैप' पर एक धमाके के लिए साउंड लैग के लिए एक बड़ी सहिष्णुता हो सकती है, जैसे खिलाड़ी एफपीएस में अपनी बंदूक से फायरिंग करता है।
विशेष मामलों, जैसे कि संगीत / रीतम खेल के लिए उचित अनुभव होना, बहुत अधिक सख्त सहिष्णुता की आवश्यकता हो सकती है, 15-20ms या इससे भी कम - उदाहरण के लिए, यदि खिलाड़ी दोनों "इनपुट एक्शन" को सुनता है जैसे कि एक माइक में गाना या एक बैंग करना। प्लास्टिक इंस्ट्रूमेंट, और एक ही घटना के लिए आपके सिस्टम द्वारा उत्पन्न ध्वनि भी, फिर एक 50ms अंतराल अजीब तरह से मिश्रण करने के लिए "मूल" और "खेला" ध्वनियों का कारण होगा।
इसके अलावा, ऑडियो फ़ाइल की शुरुआत और उस ऑडियो फ़ाइल के अंदर "ईवेंट" के बीच के अंतराल को ध्यान में रखें - कई ऑडियो क्लिप में, "ईवेंट" किनारे पर सही नहीं होगा, आपके पास बिजली की आवाज़ हो सकती है स्ट्राइक जहां which स्ट्राइक ’शुरुआत के बाद 200ms की होती है, जो हर किसी के लिए स्पष्ट होगी, और बहुत सारी साउंड फाइलें, यहां तक कि ड्रम-हिट भी, वहां कुछ देरी होगी ।
दृष्टि और श्रवण मानव धारणा में गहराई से जुड़े हुए हैं, और यदि उनमें से एक अपेक्षाकृत दूसरे से टकराता है, तो यह उल्लेखनीय होगा। यह ठीक नहीं है अगर ज्यादातर समय बहुत तेज है लेकिन कभी-कभी 0.2 सेकंड की देरी होती है जबकि कुछ लोड हो रहा है - लोग ऐसी स्थितियों को नोटिस करेंगे। यही कारण है कि ऑडियो को अक्सर एक अलग थ्रेड पर रखा जाता है, अन्य गतिविधियों से अलग किया जाता है और केवल प्रीलोडेड क्लिप को खेला जाना चाहिए।
किसी भी स्थिति में जहां एक खिलाड़ी ध्वनि का कारण बनता है (संगीत खेल, एफपीएस में बंदूकें) बहुत कम देरी की आवश्यकता होगी क्योंकि खिलाड़ी ने उस समय ऐसा करने के लिए एक आवेग भेजा है, इसलिए एक संगीतकार को सुनने के साथ उनके उपकरण में देरी हो रही है, विशेष रूप से जागरूक होगा बहुत छोटे विलंब से। साउंड इंजीनियर "देरी" को बर्बाद करते हुए 5 mec से नीचे रिकॉर्डिंग देरी के बारे में झल्लाहट करते हैं
द अमेरिकन एकेडमी ऑफ ऑडियोलॉजी के जर्नल में कहा गया है कि लोग (सिर्फ संगीतकार नहीं), जब उनकी खुद की आवाज को सुनने में देरी होती है, तो देरी के बारे में पता चलता है कि 3mecec जितना छोटा है, और 10 mSec से अधिक की देरी 90% समय आपत्तिजनक थी।
मनुष्य दिशात्मक जानकारी के लिए अपने कानों के बीच समय की देरी का उपयोग करते हैं, और इस प्रकार 1mSec से नीचे की देरी से जानकारी को संसाधित करने और निकालने में सक्षम होना चाहिए
185.19 एमएस ऊपर उद्धृत अप्रासंगिक है क्योंकि यह एक प्रमुख ध्वनि त्रुटि का जिक्र है, और किसी भी तरह, जो लोगों को स्वीकार्य लगता है जब निष्क्रिय रूप से एक फिल्म देख रहे हैं, सक्रिय रूप से एक खेल में नहीं लगे हुए हैं।
यहां स्वीकृत उत्तर मुख्य रूप से निष्क्रिय रूप से देखने वाले वीडियो में ऑडियो सिंक्रनाइज़ेशन की धारणा पर चर्चा करता है। इन मामलों में, दर्शकों को आसानी से ठीक से पिन नहीं किया जा सकता है जब वीडियो में टेलटैल संकेतों को शामिल करके ऑडियो को खेलना चाहिए। इसका मतलब है कि उनके पास ध्वनि की सीमित प्रत्याशा है।
खेल में दो महत्वपूर्ण मामले हैं जहाँ यह कम प्रत्याशा धारणा धारण नहीं करती है:
जब खिलाड़ी खुद ध्वनि का कारण बनता है (जैसा कि सैमबी बताते हैं), तो उसी समय से वे बटन को दबाने का इरादा बनाते हैं, जब वे ध्वनि को सुनने की उम्मीद करते हैं, तो वे वास्तव में जानते हैं।
जब ध्वनि को आवधिक बीट पर संगीत के खेल या टिक टिक टाइमर / काउंटर के साथ किसी भी चीज़ पर उतरना चाहिए , तो यह ताल खिलाड़ी को अगली ध्वनि और सूचना का अनुमान लगाने की अनुमति देता है, यदि वह समय से बाहर बजता है।
जीडीसी 2013 से इस बात में, मैथ्यू पवाग्यू का तर्क है कि खिलाड़ियों को लगभग 5ms से ऊपर की सिंक्रोनस परिशुद्धता में अंतर महसूस हो सकता है , लिप सिंकिंग से उदाहरणों की तुलना में बहुत कम क्षमा करना सुझाव देगा। अपने लिए इसे सुनने के लिए "टाइम परसेप्शन उदाहरण" और "यूबीसॉफ्ट गेम्स का उदाहरण" अनुभाग देखें। आप सुन सकते हैं कि रेमन ओरिजिन्स मेनू 16 सेकंड (वीडियो फ्रेम) के भीतर सिंक किए जाने पर "लैगी" नहीं लगता, लेकिन जब 5 एमएस के भीतर सिंक किया जाता है तो यह बेहतर और तंग लगता है।
यदि आप इस प्रकार की तंग-लयबद्ध गेमप्ले चाहते हैं, तो इस तरह की सब-फ्रेम परिशुद्धता प्राप्त करने के लिए, पावेगाव निम्न-स्तरीय ऑडियो कॉलबैक का उपयोग करने की वकालत करता है।
उन खेलों के लिए जिन्हें ऑडियो संकेतों पर प्रतिक्रिया करने के लिए एक व्यक्ति की आवश्यकता होती है, प्रत्येक मिलीसेकंड जिसके द्वारा ध्वनि में देरी होती है, उसी कारण व्यक्ति की प्रतिक्रिया में देरी होगी। कोई व्यक्ति जो केवल एक फिल्म या कट-सीन देख रहा है, वह बहुत ज्यादा नोटिस नहीं कर सकता है यदि ऑडियो और वीडियो बिल्कुल सिंक में नहीं हैं, लेकिन यह अक्सर महत्वपूर्ण होता है और कभी-कभी महत्वपूर्ण होता है कि ऑडियो उस चीज के साथ सिंक हो सकता है जो खिलाड़ी से होने की उम्मीद है ।
सिद्धांत रूप में, 50ms से ऊपर सब कुछ ध्यान देने योग्य हो सकता है जब यह चित्रों के साथ जुड़ता है, तो 25ms पर आप एक ध्वनि सुनना शुरू कर सकते हैं और दो अलग-अलग ध्वनियों के रूप में इसकी देरी हो सकती है, इसलिए मैं कहूंगा कि मैं आपको 50ms से कम रहने की सलाह दूंगा और यदि आप यहां तक कि 5ms से 15ms तक कुछ पर रह सकते हैं यह वास्तव में अच्छा होगा।
उम्मीद है इससे आपको मदद मिलेगी!