इस सवाल के जवाब के बाद से एक गड़बड़ हो गया है, जिसमें कई बेमानी जानकारी और दूसरों को पूरी तरह से गलतियाँ हैं। यह उत्तर उन समस्याओं को दूर करते हुए इन उत्तरों में जानकारी को सुव्यवस्थित करने का एक प्रयास है।
सबसे महत्वपूर्ण बात, यह ध्यान में रखने योग्य है कि ग्रेगरी का जवाब, वर्तमान में इस सवाल का शीर्ष-वोट वाला उत्तर, -ac 2
स्विच का उपयोग करने से अलग नहीं है - नीचे इस पर और अधिक।
डाउनस्ट्रीमिंग 5.1 चैनल ऑडियो स्ट्रीम टू स्टीरियो -ac 2
FFmpeg, 5.1 ट्रैक से स्टीरियो पर नीचे आने के लिए अंतर्निहित क्षमताओं के साथ आता है, और यह भी समाधान है जो FFmpeg के स्वयं के प्रलेखन की सिफारिश करता है :
नोट: ffmpeg एक डिफ़ॉल्ट डाउन-मिक्स (और अप-मिक्स) सिस्टम को एकीकृत करता है, जिसे -ac
तब तक (फ़िल्टर) पसंद किया जाना चाहिए जब तक कि आपके पास बहुत विशिष्ट आवश्यकताएं न हों।
-ac 2
वापस वाम, वापस ठीक है, सामने वाम, फ्रंट सही और मोर्चा केंद्र - - स्विच स्रोत के 6 चैनल धारा से पहले 5 चैनलों के अनुपात में मिश्रण से काम करता है उत्पादन स्टीरियो धारा के सामने वाम और मोर्चा सही चैनलों में:
जब ऐसा है, तो LFE चैनल से ऑडियो कर ( .1 5.1 में, सबवूफर के लिए आरक्षित है और गहरी, कम आवृत्ति प्रभाव के लिए इस्तेमाल किया) है पूरी तरह से खारिज कर दिया जब इस विकल्प का उपयोग।
दुर्भाग्य से, मेरे परीक्षणों -ac 2
में संगीत और संवाद दोनों के समग्र स्तर के परिणाम मिले जो स्रोत के लिए सबसे अलग थे, जिससे यह डाउनीक्स फॉर्मूला बन गया , जो मेरे द्वारा परीक्षण किए गए सभी फॉर्मूलों में से सबसे खराब आउटपुट देता है, हालाँकि आप इसका परीक्षण कर सकते हैं और पा सकते हैं कि यह आप अपनी आवश्यकताओं के लिए पूरी तरह से पर्याप्त downmix देता है, जो किसी भी अन्य सूत्र का उपयोग करने के मामले में आप के लिए overkill होगा।
इसे ट्रांसकोड -ac 2
किए बिना एक डीटीएस ट्रैक को डाउनमिक्स करने के लिए (अर्थात अपने कोडेक रखने के लिए और उसी को विस्तारित करें):
ffmpeg -i "sourcetrack.dts" -c:a dca -ac 2 "stereotrack.dts"
जैसा कि उनके उत्तर में मेफिस्टो ने कहा है, यदि संवाद और संगीत आपस में एक-दूसरे के बीच अच्छी तरह से संतुलित हैं, लेकिन बस मात्रा में कमी है, तो आप इसकी मात्रा बढ़ाते हुए धारा को नीचे कर सकते हैं:
ffmpeg -i "sourcetrack.dts" -c:a dca -ac 2 -vol 425 "stereotrack.dts"
के लिए -vol
स्विच, स्रोत में 100% मात्रा पूर्णांक मान 256, और एक बड़ा मूल्य का उपयोग करने से इस ऑडियो स्ट्रीम की कुल मात्रा में वृद्धि होगी के बराबर है। हालांकि, ध्यान दें कि बहुत अधिक करने से विकृति या कलाकृतियों का परिणाम हो सकता है, खासकर इसके लाउडर सेक्शन के दौरान।
उदाहरण के लिए, स्टीरियो के लिए एक ऑडियो स्ट्रीम को डाउनस्ट्रीम करने और इसे AC3 कोडेक में ट्रांसकोड करने के लिए:
ffmpeg -i "sourcetrack.dts" -c:a ac3 -ac 2 "stereotrack.ac3"
एक कस्टम मिक्स एल्गोरिथ्म के साथ स्टीरियो में एक 5.1 चैनल ऑडियो स्ट्रीम डाउनडिक्सिंग
यदि आप अधिक उच्च गुणवत्ता वाला डाउनमिक्स चाहते हैं, या आपको अपने आउटपुट में LFE स्ट्रीम को अवश्य शामिल करना चाहिए, तो आप -af
कस्टम मिक्स फॉर्मूला का उपयोग करके ऑडियो को डाउनमिक्स करने के लिए FFmpeg के ऑडियो फ़िल्टर स्विच ( ) का उपयोग कर सकते हैं ।
ACS सूत्र के साथ डाउनमिक्सिंग (ग्रेगरी का जवाब)
इस उत्तर को पोस्ट करने के समय तक, इस प्रश्न का शीर्ष-मतदान उत्तर ग्रेगोरी का था , जो एएफटीएस विनिर्देश से सूत्र डालता है (देखें अनुभाग 7.8.2, डाउनमिक्सिंग टू चैनल में ) एक FFmpeg ऑडियो फ़िल्टर में। यह विनिर्देश विषय पर FFmpeg प्रलेखन द्वारा सीधे जुड़ा हुआ है , यह दर्शाता है कि यह एक ही सूत्र होने की अत्यधिक संभावना है कि FFmpeg अपने -ac 2
स्विच के लिए पहले से ही लागू है । यदि यह सच है, तो ग्रेगरी के जवाब में पूरे सूत्र को टाइप करना -ac 2
स्विच का उपयोग करने से अलग नहीं होगा , और इसलिए समय की बर्बादी होगी।
मैंने दोनों के उपयोग से एक ही इनपुट ऑडियो को फिर से एन्कोडिंग करके -ac 2
और -af
ग्रेगरी के उत्तर से फ़िल्टर का उपयोग करके निश्चित रूप से इसका परीक्षण करने का निर्णय लिया (इस जवाब के लिए इस्तेमाल किए गए सटीक आदेश फुटनोट्स में देखे जा सकते हैं)।
मैंने तब परिणामी आउटपुट फ़ाइलों के आकारों की तुलना की और पाया कि वे बाइट-फॉर-बाइट थे, समान आकार:
अंत में, मैंने दुस्साहस में दो आउटपुट फाइल खोली, और उनकी तरंगों की तुलना करने के लिए पुष्टि की कि वे समान थे (विस्तार करने के लिए क्लिक करें):
इसलिए यह बहुत निर्णायक लगता है कि ग्रेगोरी के जवाब में विस्तृत एटीएससी फॉर्मूला वही है जो पहले से ही एफएफएमपीई द्वारा लागू किया गया है , और इसका उपयोग पूरी तरह से बेमानी है जब यह कुछ भी नहीं -ac 2
करता है, और बहुत अधिक बोझिल कमांड है।
LFE चैनल को छोड़ने के बिना डाउमीक्सिंग (डेव_750 का जवाब)
उत्तर में शामिल कई में से, यह केवल डाउनलिक्स फ़ार्मुलों में से एक है जो LFE चैनल को पूरी तरह से छोड़ने के बजाय आउटपुट स्टीरियो में मिलाता है, और परिणामस्वरूप, वह जो स्रोत से कम से कम ध्वनि सुनिश्चित करता है। खो गया।
कुल मात्रा का स्तर उच्च और पूर्ण करने की तुलना में अधिक है -ac 2
, लेकिन नाइटमॉड डायलॉग डाउनमिक्स की तुलना में अभी भी कम है। हालांकि, नाइटमोड डायलॉग डाउनस्मिक्स की तुलना में संगीत का स्तर स्रोत के बहुत करीब है, और एलएफई ट्रैक को शामिल करने के कारण, आउटपुट का वॉल्यूम बढ़ाते हुए इस डाउनमिक्स फॉर्मूला का उपयोग करते हुए एक आउटपुट स्ट्रीम बना सकते हैं जो अन्य सभी की तुलना में 5.1 स्रोत के बराबर लगता है। सूत्र मैंने परीक्षण किए।
यदि आपके पास क्षमता है, तो मैं आपके ऑडियो डाउन स्ट्रीम और नाइटमॉड डायलॉग डाउनस्मिक्स दोनों का उपयोग करके आपके ऑडियो स्ट्रीम (इन) को एन्कोडिंग करने की सलाह दूंगा, और ध्यान से तुलना करने के लिए कि वे कौन से बेहतर हैं, दोनों की तरंगों की तुलना करें।
इस फॉर्मूले का उपयोग करके स्टीरियो पर 5.1 ट्रैक डाउन करने के लिए और अपने वॉल्यूम स्तर को 425 तक बढ़ाएं (जहां 256 मूल स्रोत के वॉल्यूम स्तर का 100% है):
ffmpeg -i "sourcetrack.dts" -c dca -vol 425 -af "pan=stereo|FL=0.5*FC+0.707*FL+0.707*BL+0.5*LFE|FR=0.5*FC+0.707*FR+0.707*BR+0.5*LFE" "outputstereo.dts"
रॉबर्ट कोलियर के नाइटमॉड डायलॉग (शेन हैरल्सन का जवाब) के साथ डाउनमिक्स करना
डूम 9 मंच पर रॉबर्ट कॉलियर द्वारा निर्मित और उनके उत्तर में शेन हैरेलसन द्वारा प्रस्तुत नाइटमोड संवाद सूत्र, स्विच की तुलना में कहीं अधिक बेहतर परिणाम देता है - अति शांत संवादों के बजाय, यह उन्हें उन स्तरों पर वापस लाता है जो बहुत करीब हैं स्रोत।-ac 2
मिश्रण के रॉबर्ट कोलियर के विवरण से:
Eac3to का उपयोग करके 5.1 से 2.0 तक कई डीटीएस मूवी ट्रैक को परिवर्तित करने के बाद, मैंने बहुत ही शांत संवादों और अत्यधिक संगीत और एक्शन दृश्यों के परिणामस्वरूप डिफ़ॉल्ट eac3to चैनल मैपिंग पाया है। यद्यपि eac3to चैनल डाउनमिक्स गुणांक का वैज्ञानिक आधार है, लेकिन वे अक्सर कम संवाद मात्रा के अभ्यास अभ्यास में अच्छे नहीं लगते हैं। यह प्रीसेट बाएं और दाएं चैनल संगीत के साथ स्पष्ट संवाद की तलाश करने वालों के लिए है जो अभी भी श्रव्य है, लेकिन पृष्ठभूमि में अधिक है।
जैसा कि आप देख सकते हैं - फ्रंट सेंटर (संवाद) अब ठीक से आते हैं और मूल स्तर पर बने रहते हैं - जबकि संगीत और विस्फोट एक पृष्ठभूमि प्रभाव बने रहते हैं और आप पर हावी नहीं होते हैं। यह प्रीसेट आपको वॉल्यूम नॉब के साथ लगातार फील करने की समस्या को हल करता है, जब संवाद सुनने के लिए डीटीएस 5.1 को 2.0 फिल्मों में परिवर्तित किया जाता है। (खासकर रात में फिल्में देखने के लिए जहां आप दूसरों को जगाना नहीं चाहते लेकिन फिर भी संवाद सुनने में सक्षम होना चाहते हैं)।
दुर्भाग्य से, इस डाउनमिक्स फॉर्मूले का संगीत 5.1 स्रोत की तुलना में बहुत कम है (जो कि "नाइटमोड" मिश्रण बनाने के लिए कोलियर के इरादे पर विचार करके डिजाइन द्वारा संभावना थी) और एलएफई ट्रैक के पूर्ण नुकसान के कारण, समग्र आउटपुट ऑडियो नहीं करता है बढ़ाया मात्रा के साथ Dave_750 के सूत्र के रूप में पूर्ण या स्रोत के करीब ध्वनि ।
हालाँकि, अगर किसी कारण से आप धारा के समग्र आयतन को बढ़ाने से बचना चाहते हैं, तो दुःस्वप्न संवाद संभवतः आपका सबसे अच्छा विकल्प होगा - हालाँकि फिर से, मैं आपके ऑडियो स्ट्रीम को दोनों में एन्कोडिंग करने और दोनों के तरंगों की सावधानीपूर्वक तुलना करने की अत्यधिक सलाह दूंगा। ।
FFmpeg में नाइटमॉड डायलॉग फॉर्मूले के साथ डाउनमिक्स करने के लिए:
ffmpeg -i "sourcetrack.dts" -c dca -af "pan=stereo|FL=FC+0.30*FL+0.30*BL|FR=FC+0.30*FR+0.30*BR" "stereotrack.dts"
तारक का जवाब
यह उत्तर केवल शेन हरेलसन के नाइटमोड डायलॉग डाउनमिक्स फॉर्मूले को एक एमकेवी कंटेनर में ऑडियो स्ट्रीम परिवर्तित करने के लिए एक कमांड में देता है। जबकि इस उत्तर में दी गई कमांड इस तरह के ऑडियो स्ट्रीम पर ठीक काम करेगी, स्टैंडअलोन ऑडियो ट्रैक के लिए इसे अपनाने से त्रुटि होगी:
फ़िल्टरिंग और स्ट्रीमकॉपी का एक साथ उपयोग नहीं किया जा सकता है
ऐसा इसलिए होता है क्योंकि ऑडियो कोडक को डाउनमिक्सिंग के दौरान कॉपी नहीं किया जा सकता है - जैसे अन्य सभी बदलाव एफएफएमपीपी आउटपुट स्ट्रीम में करता है, डाउनमैक्स के लिए आवश्यक है कि ट्रैक को लागू किए जाने वाले परिवर्तनों के लिए फिर से एन्कोड किया जाए।
इस कमांड में एक निरर्थक -ac 2
स्विच भी शामिल था जिसे FFmpeg ने अनदेखा कर दिया होगा।
टेस्ट कमांड
इस उत्तर के लिए मैंने जो परीक्षण किए, उनकी विश्वसनीयता प्रदर्शित करने के लिए, नीचे दिए गए सभी आदेश हैं, जिनका उपयोग मैंने प्रत्येक डाउनमिक्स फॉर्मूले का परीक्षण करने के लिए किया था।
-ac 2
विकल्प के लिए उपयोग किया जाने वाला परीक्षण कमांड :
ffmpeg -i "signed16bitPCM.wav" -c pcm_s16le -ac 2 "Audio 1 (-ac 2).wav"
ग्रेगरी के जवाब के लिए इस्तेमाल किया जाने वाला टेस्ट कमांड:
ffmpeg -i "signed16bitPCM.wav" -c pcm_s16le -af "pan=stereo|FL < 1.0*FL + 0.707*FC + 0.707*BL|FR < 1.0*FR + 0.707*FC + 0.707*BR" "Audio 2 (ATSC Algorithm Downmix).wav"
डेव_750 के उत्तर के लिए परीक्षण कमांड का उपयोग किया गया:
ffmpeg -i "signed16bitPCM.wav" -c pcm_s16le -vol 425 -af "pan=stereo|FL=0.5*FC+0.707*FL+0.707*BL+0.5*LFE|FR=0.5*FC+0.707*FR+0.707*BR+0.5*LFE" "Audio 4 (Dave750 Downmix).wav"
शेन हैरेलसन के जवाब के लिए परीक्षण कमांड का इस्तेमाल किया गया:
ffmpeg -i "signed16bitPCM.wav" -c pcm_s16le -af "pan=stereo|FL=FC+0.30*FL+0.30*BL|FR=FC+0.30*FR+0.30*BR" "Audio 3 (Nightmode Dialogue Downmix).wav"