दोषरहित ऑडियो का रूपांतरण और (डी) संपीड़न


12

दोषरहित ऑडियो से संबंधित मेरे कुछ प्रश्न हैं। मैं अपने पूरे संगीत संग्रह को दोषरहित .flac पर रिप करने पर विचार कर रहा हूं, लेकिन मैं इसके बारे में कुछ बातें समझना चाहता हूं।

अगर मेरे पास कोई फ़ाइल है जो .flac है, और मैं इसे बनाना चाहता हूं, तो कहना चाहिए, .avav, मैं यह कैसे कर सकता हूं कि कोई गुणवत्ता हानि न हो? अगर मैं इसे कम कर देता हूं, तो मुझे पता है कि मैं गुणवत्ता नहीं खोऊंगा। परिवर्तित कर रहा है .flac .wav के रूप में ही decompressing है?

क्या यह .ape प्रारूप पर भी लागू होता है? मेरे पास कुछ सार्वजनिक डोमेन रिकॉर्डिंग हैं जिन्हें मैंने बलात्कार में डाउनलोड किया है, लेकिन मैं इसे .flac बनाना चाहता हूं। .Flac का उपयोग करना संभव नहीं है। मध्यम व्यक्ति के रूप में .wav का उपयोग करें। मैं यह सुनिश्चित करना चाहता हूं कि किसी भी तरह से थोड़ा भी खोना नहीं है।

इसके अलावा, अगर कोई गाइड है जो दोषरहित दुनिया को स्पष्ट रूप से समझाता है, तो क्या कोई लिंक साझा करने को तैयार होगा? :)

जवाबों:


14

प्रथम:

एक एन्कोडिंग और एक कंटेनर प्रारूप के बीच अंतर को समझें । http://en.wikipedia.org/wiki/Digital_container_format

एक कंटेनर प्रारूप एक डेटा प्रारूप है जो अन्य एन्कोडेड डेटा को "एनकैप्सुलेट" करता है। इसमें अक्सर एन्कोड किए गए डेटा के बारे में "मेटा-जानकारी" होती है, या एन्कोडेड डेटा की कई अलग-अलग धाराओं को संग्रहीत करने का एक तरीका होता है, या ऐसा कुछ।

कोडक द्वारा निर्मित एक एन्कोडिंग, डेटा स्ट्रीम का वास्तविक "मांस" है।

सबसे आम उदाहरण मैं सोच सकता हूं कि "ओग / वोरबिस" प्रारूप है। ऑग कंटेनर प्रारूप है, और वोरबिस एन्कोडिंग है। तो आपके पास एक Ogg- स्वरूपित फ़ाइल है और इसके अंदर ये छोटी बाल्टियाँ हैं जिनमें एन्कोडेड डेटा है। प्रत्येक बाल्टी के भीतर एक वोरबिस-एन्कोडेड डेटा स्ट्रीम है और कुछ नहीं। उदाहरण के लिए बाल्टी पर कलाकार के नाम और गीत के शीर्षक पर मुहर लगाई जा सकती है।

तो वापस टेक के लिए:

  1. यदि आपके पास पहले से ही एक हानिपूर्ण प्रारूप में संगीत है, जैसे कि एमपी 3 या ओग / वोरबिस, इसे दोषरहित प्रारूप में परिवर्तित करना केवल डिस्क स्थान (बहुत अधिक) डिस्क स्थान खाएगा, और नहीं होगा - बिल्कुल नहीं - संगीत की गुणवत्ता में सुधार ऑडियो जो भी हो। पहले से ही खो जाने के बाद आप निष्ठा नहीं बना सकते। जब तक आप CSI नामक कुछ हिट टीवी शो पर Visual Basic में GUI इंटरफ़ेस नहीं लिख रहे हैं, लेकिन यह कल्पना नहीं, वास्तविकता है।

  2. यदि आपके पास अन्य दोषरहित प्रारूपों में संगीत है और आप इसे FLAC में बदलना चाहते हैं, तो आप ऐसा कर सकते हैं।

  3. "WAV" शब्द के चारों ओर फेंकने से सावधान रहें। Wav दोषरहित नहीं है; वास्तव में, WAV विभिन्न संभावित प्रारूपों के लिए सिर्फ एक कंटेनर है। यह उस तरह से AVI की तरह है। अगर यह सिर्फ कच्चा पीसीएम डेटा है, तो आपके पास दोषरहित WAV हो सकता है, लेकिन आप MPEG-1 लेयर III डेटा (हानिपूर्ण) को भी WAV फ़ाइल में एम्बेड कर सकते हैं।

  4. यदि आप डेटा की निष्ठा को कम करते हैं, तो एक दोषरहित प्रारूप से दूसरे में परिवर्तित होने पर डेटा खोना संभव है। उदाहरण के लिए, यदि आप 48000 हर्ट्ज पर एक 16-बिट पीसीएम डेटा स्ट्रीम को 44100 हर्ट्ज पर 8-बिट पीसीएम डेटा स्ट्रीम में परिवर्तित करते हैं, तो आप दो तरह से निष्ठा खो रहे हैं: नमूने 48000 से नीचे केवल 44100 प्रति में विलय किए जा रहे हैं दूसरा (डेटा की हानि के परिणामस्वरूप), और डेटा को 16 प्रति नमूने के बजाय केवल 8 बिट्स में जानकारी फिट करने के लिए डाउन-मिक्स करना होगा, जो गुणवत्ता को नाटकीय रूप से चोट पहुंचाएगा।

प्रत्येक डिजिटल ऑडियो स्ट्रीम, यहां तक ​​कि एक संपीड़ित (दोषपूर्ण या दोषरहित) एनकोडर द्वारा एन्कोड किए गए, निम्नलिखित "नमूना प्रारूप गुण" हैं, जो आवश्यक तत्व हैं जो स्ट्रीम के गुणों का वर्णन करते हैं:

  1. नमूना बिट चौड़ाई और बिट गहराई, यानी 8 बिट, 16 बिट, आदि। बिट चौड़ाई और गहराई सूक्ष्म रूप से अलग हैं, और वहाँ भी छोटे-एंडियन / बिग-एंडियन (जो गुणवत्ता को प्रभावित नहीं करता है) और हस्ताक्षरित या अहस्ताक्षरित (जो भी नहीं करता है) गुणवत्ता को प्रभावित करते हैं, लेकिन यह बताता है कि एनकोडर / डिकोडर डेटा से कैसे निपटता है)। याद रखने की मुख्य बात यह है कि "अधिक बिट्स बेहतर है"। तो 32-बिट 16-बिट से बेहतर है, आदि।

  2. आवृत्ति, जिसे नमूना दर भी कहा जाता है। अधिक बेहतर है क्योंकि आपके पास प्रति सेकंड ऑडियो के "नमूने" अधिक हैं। कल्पना कीजिए कि कार्ड के डेक पर अपनी उंगली को जल्दी से ब्रश करें और कार्ड को धब्बा से देखें - यही डिजिटल ऑडियो अनिवार्य रूप से होता है। प्रत्येक नमूना एक कार्ड है, और यदि आपके पास प्रति सेकंड से अधिक उड़ान है, तो ऑडियो अधिक सहज है। यदि आप केवल प्रति सेकंड 5 कार्ड फ्लिप कर रहे थे, तो आप वास्तव में नोटिस करेंगे, लेकिन अगर आप हजारों कार्ड प्रति सेकंड फ्लिप कर रहे हैं तो यह एक साथ धुंधला हो जाएगा। इसलिए अधिक बेहतर है, क्योंकि यह अधिक प्राकृतिक और वास्तविकता के करीब है, जो एनालॉग और अनन्त रूप से विभाज्य है (अच्छी तरह से, प्लैंक इकाइयों के नीचे लेकिन यह बहस का विषय है और बंद है)।

"दोषरहित" का अर्थ है कि यदि आप इनपुट में उपयोग किए गए आउटपुट में समान या बेहतर नमूना प्रारूप का उपयोग करते हैं, तो आप किसी भी डेटा को नहीं खोएंगे।

इसलिए यदि आप 16 बिट से 32 बिट नमूना प्रारूप में जाते हैं, तो आप डेटा नहीं खोते हैं। लेकिन अगर आप 32 बिट से 16 बिट तक जाते हैं, तो आप डेटा खो देते हैं।

तो आपके सवाल का जवाब कि क्या FLAC का उपयोग करना समझ में आता है, स्रोत डेटा पर निर्भर करता है: यदि आपके पास 64-बिट WAV फाइलें हैं जो मूल रूप से उस नमूना प्रारूप में दर्ज की गई थीं, 192000 हर्ट्ज (उर्फ 192KHz) के साथ, और आप उन्हें "कन्वर्ट" करते हैं। 16-बिट और 44.1 KHz के मानक "FLAC नमूना प्रारूप, आप एक TON डेटा खोने जा रहे हैं। लेकिन अगर आपकी WAV फाइल केवल 22100 नमूनों प्रति सेकंड के साथ 8-बिट है और आप इसे 44 -100 नमूनों के साथ 16-बिट FLAC में परिवर्तित करते हैं, तो आप डेटा खोने नहीं जा रहे हैं। और आप फ़ाइल के आकार को बढ़ाने का अंत भी कर सकते हैं, इस पर निर्भर करता है कि दोषरहित संपीड़न या छोटे नमूना प्रारूप जीतता है या नहीं।

नमूना प्रारूप यह प्रभावित करेगा कि फ़ाइल कितनी जगह लेती है, इसलिए "बड़ी" बिट्स और "तेज" नमूने दर अधिक स्थान पर कब्जा कर लेंगे।

जहाँ तक व्यावहारिक सरोकार और मानव कान: यदि आप वास्तव में उच्च-विश्वस्तता मूल को 16-बिट 44.1KHz FLAC में परिवर्तित करते हैं, तो आप वास्तव में नोटिस नहीं करेंगे। लेकिन यदि आप MP3 को FLAC में परिवर्तित करते हैं, तो न तो आपको कोई सुधार दिखाई देगा। तो आपको यह मूल्यांकन करने की आवश्यकता है कि आपके स्रोत डेटा का नमूना प्रारूप क्या है इससे पहले कि आप यह तय करें कि क्या करना है।

अब जब मैंने आपको यह सब जानकारी प्रदान कर दी है, तो यहां मेरे प्रत्यक्ष और बिंदु-रिक्त, आपके प्रश्नों के शून्य-स्पष्टीकरण उत्तर हैं:

दोषरहित ऑडियो से संबंधित मेरे कुछ प्रश्न हैं। मैं अपने पूरे संगीत संग्रह को दोषरहित .flac पर रिप करने पर विचार कर रहा हूं, लेकिन मैं इसके बारे में कुछ बातें समझना चाहता हूं।

यदि आपका संगीत संग्रह सीडी पर है और आप इसे FLAC में रिप करना चाहते हैं, तो मेरी राय में यह बहुत अच्छा है। सीडी क्वालिटी ऑडियो 44.1 KHz और 16 बिट्स प्रति सैंपल पर होगा। यह एफएलएसी की डिफ़ॉल्ट सेटिंग्स (कम से कम, मैं उपयोग करने वाले एन्कोडर में चूक) के साथ बिल्कुल मेल खाता है। इसलिए आप किसी भी डेटा को नहीं खोएंगे और यह गणितीय रूप से डिकोड होने पर इनपुट डेटा के समान होगा।

अगर मेरे पास कोई फ़ाइल है जो .flac है, और मैं इसे बनाना चाहता हूं, तो कहना चाहिए, .avav, मैं यह कैसे कर सकता हूं कि कोई गुणवत्ता हानि न हो? अगर मैं इसे कम कर देता हूं, तो मुझे पता है कि मैं गुणवत्ता नहीं खोऊंगा। परिवर्तित कर रहा है .flac .wav के रूप में ही decompressing है?

आप इसे इनपुट डेटा की तुलना में एक ही या एक व्यापक नमूना प्रारूप के साथ एक .wav फ़ाइल में परिवर्तित कर सकते हैं और आपको कोई गुणवत्ता नुकसान नहीं होगा।

जब एक मीडिया प्लेयर आपकी flac फाइल में ऑडियो प्ले करता है, तो यह अनिवार्य रूप से उस PCM डेटा को साउंड कार्ड पर भेजने से पहले एक PCM फॉर्मेट में flac डेटा को डिकोड कर रहा होता है। यह इसे उसी डेटा तक विघटित करेगा जो अंदर गया था; इसलिए अगर 16-बिट 44.1 KHz PCM डेटा अंदर चला गया, तो वही होगा जो आपके सामने आएगा, और आपके स्पीकर पर जाएगा।

इस गतिविधि और ऑडियो को WAV फ़ाइल में परिवर्तित करने के बीच एकमात्र अंतर यह है कि, जब आप इसे WAV फ़ाइल में परिवर्तित करते हैं, तो इसे उपयुक्त भराव बिट्स आदि के साथ WAV कंटेनर बनाना पड़ता है, और यह आपको नमूना प्रारूप चुनने की सुविधा भी देता है। WAV फ़ाइल का। लेकिन यह मानते हुए कि नमूना प्रारूप समान है, तो आपकी FLAC और WAV फ़ाइलों के बीच एकमात्र अंतर फ़ाइल का आकार होगा: WAV फाइलें पर्याप्त रूप से बड़ी होंगी।

क्या यह .ape प्रारूप पर भी लागू होता है? मेरे पास कुछ सार्वजनिक डोमेन रिकॉर्डिंग हैं जिन्हें मैंने बलात्कार में डाउनलोड किया है, लेकिन मैं इसे .flac बनाना चाहता हूं। .Flac का उपयोग करना संभव नहीं है। मध्यम व्यक्ति के रूप में .wav का उपयोग करें। मैं यह सुनिश्चित करना चाहता हूं कि किसी भी तरह से थोड़ा भी खोना नहीं है।

नहीं, बिचौलिया के रूप में कुछ पीसीएम प्रारूप का उपयोग किए बिना ऐसा करना संभव नहीं है । लेकिन हाँ, यह है एक WAV फ़ाइल का उपयोग किए बिना यह करने के लिए संभव। अंतर नोट करें। पीसीएम डेटास्ट्रीम। WAV फ़ाइल। यदि अंतर आपके लिए स्पष्ट नहीं है, तो मेरी पोस्ट की शुरुआत को फिर से पढ़ें। यदि आप यह सुनिश्चित करना चाहते हैं कि "थोड़ा भी नहीं" खो गया है, तो आपको अपनी एपीई फाइलों की जांच करने और समझने की आवश्यकता है कि वे किस नमूना प्रारूप में हैं, और सुनिश्चित करें कि आपका FLAC एनकोडर समान सेटिंग्स के लिए एन्कोड करने के लिए सेट है।

आंतरिक रूप से, किसी भी ऑडियो परिवर्तित कार्यक्रम को स्रोत प्रारूप से किसी प्रकार के दोषरहित पीसीएम नमूना प्रारूप में डिकोड किया जा रहा है, और फिर उन पीसीएम नमूनों को ले कर उन्हें गंतव्य प्रारूप में पुन: एन्कोडिंग किया जाता है।

इसके अलावा, अगर कोई गाइड है जो दोषरहित दुनिया को स्पष्ट रूप से समझाता है, तो क्या कोई लिंक साझा करने को तैयार होगा? :)

मेरी राय में, सीखने का सबसे अच्छा तरीका है। यदि आप Gstreamer ढांचे को सीखने के लिए समय लेते हैं, तो इसका उपयोग कैसे करें, और नमूना प्रारूप के विभिन्न ट्यूनबल्स के अर्थ, और एक पाइपलाइन का निर्माण कैसे करें, आप डिजिटल ऑडियो की वास्तव में मजबूत समझ के साथ सामने आएंगे। इसकी जांच - पड़ताल करें। http://gstreamer.freedesktop.org/ आप http://code.entropywave.com/gstreamer-sdk/ (Windows समर्थित है) से Gstreamer SDK हड़प सकते हैं और बिना कुछ संकलित किए बिना gst-launch- 0.50 के साथ प्रयोग कर सकते हैं। स्रोत से

कुछ चौकाने वाली बातें:

gst-inspect-0.10 वोर्बिसेंक gst-inspect-0.10 vorbisdec gst-inspect-0.10 ऑडीकोनवर्ट gst-inspect-0.10 ऑडियोरस्प्लान

फिर कैप, पाइपलाइनों का निर्माण, आदि के बारे में जानें और आप सही तरीके से आगे बढ़ेंगे।

* नोट: मुझे एहसास है कि मैं नहीं समझाता कि पीसीएम क्या है। विकिपीडिया इससे बेहतर काम करता है जितना मैं करता हूँ: http://en.wikipedia.org/wiki/Pulse-code_modulation


वाह, यह अविश्वसनीय रूप से कितना स्पष्ट है और आपने यह सब कैसे स्पष्ट किया। इन चीजों के बारे में पहले कभी नहीं सोचा था, विचार के लिए अच्छा भोजन। जवाब के लिए धन्यवाद - और यह समय आपको यह सब टाइप करने के लिए भी लगा! +1!
रयान मैकक्लेर

आपको हमेशा बिटरेट और नमूना दरों को बरकरार रखने का लक्ष्य रखना चाहिए, क्योंकि दोषरहित आदर्श रूप से समान पीसीएम डेटा का अर्थ है। नमूना दर को दोगुना करने के अलावा किसी भी चीज के लिए अपसमूच कभी भी दोषरहित नहीं होगी (आप समान रूप से शून्य नहीं जोड़ सकते हैं), और डिस्क स्थान को मिटा दें। किसी भी मामले में, कि FLAC के साथ कोई समस्या नहीं होनी चाहिए क्योंकि यह किसी भी PCM बिट रिज़ॉल्यूशन को 4 से 32 बिट प्रति सैंपल, 1 हर्ट्ज वेतन वृद्धि में 1 हर्ट्ज से 655,350 हर्ट्ज तक की किसी भी सैंपलिंग दर और 1 से किसी भी चैनल की संख्या को संभाल सकता है। 8 ( en.wikipedia.org/wiki/FLAC#Design )
mtone

WAV में हमेशा PCM होता है। यह cd क्वालिटी का PCM नहीं हो सकता है (लेकिन व्यावहारिक रूप से कहें तो, आप आम तौर पर यह मान सकते हैं क्योंकि यह लगभग हमेशा ही होता है), लेकिन यह PCM होगा, कुछ और नहीं जैसे mpeg 3 लेयर 2.
psusi

@psusi: क्षमा करें, लेकिन आप गलत हैं। कृपया WAV पर विकिपीडिया लेख पढ़ें: en.wikipedia.org/wiki/WAV । यदि आप चाहें, तो मैं एक WAV फ़ाइल को एमपी 3 ऑडियो युक्त लिंक पोस्ट कर सकता हूं। WAV फ़ाइलों के बारे में ध्यान रखने वाली बात यह है कि वे सिर्फ एक RIFF फ़ाइल हैं, और एक RIFF फ़ाइल मीडिया कंटेनर प्रारूप का एक काफी आदिम संशोधन है। लेकिन अपने मूल उद्देश्य में कम से कम, यह ओग या मैट्रोस्का से बिल्कुल अलग नहीं है, केवल ऑडियो और वीडियो का समर्थन करने से अलग है। संपादित करें: मुझे एक wav / mp3 फ़ाइल बनाने की ज़रूरत नहीं है; वाह! वास्तव में यह विकिपीडिया से जुड़ा हुआ है! nch.com.au/acm/8kmp316.wav
allquixotic

इस उत्तर में कुछ गलतियाँ हैं। "आवृत्ति, जिसे नमूना दर के रूप में भी जाना जाता है। अधिक बेहतर है क्योंकि आपके पास प्रति सेकंड ऑडियो के" नमूने "अधिक हैं।" - यह नहीं है कि नमूना दरें कैसे काम करती हैं। यदि थोड़ी गहराई तक शामिल नहीं किया गया था, तो 48khz नमूना दर के साथ डेटा 24khz तक के सिग्नल को दोषरहित रूप से प्रस्तुत कर सकता है, और अधिक नमूने जोड़ने से वह परिवर्तित नहीं होगा। अधिक नमूने केवल प्रभाव डालते हैं कि आप किस आवृत्ति का प्रतिनिधित्व कर सकते हैं। 44.1khz से 48khz पर परिवर्तित करना भी सख्ती से दोषरहित नहीं है, भले ही प्रस्तुत त्रुटि पागलपन से छोटी हो।
कुक्यह्यूर

1

मुझे एलक्विवोटिक के बयान से असहमत होना होगा।

यदि आपके पास पहले से ही एक हानिरहित प्रारूप में संगीत है, जैसे कि एमपी 3 या ओग / वोरबिस, इसे दोषरहित प्रारूप में परिवर्तित करना केवल डिस्क स्थान (बहुत अधिक) डिस्क स्थान खाएगा, और नहीं होगा - बिल्कुल नहीं - संगीत की गुणवत्ता में सुधार ऑडियो जो भी हो। पहले से ही खो जाने के बाद आप निष्ठा नहीं बना सकते। जब तक आप CSI नामक कुछ हिट टीवी शो पर Visual Basic में GUI इंटरफ़ेस नहीं लिख रहे हैं, लेकिन यह कल्पना नहीं, वास्तविकता है।

आपके पास ऑडियो इंजीनियरिंग के ज्ञान के टुकड़े और लोगों को झूठे बयान के साथ खिलाने की कमी है।

  1. ओग और वोरबिस दोनों में कंटेनर हैं जो मूल तरंग डेटा जानकारी को बचाते हैं, और इसे उस डेटा के साथ दोषरहित में परिवर्तित किया जा सकता है। कृपया पर्याप्त Google करें।

  2. दोषरहित रूपांतरण के लिए भी निम्न-गुणवत्ता वाला एमपी 3 ध्वनि सुधार का एक बहुत कुछ बनाता है, यह मूल रूप में बिल्कुल सही नहीं है, लेकिन इसे गतिशीलता और आसानी से चक्कर के साथ तय किया जा सकता है। https://www.izotope.com/en/products/master-and-deliver/ozone.html/OzoneDitheringGuide.pdf

ऑडियो 10100110101001 डेटा नहीं है इसलिए छोटे फ़ाइल आकार का मतलब यह नहीं है कि यह गुणवत्ता खो गया है। आप दशकों पहले 128kbps से 320kbps तक के अनुभव के साथ हो सकते हैं और लगता है कि 128kbps से दोषरहित होना असंभव है। कृपया अपने आप को इस सरल कार्य का परीक्षण करें और इसे महसूस करें।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.