एक FLAC डिकोडेड MP3 से MP3 से बड़ा क्यों है?


13

शीर्षक से अधिक सटीक होने के लिए, मान लें कि मेरे पास एक एमपी 3 फ़ाइल है जो 320 केबीपीएस है। अगर मैं इसे विघटित करता हूं, तो तार्किक रूप से, ऑडियो के प्रत्येक सेकंड में लगभग 320 किलोबाइट को छोड़कर सभी डेटा अनावश्यक डेटा होना चाहिए, संकुचित होने में सक्षम। इसलिए, जब मैं डिकम्प्रेस्ड फ़ाइल को FLAC, या किसी अन्य दोषरहित कोडेक में एन्कोड करता हूं, तो यह इतना बड़ा क्यों है?

एक संबंधित नोट पर, क्या यह एक डिकम्प्रेस्ड वेव से स्रोत एमपी ऑडियो को दोषमुक्त करने के लिए सैद्धांतिक रूप से संभव है? (मुझे पता है कि एमपी अपने आप में हानिपूर्ण है। मैं पूछ रहा हूं कि क्या बिना किसी री-एनकोड के संभव है आगे की नुकसान।)

संपादित करें: मुझे संबंधित प्रश्न, और इसके पीछे तर्क स्पष्ट करें। मान लीजिए कि मेरे पास एक wav है जो एक एमपी 3 फ़ाइल से विघटित था (और मुझे लगता है कि मेरे पास किसी कारण से एमपी 3 नहीं है)। अगर मैं और अधिक गुणवत्ता नहीं खोना चाहता, तो मैं इसे FLAC या किसी अन्य दोषरहित एनकोडर के साथ फिर से एनकोड कर सकता हूं और इसे बनाए रखने के लिए एक बड़ी फाइल प्राप्त कर सकता हूं वही गुणवत्ता। या, मैं इसे फिर से एमपी 3 में एनकोड कर सकता हूं और मूल के समान आकार प्राप्त कर सकता हूं लेकिन अधिक डेटा खो सकता हूं। जाहिर है, इनमें से कोई भी मामला आदर्श नहीं है। मेरे पास मूल आकार या मूल गुणवत्ता हो सकती है, लेकिन दोनों नहीं (मेरा मतलब मूल एमपी की गुणवत्ता है, मूल दोषरहित स्रोत नहीं है)। मेरा सवाल है: क्या हम दोनों मिल सकते हैं? यह सैद्धांतिक रूप से संभव है कि हानिपूर्ण विघटित डेटा से हानिपूर्ण संपीड़ित डेटा को पुनर्प्राप्त करना संभव है, और भी अधिक खोए बिना?

यदि यह संभव है, तो मैं एक दोषरहित संपीड़न एल्गोरिथ्म की कल्पना कर सकता हूं जो कि ऑडियो को FLAC के साथ संपीड़ित करता है। फिर यह पिछले हानिपूर्ण संपीड़न के किसी भी संकेत के लिए ऑडियो को भी स्कैन करता है, और यदि पता चला है, तो यह दोषपूर्ण रूप से मूल हानिपूर्ण फ़ाइल को पुनः प्राप्त करता है। फिर यह जो भी फाइल छोटा है, रखता है।


यहाँ मेरा पसंदीदा गाइड तेजस्वी और ऑडियो एन्कोडिंग है। आनंद लें, यह एक उत्कृष्ट पढ़ा है: mp3.radified.com

2
डिकोडर केवल 320kb को 1411kb तक नहीं देता है, जो कि बेकार बिट्स के साथ होता है, PCM फाइल की बिटरेट बिट-पर-सैंपल वैल्यू, चैनलों की संख्या और सैंपलिंग रेट द्वारा दी जाती है। मानक सीडी ऑडियो के लिए यह (2 चैनल) * (44.1KHz नमूना दर) * (16 बिट्स-प्रति-नमूना) = 1400kbps है।
skelly

सरल, एमपी 3 संकुचित है, FLAC असम्पीडित है। जब आप परिवर्तित करते हैं, तो यह एमपी 3 डेटा को खोल देता है।
Moab

2
यह गलत है। FLAC एक ऑडियो कम्प्रेशन प्रारूप है।
Ryan Thompson

जवाबों:


31

FLAC का कारण समान डेटा के MP3 से बड़ा है क्योंकि वे अलग-अलग तरीके से एन्कोड करते हैं। :) एमपी 3 सिर्फ अवधारणात्मक जानकारी को एन्कोड करता है, जबकि FLAC डेटा के हर एक स्पेक को स्टोर करता है, बस एक अधिक कॉम्पैक्ट प्रारूप में।

  • एक WAV को एक FLAC में बदलना एक BMP को PNG में बदलने जैसा है।
    • वही सटीक पिक्सेल, लेकिन एक छोटे आकार में एक ज़िप फ़ाइल की तरह दोषरहित संकुचित।
  • एक WAV को एक MP3 में बदलना एक BMP को JPEG में बदलने जैसा है।
    • सटीक पिक्सेल संग्रहीत करने के बजाय, यह वास्तव में जनरेट करने के लिए निर्देश संग्रहीत कर रहा है रंग के तरंगों के साथ वर्ग जो मूल की तरह दिखते हैं।

इसी तरह, MP3 सिर्फ रिपल उत्पन्न करने के लिए निर्देश संग्रहीत करता है, जब एक साथ जोड़ा जाता है, तो मूल की तरह ध्वनि। लेकिन सच्चे सिग्नल और उत्पन्न सिग्नल (एरर सिग्नल) के बीच का अंतर यादृच्छिक शोर कलाकृतियों का होता है, जैसे जेपीईजी गुड़ । जब आप इसे FLAC जैसे पूर्णतावादी प्रारूप में संग्रहीत करते हैं, तो इसे उन सभी गुड़ों को संग्रहीत करने की आवश्यकता होती है, और यादृच्छिक शोर दोषरहित रूप से संपीड़ित करने के लिए कठिन होता है, इसलिए यह फ़ाइल के आकार को बढ़ाता है। (वास्तव में यादृच्छिक शोर अतुलनीय है। जब आप किसी फ़ाइल को दोषरहित रूप से संकुचित करते हैं, तो आप निरर्थक दोहराए गए पैटर्न को समाप्त कर देते हैं और इसे यादृच्छिक शोर की तरह देखते हैं।)

मैं शर्त लगाता हूं कि अगर आप जेपीईजी को पीएनजी में परिवर्तित करते हैं, तो आप आकार में उसी तरह की वृद्धि देखेंगे जैसे आप एमपी 3 को एफएसीएसी में परिवर्तित करते समय देखते हैं, क्योंकि पूर्णतावादी दोषरहित कोडेक को हर छोटे दांतेदार और विरूपण साक्ष्य को याद रखने की आवश्यकता होती है जो मूल bmp में नहीं था।

यह उपमा बिल्कुल सही नहीं है, क्योंकि ऑडियो लाइन-आर्ट आरेख की तुलना में फ़ोटो की तरह अधिक है, लेकिन यह विचार को पार करने में मदद करता है:

मूल बीएमपी का आकार: 29 केबी

Blue dots in PNG form

पीएनजी आकार: 629 बी

Blue dots in JPEG form with jaggies

जेपीईजी का आकार: 1.7 केबी

Blue dots with jaggies re-encoded to PNG

JPEG से बनाया गया PNG: 6.2 kB


3
लेकिन निश्चित रूप से एक बार एक फ़ाइल JPG में परिवर्तित हो जाने के बाद, डेटा खो जाता है, और PNG में कनवर्ट करके पुनर्प्राप्त नहीं किया जा सकता है। यदि FLAC / PNG में अधिक डेटा है तो यह काल्पनिक होगा।
pavium

1
हाँ। सार्थक डेटा खो गया है, और गलत डेटा बनाया गया है।
endolith

1
यह स्पष्ट रूप से एंडोलिथ के उदाहरण आरेखों में चित्रित किया गया है।
hplbsh

1
यह एक आश्चर्यजनक पूरी तरह से जवाब है। अच्छी नौकरी!
cowgod

1
तुम सही हो। मुझे नहीं पता कि मैं क्या सोच रहा था।
Kevin Panko

2

जब आप एक एमपी 3 को डिकोड करते हैं, तो चाहे जो भी बिटरेट हो, आपको मानक 1411kbps / 44100Hz 16bit मिलता है (या जो भी स्रोत था) PCM ऑडियो जिसमें हानिपूर्ण एन्कोड प्रक्रिया के सभी ध्यान देने योग्य और ध्यान देने योग्य प्रभाव हैं, यह प्रारूप प्लेबैक के लिए आवश्यक है और एन्कोडिंग / पुनः एन्कोडिंग, किसी भी कोडेक की किसी भी फाइल को आपके कंप्यूटर, एमपी 3 प्लेयर, आदि पर खेलने पर विघटित किया जा रहा है।

FLAC एनकोडर परवाह नहीं करता है अगर यह ऑडियो जो संपीड़ित हो रहा है वह डिकोडेड एमपी 3 या एक ब्रांड की सीडी से आया है, यह केवल ऑडियो डेटा में किसी भी बदलाव के बिना स्रोत फ़ाइल के आकार को कम करेगा, स्रोत की पूरी वसूली संभव बनाता है, एक दोषरहित प्रक्रिया।

एक MP3 से बनी FLAC फाइल बिल्कुल MP3 की तरह ही बजने लगेगी, CD ट्रैक से बनी FLAC फाइल बिलकुल सीडी की तरह आवाज करेगी।


0

भाग दो का उत्तर देने के लिए, यदि आप एमपी 3 से वापस डब्ल्यूएवी में परिवर्तित करते हैं, तो एक दोषरहित एनकोडर चुनें, आप चाहिए आपके द्वारा किए जाने पर एक समान-गुणवत्ता वाली फ़ाइल हो।

के रूप में क्यों FLAC एमपी 3 से बड़ा है, आप इसे और अधिक संकुचित प्रारूपों में से एक ले रहे हैं, इसे डिकम्प्रेस कर रहे हैं, फिर इसे कम-कुशल संपीड़न उपकरण (हालांकि प्लेबैक के उच्च-गुणवत्ता वाले) में पुन: कॉन्फ़िगर कर रहे हैं।

यह पूछने की तरह है कि एक जेपीजी को पीएनजी में परिवर्तित करना इसे बड़ा क्यों बनाता है - आप [आंशिक रूप से] फाइल को डिकम्प्रेस कर रहे हैं, फिर एक दोषरहित तरीके से फिर से तैयार कर रहे हैं। PNG की तरह FLAC, के लिए अनुकूलित नहीं है अंतरिक्ष , लेकिन के लिए गुणवत्ता


FLAC (और PNG) दोषरहित हैं, इसलिए यह कहना कि गुणवत्ता के लिए अनुकूलित किया गया है, इससे कोई मतलब नहीं है।
Joakim Elofsson

3
@ जोकिम: दोषरहित == अधिकतम गुणवत्ता, इसलिए दोषरहित प्रारूप गुणवत्ता के लिए अनुकूलित हैं परिभाषा से
quack quixote

2
यह मेरी बात है, परिभाषा के अनुसार इसलिए कोई अनुकूलन नहीं है। यदि परिभाषा अधिकतम गुणवत्ता है, तो अनुकूलन करने के लिए कुछ भी नहीं है
Joakim Elofsson

0

mp3 एक डिकोडर को बजाने योग्य बनाता है, डिकोडर का परिणाम मूल ट्रैक (आमतौर पर सीडी से) का एक अनुमान है, इसलिए डिकोडर इसे बजाने योग्य बनाने के लिए डेटा जोड़ता है (और यह बकवास डेटा नहीं है)। परिणामी सन्निकटन को मूल ट्रैक के समान बिटरेट मिला। एमपी 3 को डिकोड किए बिना जानकारी कोई मतलब नहीं रखती है, इसलिए इसे किसी और चीज़ में परिवर्तित नहीं किया जा सकता है (जब तक कि बहुत समान एन्कोडिंग नहीं है, जैसे स्टीरियो-एमपी 3X मोनो-एमपी 3 के लिए)। और FLAC और MP3 भी समान नहीं है। जब एक FLAC को डिकोडिग किया जाता है, तो परिणाम FLAC में एन्कोड किए गए ओरिजिनल डेटा का अनुमानित नहीं होता है, लेकिन यह बिल्कुल वैसा ही है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.