रैखिक भविष्यवाणी कोडिंग (LPC) के पीछे सिद्धांत


9
  • LPC के पीछे क्या सिद्धांत है?
  • एलपीसी के कुछ कार्यान्वयनों को अन्य संपीड़ित वॉयस एन्कोडिंग योजनाओं की तुलना में ट्रांसमिशन या एन्कोडिंग त्रुटियों को अधिक मात्रा में सहन करने के लिए क्यों कहा गया है ?

  • क्या एलपीसी विधियों का उपयोग कलमन फ़िल्टर विधियों के उपयोग के समान स्मूथिंग या शॉर्ट टर्म "भविष्यवाणी" के लिए भी किया जा सकता है?

  • एलपीसी का उपयोग किन शर्तों या बाधाओं के तहत वैध है?

"क्यों (है) LPC ने कुछ अन्य संपीड़ित वॉयस एन्कोडिंग योजनाओं की तुलना में ट्रांसमिशन या एन्कोडिंग त्रुटियों के लिए अधिक सहिष्णु होना कहा?" यह किसने कहा? मैं LPC को अच्छी तरह से नहीं जानता, लेकिन मुझे लगा कि इसका अतिरेक कम करने के साथ करना होगा, जिसका विपरीत प्रभाव होगा।
एंडोलिथ

यह प्रश्न भ्रामक है क्योंकि यह झूठे आधार पर है। कृपया इसे बंद करें और इसे ठीक करें।
दीपन मेहता

यहां कई प्रश्न और परिसर हैं। आपको लगता है कि कौन से मरम्मत की आवश्यकता है?
हॉटपावर 2

1
बयान Why are(were) certain implementations of LPC said to be more tolerant of transmission or encoding errors quantization than other compressed voice encoding schemes?झूठा है। क्या आप किसी भी संदर्भ का हवाला दे सकते हैं जो विशेष रूप से बताता है कि अन्य पर क्या बेहतर है?
दीपन मेहता

1
यह वास्तव में मेरा सवाल है। मैंने यह कहीं सुना है, लेकिन पता नहीं क्यों यह कहा गया है हो सकता है।
हॉटपावर 2

जवाबों:


14

सबसे पहले, रैखिक भविष्य कहनेवाला कोडिंग (LPC) "ट्रांसमिशन या एन्कोडिंग त्रुटियों के अधिक सहिष्णु है" पूरी तरह से सच नहीं है। जिस रूप में गुणांक प्रेषित होता है, वह एक बड़ा अंतर बनाता है। उदाहरण के लिए, यदि रैखिक भविष्यवाणी गुणांक के लिए हल किया जाता है, तो वे परिमाणीकरण के लिए बहुत संवेदनशील हो सकते हैं, उच्च आदेश IIR फ़िल्टर गुणांक की तरह बहुत अधिक (यह इसलिए है क्योंकि संश्लेषण फ़िल्टर IIR होगा, लेकिन बाद में उस पर अधिक)। हालांकि, अगर वे किसी अन्य रूप में प्रेषित होते हैं, तो इस समस्या को आसानी से कम किया जा सकता है।

एक तरीका प्रतिबिंब गुणांक को स्थानांतरित करना है। यदि आप k-th ऑर्डर लीनियर प्रिडिक्शन फ़िल्टर के लिए पुनरावर्ती रूप से हल करते हैं, तो प्रत्येक चरण में उच्चतम आदेश गुणांक को प्रतिबिंब गुणांक कहा जाता है। सिस्टम को पूरी तरह से चित्रित करने के लिए इनका एक साथ उपयोग किया जा सकता है (जो आसानी से लेविंसन पुनरावृत्ति से देखा जा सकता है)। वास्तव में, आप एक जाली फिल्टर बनाने के लिए उन सभी का एक साथ उपयोग कर सकते हैं। ये फ़िल्टर अक्सर उपयोग किए जाते हैं जब परिमाणीकरण एक चिंता का विषय है, क्योंकि वे कम बिट काउंट के लिए अधिक मजबूत होते हैं। इसके अलावा, अगर इन प्रतिबिंब गुणांक के परिमाण एकता से बंधे हैं, तो आपको एक BIBO स्थिर फ़िल्टर की गारंटी दी जाती है जो LPC के लिए महत्वपूर्ण है जहां फ़िल्टर का उपयोग आपके सिग्नल को संश्लेषित करने के लिए किया जाता है। लाइन स्पेक्ट्रल जोड़े जैसे अन्य तरीके हैं जो अक्सर उपयोग किए जाते हैं, लेकिन फिर भी '

अब, पहले प्रश्न को संबोधित करने के लिए, एलपीसी का सिद्धांत मुखर ट्रैक्ट मॉडलिंग के इर्द-गिर्द घूमता है। अनिवार्य रूप से, हम भाषण को कुछ संरचना के ट्यूब के इनपुट के रूप में वायब्रेटिंग के रूप में प्रसारित कर रहे हैं। आप कुछ संसाधनों की तलाश कर सकते हैं जो इस मॉडल को बाहर निकालने के लिए बहुत अधिक विस्तार में जाते हैं (ट्यूबों की लंबाई, हवा की तीव्रता, संरचना आदि)। ये संसाधन विभिन्न संरचनाओं से सीधे इन संरचनाओं से संबंधित हैं, उदाहरण के लिए विभिन्न उत्तेजनाओं, सफेद शोर का जवाब।

इसलिए जब हम रैखिक भविष्यवाणी गुणांक के लिए हल करते हैं, तो हम गुणांक की तलाश कर रहे हैं जैसे कि अगर हम गुणांक से बनाए गए एक एफआईआर फ़िल्टर में अपने सिग्नल (उदाहरण के लिए आवाज) को इनपुट करते हैं, तो हमें आउटपुट के रूप में सफेद शोर मिलता है। तो सोचिए इसका क्या मतलब है। हम अत्यधिक इनपुट कर रहे हैंसहसंबंधित संकेत, और सफेद शोर अनुक्रम का उत्पादन। तो वास्तव में, हम उस संकेत की सभी रैखिक निर्भरता को हटा रहे हैं। इसे देखने का एक और तरीका है, यह है कि सभी सार्थक जानकारी गुणांक में निहित है जो इस रैखिक निर्भरता को दूर करती है। इसलिए, हम इन गुणांक (या ऊपर के रूप में उनमें से कुछ) को स्थानांतरित कर सकते हैं, और प्राप्त अंत सिग्नल को फिर से बना सकते हैं। यह एक IIR फिल्टर बनाने के लिए रैखिक भविष्य कहनेवाला एफआईआर फिल्टर, और सफेद शोर इनपुट द्वारा किया जाता है। तो संपीड़न इस रैखिक निर्भरता को हटाने, और गुणांक को स्थानांतरित करने से आता है। यही कारण है कि बर्ग विधि को कभी-कभी अधिकतम एन्ट्रापी विधि के रूप में भी संदर्भित किया जाता है, क्योंकि इसका उद्देश्य रैखिक भविष्यवाणी फिल्टर में आउटपुट शोर की "यादृच्छिकता" या सफेदी को अधिकतम करना है। इसे देखने का एक और तरीका है,

आपके अंतिम प्रश्न का उत्तर देने के लिए, मुझे यकीन नहीं है कि आप पूरी तरह से क्या पूछ रहे हैं। LPC, या लीनियर प्रेडिक्टिव कोडिंग संकेत को "संपीड़ित" करने के लिए है, यह मानते हुए कि यह पहले से चर्चा किए गए तरीके से कुशलता से तैयार किया जा सकता है। जैसा कि आप उल्लेख कर चुके हैं, "निश्चित रूप से" छोटी भविष्यवाणी करने के लिए आप निश्चित रूप से रैखिक भविष्यवाणी का उपयोग कर सकते हैं। यह पावर स्पेक्ट्रल घनत्व आकलन के लिए उपयोग किए जाने वाले उच्च रिज़ॉल्यूशन एआर तरीकों के पीछे निहित आधार है। स्वत :संबंध अनुक्रम को पुनरावर्ती रूप से विस्तारित किया जा सकता है, जो सीमित डेटा रिकॉर्ड से लेकर अनंत रूप तक विस्तारित अनुक्रम के सैद्धांतिक आटोक्लेररेशन अनुक्रम के रूप में अनंत है। यही कारण है कि PSD के आकलन के एआर तरीके सिडेलोबा घटना को प्रदर्शित नहीं करते हैं।


1
"एलपीसी का सिद्धांत मुखर तंत्र मॉडलिंग के चारों ओर घूमता है" क्या यह हमेशा सच है? FLAC सामान्य आवाज तरंगों पर LPC का उपयोग करता है, न कि केवल आवाज के लिए।
12:09 पर एंडोलिथ

3
मेरी क्षमायाचना, मैंने मूल रूप से इसे एक शारीरिक मॉडल के रूप में मुखर chords की सादृश्यता के माध्यम से सीखा जो कि जहां से आया था। जैसा कि मैंने कहा, ऐसी जगहें हैं जहाँ वे इस बात को बहुत गहराई से समझते हैं। लेकिन आप सही हैं, जेपीसी जेनेरिक ऑडियो तरंगों के लिए उपयुक्त है। जैसा कि मैंने उल्लेख किया है, यह किसी भी आवेगी स्पेक्ट्रम पर अच्छी तरह से काम करता है। कोरोलरी के रूप में, यह शोर संकेतों पर खराब काम करता है जहां स्पेक्ट्रम कम आवेगी है (इसका कारण यह है कि शोर संकेतों को एआरएमए प्रक्रियाओं के रूप में बेहतर ढंग से मॉडलिंग किया जाता है)।
ब्रायन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.