मैं दो या दो से अधिक पीसीएम ऑडियो चैनलों (जैसे रिकॉर्ड किए गए नमूनों) को एक ध्वनिक-वफादार तरीके से डिजिटल रूप से मिश्रण करना पसंद करता हूं, अधिमानतः निकट-वास्तविक समय में (मतलब बहुत कम या कोई तिरछा-आगे)।
ऐसा करने का शारीरिक रूप से "सही" तरीका नमूनों का योग है। हालाँकि जब आप दो मनमाने नमूने जोड़ते हैं, तो परिणामस्वरूप मूल्य अधिकतम मूल्य से दोगुना तक हो सकता है।
उदाहरण के लिए, यदि आपके नमूने 16-बिट मान हैं, तो परिणाम 65536 * 2 तक होगा। इससे क्लिपिंग निकल जाती है।
यहां भोला समाधान एन द्वारा विभाजित करना है, जहां एन चैनलों की संख्या मिश्रित है। हालांकि, इसके परिणामस्वरूप प्रत्येक नमूने में 1 / Nth जोर से होता है, जो पूरी तरह से अवास्तविक है। वास्तविक दुनिया में, जब दो उपकरण एक साथ बजते हैं, तो प्रत्येक उपकरण आधा नहीं बनता है।
चारों ओर पढ़ने से, मिश्रण करने की एक सामान्य विधि है: परिणाम = ए + बी - एबी, जहां ए और बी दो सामान्यीकृत नमूने मिश्रित होते हैं, और एबी यह सुनिश्चित करने के लिए एक शब्द है कि लाउड ध्वनियां तेजी से "सॉफ्ट-क्लिप्ड" हैं।
हालांकि, यह संकेत की विकृति का परिचय देता है। क्या उच्च-स्तरीय ऑडियो संश्लेषण में विरूपण का यह स्तर स्वीकार्य है?
इस समस्या को हल करने के लिए और क्या तरीके हैं? मुझे कुशल कम-गुणवत्ता वाले एल्गोरिदम के साथ-साथ कम-कुशल उच्च-गुणवत्ता वाले एल्गोरिदम में दिलचस्पी है।
मैं डिजिटल संगीत संश्लेषण के संदर्भ में अपना प्रश्न पूछ रहा हूं, एक साथ कई इंस्ट्रूमेंट ट्रैक्स को मिलाने के उद्देश्य से। पटरियों को संश्लेषित किया जा सकता है ऑडियो, पूर्व दर्ज नमूने, या वास्तविक समय माइक्रोफोन इनपुट।