मेरा सवाल है: पॉलीफोनिक ध्वनि का कौन सा गणितीय मॉडल पॉलीफोनिक ध्वनिक संगीत वाद्ययंत्र के मल्टी-वॉयस-इन-सिंगल-चैनल ऑडियो रिकॉर्डिंग में व्यक्तिगत संगीत नोटों के परिवर्तन (यानी पिच शिफ्टिंग) को संभव बना सकता है? 'पॉलीफोनिक ऑडियो में नोट बदलकर' से मेरा मतलब है कि सेलेनी के मेलोडी सॉफ्टवेयर में तथाकथित ' डायरेक्ट नोट एक्सेस ' फीचर के साथ साउंड को एडिट करना।
विकिपीडिया के अनुसार , मेलोडाइन एक ध्वनिक (और इस प्रकार समयबद्ध रूप से जटिल) वाद्य यंत्र के ऑडियो सिग्नल का उपयोग करने के लिए संगीत वाद्ययंत्र का उपयोग करता है, जो हेनिंग थिएलेमैन ने अपने पेपर में ' अनटंग्लिंग चरण और मोनोफोनिक ध्वनियों में समय ' शीर्षक का वर्णन किया है । मुझे पॉलीफोनिक संगीत वाद्ययंत्र के ऑडियो सिग्नल के मॉडल का कोई संदर्भ नहीं मिल सकता है; के अनुसार यूट्यूब पर एक साक्षात्कार (नीचे लिखित) पीटर Neubacker की, संपादन पॉलीफोनिक ऑडियो से निपटने के लिए Melodyne की सुविधा Thielemann द्वारा वर्णित एक के विपरीत एक दृष्टिकोण की आवश्यकता है।
एक अन्य यूट्यूब क्लिप से एक सुराग यह है कि न्युबैकर का मॉडल केवल एक साधन (यानी केवल पियानो, केवल गिटार, केवल तार, केवल हवाएं, आदि) के ऑडियो रिकॉर्ड के साथ बेहतर काम करता है। एक अन्य सुराग अभी तक एक और क्लिप है जिसमें न केवल एक नोट की पिच को शिफ्ट करने की क्षमता है, बल्कि इसकी (शुरू और समाप्त) समय भी है।
नीचे यूट्यूब वीडियो का ट्रांसक्रिप्ट है जिसमें उल्लेख किया गया है कि 'पॉलीफोनिक सामग्री एक अलग दृष्टिकोण के लिए कॉल करती है' (यदि आपके पास इसे 22:00 बजे से देखने का समय नहीं है)।
यह प्रश्न, जिसमें से मेलोडेन उत्पन्न हुआ: मैं इस तरह से 3 आयामी रूप से एक ध्वनि कैसे प्राप्त कर सकता हूं [हाथ में पत्थर के साथ इशारा करना]? किस माध्यम से, ध्वनि को निरंतर समय पर अपनी निर्भरता से मुक्त किया जा सकता है? यह मूर्तिकला वास्तव में इस से उभरा है ... यह प्लास्टिक का एक टुकड़ा है .... यह सीधे संगीत डेटा से लिया गया था। यह वस्तु है [लुट पर एक नोट लूटना] यह नोट। इसे बाएं से दाएं के रूप में सबसे अच्छा माना जाता है। इस दिशा में समय चलता है [बाएं से दाएं इशारे करना]। और वह आयाम है [अंगुली का विरोध करने वाले अंगूठे के साथ बड़ा और छोटा होना]। यदि मैं इसे चालू करता हूं, तो यह ... किसी भी उदाहरण में इस ध्वनि के समय का प्रतिनिधित्व करता है। आप यहां बहुत स्पष्ट रूप से देख सकते हैं कि एक संरचना [मूर्तिकला के निचले भाग में क्रॉस सेक्शन की ओर इशारा करते हुए] जो कुछ हद तक त्रिकोणीय है; क्योंकि यह इस ध्वनि में है,
चूंकि मेलोडी अभी तक मौजूद नहीं था और मैं बस इस आकार में ध्वनि के अनुवाद के साथ प्रयोग कर रहा था, मैंने लगभग एक वर्ष तक एक ध्वनि के साथ काम किया। ... मैं इस ध्वनि को अंदर और बाहर और हृदय से जानता हूं। यह स्थानीय ध्वनि का अच्छा चित्रण भी प्रदान करता है। मैं न केवल ध्वनि [क्लिक करने वाले माउस] को वापस चला सकता हूं, बल्कि मैं किसी भी बिंदु की ध्वनि भी दर्ज कर सकता हूं, और इसे धीरे-धीरे या जल्दी से आगे बढ़ा सकता हूं। मैं ध्वनि में भी झूम सकता हूं, या आगे और पीछे की ओर बढ़ सकता हूं, इसलिए अगर मैं यहां एक जगह की जांच करता हूं ... तो इसके आसपास जाएं। ... दस साल पहले यह नया था।
हाल ही में dna (डायरेक्ट नोट एक्सेस) को जोड़ा गया था। इसके साथ, मैं पॉलीफोनिक संगीत भी संपादित कर सकता हूं। दूसरे शब्दों में, मैं व्यक्तिगत रूप से नोटों को संपादित कर सकता हूं जो एक साथ लगता है, जैसे कि एक गिटार रिकॉर्डिंग। अगर मैं अब एक छोटा कॉर्ड [स्क्रीन पर पॉली -> अलग नोट्स का चयन] खेलता हूं, तो हम यहां उन 3 नोटों को देखते हैं जिन्हें मैंने अलग-अलग संस्थाओं के रूप में खेला है। चलिए फिर से सुनते हैं [कंप्यूटर माइनर कॉर्ड खेलता है]। और अब, जैसे कि मेरी उंगली को एक उच्च झल्लाहट में ले जाकर, मैं इसे एक नोट उठा सकता हूं [नोट को स्क्रीन पर खींचकर; कंप्यूटर प्रमुख राग बजाता है]। विभाजित ऑडियो के लिए, मैं इस एक नोट को अलग कर सकता हूं, और अब इसे ऊपर या नीचे ले जा सकता हूं, कृपया मुझे किसी भी पिच पर।
इस तरह से जटिल सामग्री के भीतर अलग-अलग टन को अलग करने में पहले कोई सक्षम क्यों नहीं था? मैं ईमानदारी से नहीं जानता। विज्ञान में, प्राकृतिक प्रवृत्ति कुछ सरल से शुरू होती है, उदाहरण के लिए एक साइन लहर, या व्यक्तिगत नोट्स, और विश्लेषण करते हैं कि पहले, केवल यह पता लगाने के लिए कि सामग्री कब अधिक जटिल हो जाती है, या इसकी संपूर्णता में इलाज किया जाना है, जो कि सिस्टम काम नहीं करता है। मेरा दृष्टिकोण अलग है। मैं वास्तव में जटिल संकेतों के साथ शुरू करता हूं, और यह केवल तब होता है जब मैं किसी चीज की विस्तार से जांच करना चाहता हूं कि मैं सरल लोगों पर वापस जाऊं, लेकिन सबसे पहले, मुझे वास्तव में जो हो रहा है उसका समग्र आभास होना चाहिए।
क्या रहस्य शायद इस रोल में निहित है? हेह, यह वास्तव में एक लो रोल है। प्रश्न मूल रूप से पत्थर द्वारा उठाया गया था कि मैं किसी दिए गए ध्वनि को त्रि-आयामी रूप में कैसे अनुवाद कर सकता हूं। यहां, मैंने ध्वनि के व्यक्तियों के नमूने के मूल्यों को व्यवस्थित किया है, यहां एक दो तीन द्वारा इंगित किया गया है और इसलिए, एक सर्पिल में। और यह पता चला है, कि अगर आप [सर्पिल के पार इशारा] के बीच में अंतर करते हैं, तो एक परिदृश्य उभरता है जो ध्वनि में व्यक्तिगत क्रॉस-सेक्शन का प्रतिनिधित्व करता है [मूर्तिकला के पार अनुभाग]।
रोल कितना पुराना है? बारह साल। तो यह विचार मेलोडी की अच्छी तरह से बसंत है, जो हमने आज देखा है ...? हां, लेकिन ध्वनि को समेटने का यह तरीका अब पॉलीफोनिक सामग्रियों के लिए उपयोग नहीं होगा, जो एक अलग दृष्टिकोण के लिए कहता है।