क्या यह संभव है?
नहीं।
जब आप सिग्नल प्रोसेसिंग के दृष्टिकोण से संगीत के एक टुकड़े को देखते हैं, तो यह कुछ निश्चित आवृत्तियों के साथ संकेत होता है। मनुष्य मानव भाषण या संगीत से गायन को मनोवैज्ञानिक रूप से फ़िल्टर करने में महान है, लेकिन एक कंप्यूटर ऐसा नहीं कर सकता है।
समस्या यह है कि संगीत और स्वर दोनों को एक साथ मिलाया जाता है, और यह कि मानव आवाज़ (300 हर्ट्ज - 3.4 kHz) की आवृत्तियों को अधिकांश संगीत वाद्ययंत्रों के साथ ओवरलैप किया जाता है (उदाहरण 28 हर्ट्ज से 4.1 kHz तक पियानो)। तो आप कुछ आवृत्तियों को काट नहीं सकते हैं और बदले में केवल स्वर प्राप्त कर सकते हैं। यह सिर्फ संभव नहीं है।
"... लेकिन" मुखर पदच्युत "कार्यक्रम हैं?" आप पूछ सकते हैं।
कुछ मुखर पदच्युत कार्यक्रम इस तथ्य का उपयोग करते हैं कि पॉप गाने आम तौर पर इस तरह से मिश्रित होते हैं कि स्वर बाएं और दाएं चैनलों पर समान रूप से जोर से होते हैं, जिससे वे एक स्टीरियो पैनोरमा में केंद्रित दिखाई देते हैं। यदि आप वह सबकुछ फ़िल्टर करते हैं जो केंद्रित है, तो आप पेंडेड इंस्ट्रूमेंट्स (आमतौर पर गिटार) के साथ छोड़ दिए जाते हैं, लेकिन आप अन्य केंद्रित इंस्ट्रूमेंट जैसे बास ड्रम, बास गिटार, या ड्रम्स ड्रम भी निकाल देंगे।
तो, बस कहा जाता है, भले ही आपको वोकल रिमूवर या ऑडेसिटी जैसे अन्य प्रोग्राम मिलें, यह सिर्फ भद्दा लग सकता है। क्योंकि हर गीत को इस तरह से नहीं मिलाया जाता है, और स्वर पर पुनरावृत्ति प्रभाव स्टीरियो पैनोरमा में भी दिखाई देता है।