मैं एक गायन खेल को लागू करने की कोशिश कर रहा हूं जो कच्चे माइक इनपुट की घोषणा करेगा और खिलाड़ी को बताएगा कि वह कितना अच्छा गा रहा है। जिसे वास्तविक समय में करने की जरूरत है।
मैं एक ही सवाल पूछने वाले बहुत सारे थ्रेड्स पर आया हूं, लेकिन मैं अभी भी इसके साथ नहीं किया गया हूं, शायद क्षेत्र और उथले गणित की पृष्ठभूमि में मेरे अनुभव की कमी के कारण। मैंने DSPDimension वेबसाइट पिच शिफ्ट के लेख के आधार पर एक एल्गोरिथ्म लागू किया है: http://www.dspdimension.com/admin/pitch-shifting-use-the-ft/
मैं सही आवृत्ति और परिमाण को वैसे ही निकालता हूं जैसे लेख बताता है, लेकिन मुझे नहीं पता कि इसके साथ मौलिक आवृत्ति क्या है। मैंने सबसे बड़ी परिमाण के साथ बिन पाने की कोशिश की है, लेकिन यह केवल मुझे उच्च पिच संकेतों के लिए सही परिणाम देता है, इससे कोई फर्क नहीं पड़ता कि मैं किस ओवरसम्पलिंग कारक का उपयोग करता हूं मैं अभी भी कम फ्रीक संकेतों के लिए खराब डेटा प्राप्त करता हूं। क्या यह दृष्टिकोण पूरी तरह से गलत है या मैं सही रास्ते पर हूं लेकिन अभी कुछ याद नहीं है?
अग्रिम में धन्यवाद,
संपादित करें: मैं यह उल्लेख करना भूल गया कि मैं केवल पिच क्लास में दिलचस्पी रखता हूं, इसलिए यह ठीक है कि अगर मौलिक गायब है, लेकिन मेरे पास नमूने में एक मजबूत ओवरटोन है।
EDIT2: सभी के लिए धन्यवाद, मैंने अभी एक एल्गोरिथ्म का एक संस्करण समाप्त किया है जो एक आकर्षण की तरह काम कर रहा है। मेरे इनपुट परीक्षण के कारण कम पिच अनुमान समस्या थी। जब मैंने नोट गाया तो यह सही ढंग से मेल खाता था। इसके अलावा, मैं अब सभी हार्मोनिक्स पर विचार कर रहा हूं, न कि केवल उच्चतम चोटी पर।