मुझे लगता है कि आप जिस अंतर की तलाश कर रहे हैं वह अनुभवजन्य बनाम सैद्धांतिक (पर्यवेक्षण के विपरीत बनाम अनुपयोगी) के समान है, लेकिन मैं इसके बारे में गलत हो सकता हूं। दूसरे शब्दों में, आदर्श बात के लिए विभिन्न विधाओं की सैद्धांतिक परिभाषा होनी चाहिए, न कि केवल अपारदर्शी डेटा का एक गुच्छा, जिसका उपयोग किसी गीत को वर्गीकृत करने के लिए किया जा सकता है [बिना किसी वास्तविक समझ के]।
हालांकि, सामान्य शैली के वर्गीकरण के लिए, आप शायद उदाहरणों से प्रशिक्षण के साथ कम से कम फंस गए हैं, भले ही पहले स्थान पर शैलियों की परिभाषा बनाने के लिए। अपने उदाहरण के संबंध में, इस बात पर विचार करें कि लोग कितनी बार बहस करेंगे [YouTube पर] कि क्या एक दिया गया ट्रैक वास्तव में डबस्टेप है (उदाहरण के लिए कोई भी ट्रैक जो अधिक डब्बी है और कम wobbly है , भले ही शैली बिना किसी वास्तविक छेड़छाड़ के शुरू हुई हो)। लोग उदाहरणों के माध्यम से समय के साथ शैलियों को परिभाषित करते हैं, इसलिए यह उम्मीद करना उचित है कि एल्गोरिदम जो उस व्यवहार को दोहराते हैं, उन्हें भी कुछ उदाहरणों की आवश्यकता होगी। जिस तरह से लोग शैलियों का वर्णन करते हैं वह लगभग एक फ़ीचर वेक्टर की तरह है वैसे भी - वे गीत के बारे में प्रश्नों की एक सूची पूछते हैं (जैसे कि क्या यह अधिक ब्रेकी या डगमगाने वाला है? क्या इसमें सब बेस है? कब तक है? क्या टेम्पो है? एक स्वर है? आदि)।
बेशक, आप उन विशेषताओं की एक सूची चुनने में सक्षम हो सकते हैं जो शैली की सहज समझ प्रदान करती हैं। "डायनेमिक रेंज" जैसी सुविधा एक ऐसी चीज़ है जिसे व्यक्ति कान से भी पता लगा सकता है, लेकिन "टाइम डोमेन ज़ीरो क्रॉसिंग" जैसा कुछ बहुत सहज नहीं होगा - भले ही यह वर्गीकरण के लिए अच्छा काम करता हो। निम्नलिखित पेपर में कुछ विशेषताएं हैं जो आपके लिए दिलचस्प हो सकती हैं:
जॉर्ज टेज़ेटाकिस, पेरी आर। कुक: ऑडियो संकेतों का संगीत शैली वर्गीकरण। आईईईई भाषण और ऑडियो प्रोसेसिंग 10 (5) पर लेनदेन: 293-302 (2002) लिंक ।
खुरदरापन मापने के लिए, मनोचिकित्सा खुरदरापन शुरू करने के लिए एक अच्छी जगह होगी, लेकिन यह उदाहरण के लिए डबस्टेप लीड और इलेक्ट्रो लीड के बीच अंतर करने के लिए पर्याप्त नहीं हो सकता है। बारीक-बारीक भेदों के लिए, एक बात पर गौर करना चाहिए मान्यता है । निम्नलिखित थीसिस में तकनीकों का एक सभ्य सर्वेक्षण है:
टीएच पार्क, "स्वचालित संगीत वाद्ययंत्र की समय पर मान्यता," पीएच.डी. शोध प्रबंध, प्रिंसटन विश्वविद्यालय, एनजे, 2004. लिंक ।
टिम्ब्रे, ट्यूनिंग, स्पेक्ट्रम और स्केल में अवधारणात्मक खुरदरापन से संबंधित एक मॉडल भी है जो मनमाने ढंग से लकड़ी के लिए कस्टम तराजू के निर्माण के लिए उपयोग किया जाता है। विचार यह है कि हार्मोनिक्स जो बहुत करीब हैं, बीट आवृत्तियों का उत्पादन करते हैं जिन्हें असंगति के रूप में माना जाता है। परिशिष्ट एफ और ई से Paraphrasing ,
Ff1,f2,...,fn
DF=1/2 ∑i=1n ∑j=1n d(|fi−fj|min(fi,fj))
जहाँ
d(x)=e−3.5x−e−5.75x
प्लाम्प-लेवल कर्व का एक मॉडल है ।
इसका उपयोग यह मापने के लिए किया जाता है कि किसी दिए गए राग को किस तरह से समतल करना सम्मान के साथ है (विसंगति को कम करके)। मुझे नहीं पता कि मनोविश्लेषक किस्म की खुरदरापन, या आंतरिक असंगति, अपने स्वयं के उद्देश्यों के लिए बहुत उपयोगी होगी, लेकिन वे अन्य मैट्रिक्स के साथ संयोजन में उपयोगी हो सकते हैं।
आप शायद शैलियों की तुलना में गणितीय रूप से टाइमब्रिज को वर्गीकृत करने के लिए अधिक भाग्य होंगे। उदाहरण के लिए, स्ट्रिंग्स में सम और विषम हारमोन्स होते हैं, लेकिन एक शहनाई में केवल विषम हारमोनिक्स (cf. Sawtooth wave , Square wave ) होता है। डबस्टेप वॉबल एलएफओ-चालित फिल्टर (कम पास और / या फॉर्मेंट फिल्टर) के साथ किया जाता है, इसलिए स्पेक्ट्रल फ्लक्स (देखें [Tzanetakis], ऊपर) जैसी कुछ सुविधा के रूप में एक अच्छा प्रारंभिक बिंदु हो सकता है। हालाँकि, मुझे संदेह है कि किसी ने अभी तक वोबेल के गणितीय वर्गीकरण का अध्ययन किया है;)