मैं गैर-भाषण ध्वनियों का पता लगाने और वर्गीकृत करने की कोशिश कर रहा हूं। वर्तमान में, मैं उन विशेषताओं के रूप में प्रशिक्षण ध्वनियों से ओवरलैप्ड पावर स्पेक्ट्रोम्स की एक श्रृंखला का उपयोग कर रहा हूं, जिन्हें मैं देख रहा हूं।
जब मैं विश्लेषण करता हूं, तो मैं केवल ओवरलैप किए गए स्पेक्ट्रोम्स की समान मात्रा की गणना कर रहा हूं ताकि सुविधाओं की संख्या समान हो। अभी प्रदर्शन बहुत अच्छा नहीं है, यह केवल मौन बनाम गैर-मौन का पता लगा सकता है।
इस प्रकार के सिग्नल का पता लगाने के लिए क्या तकनीकें हैं? मेरी एक चिंता यह है कि समय क्षेत्र में अलग-अलग लंबाई की ध्वनियों के लिए अलग-अलग लंबाई के फ़ीचर वैक्टर होंगे, जिससे मैं एक ही क्लासिफायर का उपयोग नहीं कर सकता, मैं इस पर अटका हुआ हूं।