यह मेरे खर्राटों ऐप से एक साइड-ट्रिप है ।
मेरे पास ऑडियो सिग्नल के एक स्वतःसंक्रमण का निर्माण करने के लिए एक दरार थी, यह देखने के लिए कि क्या खर्राटे / साँस लेने के साथ अच्छी तरह से "सहसंबंधित" है। मेरे पास एक सरल एल्गोरिथ्म है (1.0 को शून्य तत्व के रूप में पैदा करता है, जो एक अच्छा संकेत है), लेकिन मैं सोच रहा हूं कि ऑटोक्रेलेशन मजबूत है, और यह निर्धारित करने के लिए परिणाम का मूल्यांकन कैसे करें, और शायद, आगे, इसे अलग करने के लिए कैसे उपयोग करें विभिन्न संभव ध्वनि स्रोत।
प्रश्न # 1: क्या ऑटोक्रॉलेशन (लंघन तत्व शून्य) का आरएमएस उतना ही अच्छा "गुणवत्ता" मीट्रिक है, या कुछ बेहतर है?
विस्तृत करने के लिए: मैं बस एक संख्यात्मक तरीका (बनाम "एक चार्ट में" देख रहा हूं) को एक कम अच्छी तरह से autocorrelated एक से एक अत्यधिक autocorrelated संकेत भेद करना चाहता हूं।
(मुझे वास्तव में यह जानने के लिए पर्याप्त नहीं है कि अन्य प्रश्न क्या पूछना है।)
कुछ शुरुआती नतीजे: कुछ मामलों में ऑटोकॉरेलेशन (या तो आरएमएस या शिखर) एक खर्राटे पर एक नाटकीय छलांग दिखाता है - ठीक वही प्रतिक्रिया जो मैं देखना चाहता हूं। अन्य मामलों में इन उपायों में कोई स्पष्ट आंदोलन नहीं है (और यह दो प्रतिक्रियाओं के साथ दो लगातार घोंघे हो सकते हैं), और उच्च शोर वाली स्थितियों में माप वास्तव में एक खर्राटे के दौरान (थोड़ा) डुबकी लगाते हैं।
अपडेट - 22 मई: आखिरकार मुझे इस पर कुछ और काम करने का समय मिला। (मुझे एक अन्य ऐप पर खींच लिया गया था, जो सचमुच एक दर्द है।) मैंने एक एफएफटी में ऑटोकारोलेशन के आउटपुट को खिलाया और आउटपुट कुछ दिलचस्प है - यह एक खर्राटे शुरू होने पर मूल के पास काफी नाटकीय चोटी दिखाता है।
तो अब मैं किसी भी तरह इस चोटी को बढ़ाने की समस्या का सामना कर रहा हूं। अजीब तरह से, पूर्ण परिमाण के मामले में, उच्चतम शिखर, अन्य समय में होते हैं, लेकिन मैंने अंकगणित माध्य के लिए चोटी के अनुपात की कोशिश की और यह बहुत अच्छी तरह से ट्रैक करता है। तो एफएफटी के "चरमता" को मापने के लिए कुछ अच्छे तरीके क्या हैं। (और कृपया यह न कहें कि मुझे इसका एक एफएफटी लेने की आवश्यकता है - यह बात पहले से ही अपनी पूंछ को निगलने के करीब है। :))
इसके अलावा, मेरे साथ यह हुआ कि एफएफटी की गुणवत्ता में कुछ हद तक सुधार हो सकता है अगर मैं बीच में शून्य (जो कि 1.0 परिमाण के अनुसार है) के साथ खिलाए जाने वाले ऑटोकॉर्लेशन परिणामों को प्रतिबिंबित करता है। यह दोनों छोर पर "पूंछ" डाल देगा। क्या यह (संभवतः) एक अच्छा विचार है? दर्पण की छवि सीधी या उलटी होनी चाहिए? (बेशक, आप जो भी कहें, मैं उसकी कोशिश करूंगा, लेकिन मुझे लगा कि शायद मुझे विवरण पर कुछ संकेत मिल सकते हैं।)
सपाट कोशिश की -
मेरे परीक्षण मामलों को मोटे तौर पर "अच्छी तरह से व्यवहार" श्रेणी और "समस्या बच्चों" श्रेणी में विभाजित किया जा सकता है।
"अच्छी तरह से व्यवहार किया" परीक्षण के मामलों के लिए autocorrelation की FFT की सपाटता नाटकीय रूप से कम हो जाती है और चोटी के औसत ऑटोकैरेलेशन के अनुपात एक खर्राटे के दौरान चढ़ता है। उन दो संख्याओं का अनुपात (समतलता द्वारा विभाजित शिखर अनुपात) विशेष रूप से संवेदनशील है, एक सांस / खर्राटे के दौरान 5-10x चढ़ाई का प्रदर्शन।
"समस्या बच्चों" के लिए, हालांकि, विपरीत दिशा में संख्याएं। शिखर / औसत अनुपात थोड़ा कम होता है, जबकि सपाटता वास्तव में 50-100% बढ़ जाती है
इन दो श्रेणियों के बीच का अंतर (ज्यादातर) तीन गुना है:
- शोर का स्तर (आमतौर पर) "समस्या वाले बच्चों" में अधिक होता है
- "समस्या बच्चों" में ऑडियो स्तर बहुत (हमेशा बहुत कम) होते हैं
- "समस्या बच्चों" में अधिक श्वास और कम वास्तविक खर्राटों से युक्त होते हैं (और मुझे दोनों का पता लगाने की आवश्यकता है)
कोई विचार?
अद्यतन - ५/२५/२०११: यह एक जीत नृत्य करने के लिए थोड़ा समय से पहले है, लेकिन जब मैंने एक बिंदु के बारे में स्वायत्तता को प्रतिबिंबित किया, तो उस का एफएफटी लिया, और फिर वर्णक्रमीय सपाटता की, मेरी संयुक्त अनुपात योजना ने एक अच्छी छलांग दिखाई। कई अलग-अलग वातावरण। ऑटोकार्टोलेशन को दर्शाते हुए एफएफटी की गुणवत्ता में सुधार होता है।
हालांकि, एक मामूली बात यह है कि, परिलक्षित "सिग्नल" के "डीसी घटक" शून्य होने के बाद, शून्य एफएफटी परिणाम हमेशा शून्य होता है, और यह थोड़े ज्यामितीय मतलब को तोड़ता है जिसमें शून्य भी शामिल है। लेकिन शून्य तत्व को छोड़ना काम करने लगता है।
मुझे जो परिणाम मिल रहा है, वह अपने आप में खर्राटों / सांसों की पहचान करने के लिए पर्याप्त है, लेकिन यह काफी संवेदनशील "पुष्टि" है - अगर मुझे "कूद" नहीं मिलता है, तो शायद यह कोई खर्राटे / सांस नहीं है।
मैंने इसका बारीकी से विश्लेषण नहीं किया है, लेकिन मुझे संदेह है कि यह क्या हो रहा है कि सांस / खर्राटे के दौरान एक सीटी की आवाज कहीं होती है, और उस सीटी का पता लगाया जा रहा है।