विरल फूरियर परिवर्तन क्या है?


46

एमआईटी हाल ही में एक नए एल्गोरिथ्म के बारे में थोड़ा शोर कर रहा है जिसे तेजी से फूरियर ट्रांसफॉर्म के रूप में जाना जाता है जो विशेष प्रकार के संकेतों पर काम करता है, उदाहरण के लिए: " फास्टर फूरियर ट्रांसफॉर्म ने दुनिया की सबसे महत्वपूर्ण उभरती प्रौद्योगिकियों में से एक का नाम दिया "। MIT प्रौद्योगिकी समीक्षा पत्रिका कहती है :

नए एल्गोरिथ्म के साथ, स्पार्स फूरियर ट्रांसफॉर्म (एसएफटी) कहा जाता है, एफएफटी के साथ डेटा की धाराओं को 10 से 100 गुना तेजी से संसाधित किया जा सकता है। स्पीडअप हो सकता है क्योंकि हम जिस जानकारी के बारे में सबसे अधिक ध्यान रखते हैं, उसमें संरचना का एक बड़ा हिस्सा है: संगीत यादृच्छिक शोर नहीं है। इन सार्थक संकेतों में आम तौर पर संभावित मूल्यों का एक अंश होता है जो एक संकेत ले सकता है; इसके लिए तकनीकी शब्द है कि सूचना "विरल" है। क्योंकि SFT एल्गोरिथ्म डेटा के सभी संभव धाराओं के साथ काम करने का इरादा नहीं है, यह कुछ शॉर्टकट ले सकता है जो अन्यथा उपलब्ध नहीं हैं। सिद्धांत रूप में, एक एल्गोरिथ्म जो केवल विरल संकेतों को संभाल सकता है, एफएफटी की तुलना में बहुत अधिक सीमित है। लेकिन इलेक्ट्रिकल इंजीनियरिंग और कंप्यूटर साइंस के प्रोफेसर कॉन्वेंटी कैताबी बताते हैं कि "स्पार्सिटी हर जगह है।" "यह प्रकृति में है?" वीडियो संकेतों में; यह ऑडियो सिग्नल में है। "

क्या कोई व्यक्ति एल्गोरिथम वास्तव में क्या है और यह कहां लागू हो सकता है, इस बारे में अधिक तकनीकी व्याख्या प्रदान कर सकता है?

संपादित करें: कुछ लिंक:

जवाबों:


40

एल्गोरिथ्म का विचार यह है: मान लें कि आपके पास एक लंबाई सिग्नल है जो आवृत्ति डोमेन में विरल है। इसका मतलब है कि यदि आप इसके असतत फूरियर रूपांतरण की गणना करने के लिए थे , तो कम संख्या में आउटपुट k N होगा जो कि एज़रो है; अन्य N - k नगण्य हैं। K आउटपुट पर जो आप चाहते हैं उसे प्राप्त करने का एक तरीका संपूर्ण क्रम पर FFT का उपयोग करना है , फिर k का चयन करेंएनkNNkk nonzero मानों का ।

यहाँ प्रस्तुत विरल फूरियर रूपांतरण एल्गोरिथ्म एफएफटी-आधारित विधि की तुलना में कम जटिलता के साथ उन आउटपुट की गणना के लिए एक तकनीक है । अनिवार्य रूप से, क्योंकि एन - के आउटपुट शून्य हैं, आप उन परिणाम मूल्यों को उत्पन्न नहीं करने के लिए एल्गोरिथ्म के अंदर शॉर्टकट ले कर कुछ प्रयास बचा सकते हैं। जबकि FFT में O ( n लॉग एन ) की एक जटिलता है , स्पार्स एल्गोरिथ्म में स्पार्से-स्पेक्ट्रम केस के लिए O ( k log n ) की संभावित-कम जटिलता है ।एन-हे(nलॉगn)हे(लॉगn)

अधिक सामान्य मामले के लिए, जहां स्पेक्ट्रम "विरल" है, लेकिन नॉनजेरो मान (जैसे कि शोर में एम्बेडेड टन के लिए कई) से अधिक हैं, वे एल्गोरिथ्म की एक भिन्नता पेश करते हैं जो कश्मीर के सबसे बड़े आउटपुट का अनुमान लगाता हैO ( k log n log n) की एक समय जटिलताहे(लॉगnलॉगn) , जो FFT से कम जटिल भी हो सकता है।

उनके परिणामों के एक ग्राफ के अनुसार (नीचे की छवि में पुनरुत्पादित), एफएफटीडब्ल्यू (एक अनुकूलित एफएफटी पुस्तकालय, एमआईटी में कुछ अन्य लोगों द्वारा बनाया गया) के संबंध में बेहतर प्रदर्शन के लिए क्रॉसओवर बिंदु उस बिंदु के आसपास है जहां केवल -से121 1 वें आउटपुट ट्रांसफ़ॉर्मेशन गुणांक नॉनज़रो हैं। इसके अलावा,इस प्रस्तुति मेंवे संकेत देते हैं कि विरल एल्गोरिथ्म जबएन कोबेहतर प्रदर्शन प्रदान करता है1210एन[2000,106]

यहाँ छवि विवरण दर्ज करें

ये स्थितियाँ एल्गोरिथ्म की प्रयोज्यता को उन मामलों तक सीमित करती हैं जहाँ आप जानते हैं कि सिग्नल के स्पेक्ट्रम में कुछ महत्वपूर्ण रूप से बड़ी चोटियाँ होने की संभावना है। एक उदाहरण जो वे अपनी वेब साइट पर उद्धृत करते हैं , वह यह है कि औसतन 8-पिक्सेल के 8 ब्लॉक अक्सर छवि और वीडियो संपीड़न में उपयोग किए जाते हैं, आवृत्ति डोमेन में लगभग 90% विरल होते हैं और इस तरह उस संपत्ति का शोषण करने वाले एल्गोरिदम से लाभ उठा सकते हैं। स्पार्सिटी का वह स्तर इस विशेष एल्गोरिथ्म के लिए अनुप्रयोग स्थान के साथ वर्ग नहीं लगता है, इसलिए यह सिर्फ एक उदाहरण हो सकता है।

मुझे साहित्य के माध्यम से पढ़ने की ज़रूरत है कि वास्तविक दुनिया की समस्याओं पर इस तरह की तकनीक का उपयोग करने के लिए कितना व्यावहारिक है, लेकिन एक निश्चित श्रेणी के अनुप्रयोगों के लिए यह एक उपयुक्त है।


2
तो यह मूल रूप से एक दोषपूर्ण FFT है? एक एमपी 3 एनकोडर की तरह?
12'12

3

मुझे आश्चर्य है कि यह गोएर्टज़ेल एल्गोरिथ्म (या उनमें से एक परिवार) के खिलाफ कैसे जाता है। ऐसा लगता है कि अंतर केवल यह है कि गोएर्टज़ेल में आप जानते हैं कि आप किस चीज को शुरू करना चाहते हैं।
स्पेसी

5
@endolith: एमपी 3 संपीड़न हानिपूर्ण है क्योंकि गुणांक मात्रा निर्धारित हैं; इसलिए नहीं कि केवल शीर्ष कश्मीर गुणांक रखे जाते हैं। विरल FFT = "इनपुट संकेत के साथ अंतर को कम करने वाले k- गुणांक प्रतिनिधित्व क्या है"। एक एमपी 3 फ्रेम का कोडिंग = "मात्रात्मक गुणांक और परिमाणीकरण स्तर क्या हैं जो गुणांक और स्केल कारकों को संग्रहीत करने के लिए एन बिट्स का एक बजट दिया गया (अवधारणात्मक) त्रुटि को कम करता है"।
pichenettes

1
जब उन्हें फेंक दिया जाता है, तो यह परिमाणीकरण का एक
दुष्परिणाम

7

मैंने sFFT पर पेपर नहीं पढ़ा है, लेकिन मेरी भावना यह है कि एफएफटी को पीछे हटाने का विचार के-स्पार्सिटी से पहले का शोषण है। इसलिए, किसी को एफएफटी गुणांक की सभी प्रविष्टियों की गणना करने की आवश्यकता नहीं है, इसके बजाय, उनमें से केवल कंप्यूटिंग के। तो इसीलिए k-sparse सिग्नल के लिए, पारंपरिक FFT के लिए O (nlog n) के बजाय जटिलता O (klog n) है।

किसी भी तरह से, @rcmpton की टिप्पणियों के बारे में, यह कहते हुए कि "संकुचित संवेदन के पीछे का विचार यह है कि आप एक अलग डोमेन से तैयार किए गए विरल यादृच्छिक नमूनों से विरल डेटा को पुनर्प्राप्त कर सकते हैं (जैसे यादृच्छिक विरल आवृत्ति डेटा (यानी एमआरआई) से विरल छवियां पुनर्प्राप्त करें) । " सवाल यह है कि "विरल यादृच्छिक नमूने" क्या है? मुझे लगता है कि यह बेतरतीब ढंग से डेटा को कुछ कम (माप) सबस्पेस में प्रोजेक्ट करके एकत्र किए गए नमूने हो सकते हैं।

और जैसा कि मैंने समझा, कम्प्रेसिव सेंसिंग का सैद्धांतिक ढांचा मुख्य रूप से 3 मुद्दों, स्पार्सिटी, माप और रिकवरी से बना है। विरलता से, यह कुछ निश्चित संकेतों के लिए विरल प्रतिनिधित्व प्राप्त करने से संबंधित है, जो शब्दकोश सीखने का कार्य है। माप से, यह डेटा को मापने के लिए एक कुशल तरीका (कम्प्यूटेशनल दक्षता और पुनर्प्राप्त करने योग्य) प्राप्त करने से संबंधित है (या डेटा को कम माप स्थान पर प्रक्षेपित करना), जो कि माप मैट्रिक्स डिजाइन का काम है, जैसे कि यादृच्छिक गाऊसी मैट्रिक्स, संरचनात्मक यादृच्छिक मैट्रिक्स। ... और वसूली से, विरल नियमित रैखिक उलटा समस्याओं, l0, l1, l1-l2, lp, l- समूह, blabla ... है, और परिणामी एल्गोरिदम विभिन्न हैं, मिलान पीछा, नरम थ्रेसहोल्ड, हार्ड थ्रेसहोल्डिंग, आधार खोज, बेयसियन, ...।

यह सच है कि "cs, L1 मानदंड का न्यूनकरण है", और L1 मान cs के लिए एक मूल सिद्धांत है, लेकिन cs केवल L1 मान का न्यूनतमकरण नहीं है। उपरोक्त 3 भागों के अलावा, कुछ एक्सटेंशन भी हैं, जैसे संरचित (समूह, या मॉडल) कंप्रेसिव सेंसिंग, जहाँ संरचित स्पार्सिटी का भी दोहन किया जाता है, और यह काफी हद तक रिकवरी क्षमता में सुधार करने के लिए सिद्ध होता है।

निष्कर्ष के रूप में, नमूना सिद्धांत में सीएस एक बड़ा कदम है, नमूना संकेतों के लिए एक कुशल तरीका प्रदान करता है, बशर्ते कि ये संकेत पर्याप्त रूप से विरल हों । तो, सीएस एक नमूना सिद्धांत है , जो कोई भी इसे वर्गीकरण या मान्यता के लिए कुछ तकनीक के रूप में उपयोग करने जा रहा है वह सिद्धांत को गुमराह कर रहा है। और कभी-कभी, मुझे "कंप्रेसिव सेंसिंग बेस्ड ....." शीर्षक से कुछ पेपर मिलते हैं, और मुझे लगता है कि इस तरह के पेपर का सिद्धांत सीएस के बजाय एल 1-न्यूनतमकरण का शोषण कर रहा है और "एल 1-न्यूनतमकरण आधारित" का उपयोग करना बेहतर है। "।

अगर मैं गलत हूं, तो कृपया मुझे सुधारें।


DSP में आपका स्वागत है। यह एक महान योगदान है।
फोनॉन

6

मैंने कागज के माध्यम से देखा है और मुझे लगता है कि मुझे विधि का सामान्य विचार मिला। विधि का "गुप्त सोस" यह है कि आवृत्ति डोमेन में इनपुट सिग्नल के विरल प्रतिनिधित्व कैसे प्राप्त करें। पिछले एल्गोरिदम ने प्रमुख विरल गुणांक के स्थान के लिए ब्रूट बल का उपयोग किया। इस पद्धति का उपयोग तकनीक के बजाय "स्पेस रिकवरी" या "कंप्रेस्ड सेंसिंग" विकी आर्टिकल है, यहां किया गया है। यहां इस्तेमाल की जाने वाली विरल रिकवरी का सटीक तरीका 'हार्ड थ्रेशोल्डिंग' के समान है - जो कि प्रमुख विरल रिकवरी के तरीकों में से एक है।

विरल रिकवरी / संपीड़ित संवेदन की पीएस तकनीक और इससे जुड़ी एल 1 न्यूनतमकरण ने आधुनिक सिग्नल प्रोसेसिंग और विशेष रूप से फूरियर रूपांतरण के संबंध में बहुत उपयोग किया। वास्तव में यह आधुनिक सिग्नल प्रोसेसिंग के लिए जानना आवश्यक है। लेकिन इससे पहले कि फूरियर ट्रांसफॉर्म का इस्तेमाल विरल रिकवरी समस्या के समाधान के तरीकों में से एक के रूप में किया जाता था। यहाँ हम फूरियर ट्रांसफॉर्म के लिए विपरीत - विरल रिकवरी देखते हैं ।

अच्छी तरह से सिंहावलोकन संकुचित संवेदन के लिए साइट: nuit-blanche.blogspot.com/

पीपीएस पिछली टिप्पणी का जवाब देता है - अगर इनपुट सिग्नल बिल्कुल विरल नहीं है तो यह हानिपूर्ण है।

अगर मुझे विधि गलत लगी तो मुझे ठीक करने के लिए स्वतंत्र महसूस करें।


एफएफटी पेपर संकुचित नहीं है। कंप्रेस्ड सेंसिंग के पीछे का विचार यह है कि आप एक अलग डोमेन से तैयार किए गए विरल रैंडम सैंपल से स्पार्स डेटा रिकवर कर सकते हैं (जैसे रैंडम स्पार्स फ्रीक्वेंसी डेटा (यानी एमआरआई) से स्पार्स इमेज को रिकवर करना)। हालांकि यह अधिग्रहण के समय को कम कर सकता है, यह कम्प्यूटेशनल लागत को बढ़ाता है। एफएफटी पेपर इस मायने में अलग है कि आपके पास दोनों डोमेन में डेटा है और लक्ष्य यह है कि गणना जल्दी से हो जाए।
ड्रैनक्सो

आप संकुचित संवेदन के बारे में गलत हैं।
दर्पण

1
क्या आप विस्तार से समझा सकते हैं?
ड्रैंक्सो

एलपीएक्स=yआरyमैंn,>>nwमैंटीसीnरोंटीआरमैंnटी
दर्पण २

मिनट|एक्स|1एक्स=y
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.