फास्ट फूरियर ट्रांसफॉर्म (FFT) की स्केलेबिलिटी


12

पीडीई सॉल्वर्स के संबंध में समान रूप से सैंपल किए गए डेटा पर फास्ट फूरियर ट्रांसफॉर्म (एफएफटी) का उपयोग करने के लिए, यह सर्वविदित है कि एफएफटी एक ) एल्गोरिथ्म है। कितनी अच्छी तरह से जब के लिए समानांतर में संसाधित FFT पैमाने करते n (यानी बहुत बड़े)?O(nlog(n)n


1
मैं थोड़ा उलझन में हूँ। क्या आप इस बात के बारे में बात कर रहे हैं कि डेटा पॉइंट की संख्या बढ़ने पर प्रोसेसर की निश्चित संख्या के लिए निष्पादन का समय कैसे बढ़ता है, एक निश्चित संख्या के लिए निष्पादन समय कैसे बढ़ता है क्योंकि संख्या या प्रोसेसर बढ़ता है, या निष्पादन समय कैसे बढ़ता है डेटा बिंदुओं की संख्या बढ़ने पर प्रति प्रोसेसर डेटा अंकों का निश्चित अनुपात?
ज्योफ ऑक्सीबेरी

दोनों कमजोर और मजबूत स्केलिंग।
एलन पी। इंग्सिग-करुप

जवाबों:


8

यह प्रदर्शन किए गए सबूत की तुलना में अधिक महत्वपूर्ण सबूत है, लेकिन ऐसा प्रतीत होता है कि एफएफटी के लिए मौजूदा कार्यान्वयन, जैसे एफएफटीडब्ल्यू , उनकी स्केलिंग क्षमता की सीमा है।

kO(107)

लेकिन यहाँ ले-होम संदेश यह है कि एफएफटी को स्केल करना चाहिए; हालाँकि, कभी-कभी अप्रत्याशित सीमाएँ और अंतःक्रियाएँ होती हैं जो एक एल्गोरिथम के प्रदर्शन के सैद्धांतिक विचार से वास्तविक एचपीसी प्लेटफ़ॉर्म पर इसके व्यावहारिक कार्यान्वयन तक चलती हैं।



5

ndd

Google विद्वान पर "समानांतर एफएफटी" या "स्यूडोस्पेक्ट्रल स्केलेबिलिटी" के लिए खोज करने से जानकारी का एक धन प्राप्त होता है जिसका मैं आकलन करने के लिए अयोग्य हूं। लेकिन यह एक अच्छा उदाहरण है जो व्यवहार में पूरा किया जा सकता है:

द्रव अशांति के लिए स्केलेबल समानांतर स्यूडोस्पेक्ट्रल संगणना के लिए एक हाइब्रिड एमपीआई-ओपनएमपी योजना

सार:

एक हाइब्रिड योजना जो वितरित मेमोरी समानांतरवाद के लिए एमपीआई का उपयोग करती है और साझा मेमोरी समानांतरवाद के लिए ओपनएमपी प्रस्तुत की जाती है। काम उभरते पेटस्केल, उच्च कोर-गणना, बड़े पैमाने पर समानांतर प्रसंस्करण प्रणालियों पर तरल अशांति के छद्मस्पर्शियल संगणना में असाधारण उच्च रेनॉल्ड्स संख्या प्राप्त करने की इच्छा से प्रेरित है। हाइब्रिड कार्यान्वयन एक अच्छी तरह से परीक्षण किए गए स्केलेबल एमपीआई-समानांतरित स्यूडोस्पेक्ट्रल कोड से व्युत्पन्न और संवर्धित होता है। हाइब्रिड प्रतिमान pseudospectral ग्रिड के डोमेन अपघटन के लिए एक नई तस्वीर की ओर जाता है, जो अन्य बातों के अलावा, समझने में सहायक है, वैश्विक डेटा का 3 डी ट्रांज़िशन, जो समानांतर तेज़ फ़ूरियर अवरोधों के लिए आवश्यक है, जो केंद्रीय घटक हैं संख्यात्मक विवेक। संकर कार्यान्वयन के विवरण प्रदान किए गए हैं, और प्रदर्शन परीक्षण विधि की उपयोगिता को दर्शाते हैं। यह दिखाया गया है कि हाइब्रिड स्कीम 83% की अधिकतम औसत दक्षता के साथ ~ 20000 कंप्यूट कोर तक आदर्श स्केलेबिलिटी के पास प्राप्त करती है। डेटा प्रस्तुत किए जाते हैं जो दो अलग-अलग प्लेटफार्मों पर कोड प्रदर्शन को अनुकूलित करने के लिए एमपीआई प्रक्रियाओं और ओपनएमपी थ्रेड्स की इष्टतम संख्या का चयन करने का तरीका बताते हैं।


1

O(n)

O(logn)

O(n)


1
एफएफटी में संचार की एक महत्वपूर्ण मात्रा है, लेकिन परिणाम को एक नोड पर इकट्ठा करना आवश्यक (या वांछनीय) नहीं है। एफएफटी का एक बहुत ही सामान्य उपयोग अशांति के प्रत्यक्ष संख्यात्मक सिमुलेशन में है, जहां इसका उपयोग वास्तविक स्थान पर नॉनलाइनियर संवहन शब्द को लागू करने के लिए किया जाता है, जबकि शेष सिमुलेशन फूरियर अंतरिक्ष में किया जाता है। यह सशक्त रूप से परिणाम को क्रमबद्ध करने की आवश्यकता नहीं है। सामान्य रूप से समानांतर कंप्यूटिंग के साथ, "बड़े" डेटा को हमेशा वितरित रूप में संग्रहीत और विश्लेषण किया जाना चाहिए।
जेड ब्राउन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.