संक्षेप में, आवृत्ति परिवर्तन की दर को संदर्भित करती है। अधिक सटीक रूप से, आवृत्ति परिवर्तन की अवधि का विलोम है - अर्थात् , एक चमक (या जो भी) से एक अलग चमक और फिर से वापस करने के लिए समय की मात्रा होती है। तेजी से तब परिवर्तन (जैसे प्रकाश से अंधेरे तक), छवि के उस हिस्से का प्रतिनिधित्व करने के लिए आवश्यक दृश्य "आवृत्ति" जितना अधिक होगा।
दूसरे शब्दों में, आप परिवर्तन की दर के रूप में एक छवि में आवृत्ति के बारे में सोच सकते हैं। छवि के वे भाग जो एक रंग से दूसरे रंग में तेजी से बदलते हैं (जैसे तेज किनारों) में उच्च आवृत्तियाँ होती हैं, और जो भाग धीरे-धीरे बदलते हैं (जैसे ठोस रंगों वाली बड़ी सतहों) में केवल कम आवृत्तियाँ होती हैं।
जब हम डीसीटी और एफएफटी और इसी तरह के अन्य परिवर्तनों के बारे में बात करते हैं, तो हम आम तौर पर उन्हें एक छवि के एक हिस्से (जैसे जेपीईजी संपीड़न, बढ़त का पता लगाने, और इसी तरह) पर कर रहे हैं। परिवर्तनों के बारे में बात करना सबसे अधिक समझ में आता है, फिर, किसी दिए गए आकार के परिवर्तन ब्लॉक के संदर्भ में ।
कल्पना कीजिए, यदि आप करेंगे, तो छवि डेटा का एक 32 पिक्सेल x 32 पिक्सेल ब्लॉक। (यह संख्या मनमानी है।) मान लीजिए कि छवि एक साधारण ढाल है जो बाईं ओर सफेद है, बीच में काला है, और दाईं ओर सफेद है। हम कहेंगे कि इस सिग्नल में एक अवधि है जो लगभग 32 पिक्सेल चौड़ाई के प्रति एक तरंग दैर्ध्य है, क्योंकि यह हर 32 पिक्सेल में फिर से सफेद से काले तक एक पूर्ण चक्र से गुजरता है।
हम मनमाने ढंग से इस आवृत्ति को "1" कह सकते हैं - 1 चक्र प्रति 32 पिक्सेल, अर्थात। मैं अस्पष्ट रूप से याद करता हूं कि इसे आमतौर पर पाठ्यपुस्तकों को बदलने में that कहा जाता है, या शायद ely / 2, लेकिन मुझे गलत याद हो सकता है। किसी भी तरह से, हम इसे अभी के लिए 1 कहेंगे, क्योंकि यह वास्तव में एक पूर्ण अर्थ में मनमाना है; एक मायने में आवृत्तियों के बीच संबंध क्या मायने रखता है। :-)
मान लीजिए कि आपके पास एक दूसरी छवि है जो एक किनारे पर सफेद है, तो दो बार जल्दी से फीका हो जाता है ताकि यह सफेद से काले, सफेद से काले, और फिर से दूसरे किनारे पर सफेद हो जाए। फिर हम उस आवृत्ति को "2" कहेंगे क्योंकि यह उस 32 पिक्सेल ब्लॉक की चौड़ाई पर दो बार बदलती है।
अगर हम उन सरल चित्रों को फिर से बनाना चाहते हैं, तो हम शाब्दिक रूप से कह सकते हैं कि प्रत्येक पंक्ति में 1 या 2 की आवृत्ति के साथ एक संकेत होता है, और आपको पता चल जाएगा कि चित्र क्या दिखते हैं। यदि चित्र काले से 50% ग्रे में चले गए, तो आप एक ही काम कर सकते हैं, लेकिन आपको यह कहना होगा कि उनके पास 50% की तीव्रता पर 1 या 2 की आवृत्ति थी।
वास्तविक दुनिया की छवियां, निश्चित रूप से एक साधारण ढाल नहीं हैं। जब आप बाएं से दाएं स्कैन करते हैं तो छवि बार-बार बदलती है और समय-समय पर नहीं। हालाँकि, एक छोटे से पर्याप्त ब्लॉक (उदाहरण के लिए 8 पिक्सेल, 16 पिक्सेल) के साथ आप पिक्सेल की उस पंक्ति को संकेतों की एक श्रृंखला के योग के रूप में अनुमानित कर सकते हैं, पंक्ति में पिक्सेल मूल्यों के औसत के साथ शुरू होता है, उसके बाद "की मात्रा" आवृत्ति 0.5 "संकेत (एक तरफ काला, सफेद करने के लिए लुप्त होती) (या नकारात्मक राशि के साथ मिश्रण करने के लिए, उस संकेत की राशि को घटाना), इसके बाद आवृत्ति 1, आवृत्ति 2, आवृत्ति 4, और इसी तरह की राशि ।
अब एक छवि अद्वितीय है कि इसमें दोनों दिशाओं में आवृत्ति है; क्षैतिज और लंबवत रूप से गतिशील होने पर यह हल्का और गहरा हो सकता है। इस कारण से, हम 1D के बजाय 2D DCT या FFT ट्रांसफ़ॉर्म का उपयोग करते हैं। लेकिन सिद्धांत अभी भी मूल रूप से समान है। आप ठीक उसी तरह के आकार की बाल्टियों के 8x8 ग्रिड के साथ एक 8x8 छवि का प्रतिनिधित्व कर सकते हैं।
रंग के कारण छवियां भी अधिक जटिल हैं, लेकिन हम अभी के लिए इसे अनदेखा कर देंगे, और मान सकते हैं कि हम केवल एक एकल छवि देख रहे हैं जैसा कि आप अलगाव में एक तस्वीर के लाल चैनल को देखकर प्राप्त कर सकते हैं।
रूपांतर के परिणामों को कैसे पढ़ा जाए, इस पर निर्भर करता है कि आप 1D रूपांतरण या 2 डी परिवर्तन देख रहे हैं। 1D ट्रांसफ़ॉर्म के लिए, आपके पास बिन्स की एक श्रृंखला है। पहला सभी इनपुट मानों का औसत है। दूसरा जोड़ने के लिए आवृत्ति 1 संकेत की मात्रा है, तीसरा आवृत्ति 2 संकेत जोड़ने की राशि है, आदि।
2 डी रूपांतरण के लिए, आपके पास मानों का एक n x n ग्रिड है। ऊपरी बाएं आम तौर पर औसत है, और जैसा कि आप क्षैतिज दिशा में जाते हैं, प्रत्येक बाल्टी में 1, 2, 4, आदि की क्षैतिज आवृत्ति के साथ मिश्रण करने के लिए संकेत की मात्रा होती है और जैसा कि आप ऊर्ध्वाधर दिशा में जाते हैं, यह 1, 2, 4, आदि की ऊर्ध्वाधर आवृत्ति के साथ मिश्रण करने के लिए संकेत की मात्रा है।
यदि आप एक डीसीटी के बारे में बात कर रहे हैं, तो निश्चित रूप से, पूरी कहानी; इसके विपरीत, FFT के लिए प्रत्येक बिन में वास्तविक और काल्पनिक भाग होते हैं। एफएफटी अभी भी एक ही मूल विचार (प्रकार) पर आधारित है, सिवाय इसके कि जिस तरह से आवृत्तियों को डिब्बे पर मैप किया जाता है वह अलग है और गणित बालों वाला है। :-)
बेशक, इन प्रकार के परिवर्तनों को उत्पन्न करने का सबसे आम कारण तब एक कदम आगे जाना और कुछ डेटा को दूर फेंकना है। उदाहरण के लिए, डीसीटी का उपयोग जेपीईजी संपीड़न में किया जाता है। ज़िग-ज़ैग पैटर्न में मूल्यों को पढ़ने से ऊपरी बाएँ (औसत) से शुरू होता है और निचले दाईं ओर बढ़ता है, सबसे महत्वपूर्ण डेटा (औसत और कम-आवृत्ति जानकारी) पहले दर्ज किया जाता है, इसके बाद उत्तरोत्तर उच्च आवृत्ति डेटा होता है। कुछ बिंदु पर, आप मूल रूप से "यह काफी अच्छा है" कहते हैं और उच्चतम-आवृत्ति डेटा को फेंक देते हैं। यह अनिवार्य रूप से अपनी बारीक डिटेल को निकालकर इमेज को स्मूथ बनाता है, लेकिन फिर भी आपको लगभग सही इमेज देता है।
और IIRC, FFTs का उपयोग कभी-कभी धार का पता लगाने के लिए भी किया जाता है, जहां आप तेज किनारों पर उच्च विपरीत के क्षेत्रों का पता लगाने के साधन के रूप में सभी लेकिन उच्च आवृत्ति घटकों को फेंक देते हैं।
नेशनल इंस्ट्रूमेंट्स का एक अच्छा लेख है जो चित्रों के साथ यह बताता है। :-)