वीडियो का चयन करने के लिए एल्गोरिदम कौन सा आकार बदलता है?


21

मैं उन सेटिंग्स के साथ एन्कोडिंग के लिए VirtualDub का उपयोग कर रहा हूं । एल्गोरिदम का आकार बदलें

हालाँकि मैं 1920x1080 में अपना सामान रिकॉर्ड करता हूँ और इसे 1280x720 तक आकार देता हूँ। अब सवाल: संतुलित गुणवत्ता बनाम फ़ाइल के आकार का निर्णय लेते समय मुझे कौन सा एल्गोरिदम चुनना चाहिए?

मैं हमेशा लैंसजोस के साथ गया क्योंकि यह पूर्व-कॉन्फ़िगर किया गया था। वे वर्णन वास्तव में मेरे प्रश्न में मेरी बिल्कुल मदद नहीं करते हैं।

जवाबों:


25

टी एल; डॉ

सैंपल डाउन करते समय: लैंक्ज़ोस या स्पलाइन फ़िल्टरिंग का उपयोग करें।

सैंपलिंग करते समय: बाइक्यूबिक या लैंकोज़ फ़िल्टरिंग का उपयोग करें।

ये उन सामग्रियों पर आधारित हैं जो मैंने वर्षों से पढ़ी हैं, और जो मैंने उद्योग में इस्तेमाल किया है, उससे देखा है। सिफारिशें सामग्री प्रकार और आवेदन क्षेत्र के आधार पर भिन्न हो सकती हैं।

इससे क्या फर्क पड़ता है?

यह तर्क दिया जा सकता है कि जब आप एक वीडियो को डाउन करते हैं, तो आकार बदलने वाले फ़िल्टर बहुत मायने नहीं रखते हैं। इससे भी महत्वपूर्ण बात यह है कि अपसंस्कृति होने पर उनकी गुणवत्ता पर प्रभाव पड़ता है, क्योंकि आपको डेटा उत्पन्न करने की आवश्यकता होती है, जहां पहले स्थान पर नहीं है।

ये सभी फ़िल्टर फ़ाइल आकार पर केवल एक मामूली प्रभाव डालते हैं। इसलिए आपको वहाँ भारी अंतर के बारे में चिंता नहीं करनी चाहिए।

तथ्य यह है कि हमेशा जब वीडियो एन्कोडिंग होता है, तो इसका परिणाम स्रोत सामग्री पर बहुत अधिक निर्भर करता है। आप हमेशा परिणाम की भविष्यवाणी नहीं कर सकते, लेकिन सिर्फ यह देखें कि आपके लिए सबसे अच्छा काम क्या है।

विभिन्न एल्गोरिदम

एक उदाहरण के रूप में, यहाँ द्विविभाजन बनाम बिलिनियर प्रक्षेप है :

     यहां छवि विवरण दर्ज करें

देखें कि चिकने किनारों में बाइबिक प्रक्षेप होता है? यह एक बहुत ही सामान्य कथन है ... लेकिन आप यहाँ इमेज स्केलिंग एल्गोरिदम का अवलोकन पा सकते हैं ।

  • बिलिनियर प्रक्षेप एक पिक्सेल के 2x2 वातावरण का उपयोग करता है और फिर नए मूल्य को प्रक्षेपित करने के लिए इन पिक्सेल का औसत लेता है। यह सबसे अच्छा एल्गोरिथ्म नहीं है, बल्कि तेज है।

  • बाइक्यूबिक प्रक्षेप एक पिक्सेल के 4x4 वातावरण का उपयोग करता है, जो अंतरतम पिक्सेल का वजन अधिक होता है, और फिर नए मूल्य को प्रक्षेपित करने के लिए औसत लेता है। यह - जहाँ तक मेरा सवाल है - सबसे लोकप्रिय।

  • क्षेत्र औसत स्रोत और गंतव्य पिक्सेल के मानचित्रण का उपयोग करता है, स्रोत पिक्सेल का औसत गंतव्य पिक्सल के अंश के संबंध में होता है जो कवर होते हैं। इस पृष्ठ के अनुसार , डाउनस्मलिंग के दौरान बेहतर परिणाम प्राप्त करना चाहिए।

  • तख़्ता और सिनके इंटरपोलेशन उच्च-क्रम के बहुपद का उपयोग करते हैं और इसलिए बाइबिक इंटरपोलेशन की तुलना में कठिन हैं। मुझे नहीं लगता कि प्रसंस्करण समय में समग्र वृद्धि उनके उपयोग के लायक है।

  • Lanczos resampling में एक सिन फ़िल्टर भी शामिल है। यह अधिक कम्प्यूटेशनल रूप से महंगा है लेकिन आमतौर पर बहुत उच्च गुणवत्ता के रूप में वर्णित है और इसका उपयोग अप- और डाउनसमलिंग के लिए किया जा सकता है।

  • hxx के साथ-साथ 2xSaI फिल्टर का उपयोग पिक्सेल-आर्ट स्केलिंग (जैसे गेम एमुलेटर) के लिए किया जाता है। मुझे नहीं लगता कि वीडियो में उनका उपयोग करने का कोई अच्छा कारण है।

जेफ एटवुड की तुलना

यह पता चला है कि जेफ एटवुड ने छवि प्रक्षेप एल्गोरिथम की तुलना की थी । अंगूठे का उनका नियम अपसम्पलिंग के लिए बाइसिक्यूबल प्रक्षेप का उपयोग करना था और अपस्मरण के दौरान बिलिनियर प्रक्षेप। उस ने कहा, यह वीडियो एन्कोडिंग के लिए आमतौर पर अनुशंसित नहीं है - और कुछ टिप्पणीकारों ने क्षेत्र में एटवुड की विशेषज्ञता के बारे में संदेह उठाया है।

हालांकि, उन्होंने यह भी कहा कि ...

छवियों को कम करना पूरी तरह से सुरक्षित और तर्कसंगत संचालन है। आप सूचना को त्याग कर सटीकता और संकल्प को कम कर रहे हैं। छवि को जितना चाहें उतना छोटा करें, और आपके द्वारा अनुमत पिक्सेल की संख्या के सीमा के भीतर पूरी निष्ठा है। आपको अच्छे परिणाम मिलेंगे कोई फर्क नहीं पड़ता कि आप कौन सा एल्गोरिदम चुनते हैं। (ठीक है, जब तक कि आप nave Pixel Resize या नजदीकी पड़ोसी एल्गोरिदम को नहीं चुनते हैं।)

अन्य उदाहरण

यहाँ छवि प्रक्षेप एल्गोरिदम के कुछ और उदाहरण दिए गए हैं , जिनमें से ऊपर मैंने उल्लेख किया है।

मुझे वीडियो एन्कोडिंग दृश्य से दस्तावेज़ (दृश्य नियम) भी मिले जो स्पष्ट रूप से डाउनसैंपलिंग के लिए बाइबिक फ़िल्टरिंग पर प्रतिबंध लगाते हैं । इसके बजाय, वे लैंक्ज़ोस, स्पलाइन या "ब्लैकमैन" को फिर से शुरू करने का समर्थन करते हैं।


मैं हमेशा "सटीक बिकुबिक ए = 100" का उपयोग करता था। अपडेट किए गए प्रोग्राम की एक बार फिर से स्थापित करने पर यह लैंकोज़ डिफॉल्ट हो गया, कई लोगों ने इसे पसंद किया। मैंने उसे लंबे समय तक ऐसे ही छोड़ दिया। आखिरकार मैं बाद में एन्कोडेड लैंजोस चीजों को देखने के लिए चारों ओर हो गया, और सोचा कि अच्छा नहीं था, एन्कोड के अगले सेट, मैंने इसे वापस बाइबिक में बदल दिया। मैं भी संपीड़न crunching था, मुझे लगता है कि Lanczos बेहतर लग रहा था अगर मैं कुल डेटा आकार को इतना कम करने की कोशिश नहीं कर रहा था।
साइकोजेक

2
FWIW मैं जेफ एटवुड को इमेज प्रोसेसिंग का विशेषज्ञ नहीं मानूंगा, और उस लेख में वह बिलिनियर, निकटतम पड़ोसी या (एक विशेष संस्करण) बाइबिक के अलावा किसी अन्य चीज की जांच नहीं करता है। ज्यादातर लोग बिलीयर का उपयोग करने के लिए उनकी सिफारिश पर सहमत होंगे जब बड़ा होना एक बुरा है।
थोमसट्रेटर

1
@thomasrutter साभार मैं आपसे सहमत हूं- जब मैंने यह लिखा था, तो मैं शायद इमेज प्रोसेसिंग के बारे में उतना नहीं जानता था जितना कि अब मैं करता हूं। मुझे लगता है कि मैं उस लेख के संदर्भ को हटा दूंगा और किसी अन्य स्रोत को ढूंढूंगा।
7

8

मुझे एक अच्छी छवि मिली जो इसमें से कुछ का दस्तावेजीकरण करती है।

यहां छवि विवरण दर्ज करें

पूर्ण आकार संस्करण यहाँ

सामान्य तौर पर आप किसी छोटी छवि को बड़े आकार में बनाते समय एक हल्का तीक्ष्ण प्रभाव चाहते हैं और छोटी छवि को बड़े स्तर पर बनाते समय हल्का धुंधला प्रभाव। MadVR फ़िल्टर ने डाउनस्कूलिंग के लिए अपसंस्कृति और द्विबीज के लिए लैंक्ज़ोस को डिफॉल्ट किया।


2

आप 3x3 मूल पिक्सेल को 2x2 लक्ष्य पिक्सेल में परिवर्तित कर रहे हैं।

यदि आप तेज लाइनें रखना चाहते हैं तो लैंक्ज़ोस या ऐसी कोई चीज़ चुनें जो तेज़ पंक्तियों को धुंधला न करने के लिए अधिक आस-पास के पिक्सेल का उपयोग करती है (जैसे फर या प्रतिबिंब)

अन्यथा क्षेत्र का औसत आदि (बिलिनियर / ट्रिलिनियर भी) पर्याप्त होगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.