कभी-कभी मुझे एक दोषरहित स्क्रीनशॉट Resizer की आवश्यकता होती है


44

कभी-कभी मुझे कोड में केवल टिप्पणियों की तुलना में अधिक प्रलेखन लिखने की आवश्यकता होती है। और कभी-कभी, उन स्पष्टीकरणों को स्क्रीनशॉट की आवश्यकता होती है। कभी-कभी ऐसे स्क्रीनशॉट प्राप्त करने की शर्तें इतनी अजीब होती हैं कि मैं एक डेवलपर से मेरे लिए स्क्रीनशॉट लेने के लिए कहता हूं। कभी-कभी स्क्रीनशॉट मेरे विनिर्देशों पर फिट नहीं होता है और मुझे इसे आकार बदलना होगा ताकि यह अच्छी तरह से दिखे।

जैसा कि आप देख सकते हैं, जादू "दोषरहित स्क्रीनशॉट Resizer" की आवश्यकता के लिए परिस्थितियों की संभावना बहुत कम है। वैसे भी, मेरे लिए ऐसा लगता है कि मुझे हर दिन इसकी जरूरत है। लेकिन यह अभी तक मौजूद नहीं है।

मैंने आपको यहाँ पहले पीसीजी पर भयानक चित्रमय पहेलियाँ हल करते हुए देखा है , इसलिए मुझे लगता है कि यह आपके लिए उबाऊ है ...

विशिष्टता

  • प्रोग्राम इनपुट के रूप में सिंगल विंडो का स्क्रीनशॉट लेता है
  • स्क्रीनशॉट कांच के प्रभाव या इसी तरह का उपयोग नहीं करता है (इसलिए आपको किसी भी पृष्ठभूमि सामान से निपटने की आवश्यकता नहीं है जो चमकता है)
  • इनपुट फ़ाइल प्रारूप PNG (या कोई अन्य दोषरहित प्रारूप है जिससे आपको संपीड़न कलाकृतियों से निपटने की आवश्यकता नहीं है)
  • आउटपुट फ़ाइल प्रारूप इनपुट फ़ाइल प्रारूप के समान है
  • कार्यक्रम आउटपुट के रूप में विभिन्न आकार का एक स्क्रीनशॉट बनाता है। न्यूनतम आवश्यकता आकार में सिकुड़ रही है।
  • उपयोगकर्ता अपेक्षित आउटपुट आकार निर्दिष्ट करेगा। यदि आप दिए गए इनपुट से आपके प्रोग्राम के न्यूनतम आकार के बारे में संकेत दे सकते हैं, तो यह मददगार है।
  • यदि मानव द्वारा व्याख्या की जाती है तो आउटपुट स्क्रीनशॉट में कम जानकारी नहीं होनी चाहिए। आप पाठ या छवि सामग्री नहीं निकालेंगे, लेकिन आप केवल पृष्ठभूमि वाले क्षेत्रों को हटा देंगे। नीचे दिए गए उदाहरण देखें।
  • यदि अपेक्षित आकार प्राप्त करना संभव नहीं है, तो कार्यक्रम को संकेत देना चाहिए कि बिना सूचना के केवल दुर्घटना या सूचना को हटा दें या हटा दें।
  • यदि कार्यक्रम उन क्षेत्रों को इंगित करता है जो सत्यापन कारणों से हटा दिए जाएंगे, तो इसकी लोकप्रियता बढ़नी चाहिए।
  • अनुकूलन के लिए शुरुआती बिंदु को पहचानने के लिए कार्यक्रम को कुछ अन्य उपयोगकर्ता इनपुट की आवश्यकता हो सकती है।

नियम

यह एक लोकप्रियता प्रतियोगिता है। 2015-03-08 के अधिकांश मतों का उत्तर स्वीकार कर लिया गया।

उदाहरण

Windows XP स्क्रीनशॉट। मूल आकार: 1003x685 पिक्सेल।

XP स्क्रीनशॉट बड़ा

उदाहरण क्षेत्र (लाल: ऊर्ध्वाधर, पीला: क्षैतिज) जिसे बिना किसी जानकारी (पाठ या चित्र) को खोए हटाया जा सकता है। ध्यान दें कि लाल पट्टी सन्निहित नहीं है। यह उदाहरण उन सभी संभावित पिक्सेल को नहीं दर्शाता है जिन्हें संभावित रूप से हटाया जा सकता है।

XP स्क्रीनशॉट हटाने संकेतक

दोषरहित आकार: 783x424 पिक्सेल।

XP स्क्रीनशॉट छोटा

विंडोज 10 स्क्रीनशॉट। मूल आकार: 999x593 पिक्सेल।

विंडोज 10 स्क्रीनशॉट बड़ा

उदाहरण क्षेत्र जिन्हें हटाया जा सकता है।

विंडोज 10 स्क्रीनशॉट हटाने का संकेत दिया

हानिरहित आकार का स्क्रीनशॉट: 689x320 पिक्सेल।

ध्यान दें कि यह ठीक है कि शीर्षक पाठ ("डाउनलोड") और "यह फ़ोल्डर खाली है" किसी भी अधिक केंद्रित नहीं हैं। बेशक, यह अच्छा होगा यदि यह केंद्रित है, और यदि आपका समाधान यह प्रदान करता है, तो यह अधिक लोकप्रिय हो जाना चाहिए।

विंडोज 10 स्क्रीनशॉट छोटा


3
मुझे फ़ोटोशॉप के " कंटेंट अवेयर स्केलिंग " फीचर की याद दिलाता है ।
agtoever

क्या प्रारूप इनपुट है। क्या हमने कोई मानक छवि प्रारूप चुना है?
HEGX64

@ThomasW ने कहा "मुझे लगता है कि यह एक उबाऊ है"। सच नहीं। यह शैतानी है।
लॉजिक नाइट

1
इस प्रश्न पर पर्याप्त ध्यान नहीं दिया जाता है, पहले उत्तर को उत्कीर्ण किया गया था क्योंकि यह लंबे समय तक एकमात्र उत्तर था। वोटों की मात्रा इस समय अलग-अलग उत्तरों की लोकप्रियता का प्रतिनिधित्व करने के लिए पर्याप्त नहीं है। सवाल यह है कि हम अधिक से अधिक लोगों को वोट कैसे दे सकते हैं? यहां तक ​​कि मैंने एक जवाब पर वोट दिया।
रॉल्फ R

1
@ रॉल्फ worth: मैंने अब तक इस सवाल से अर्जित प्रतिष्ठा का 2/3 मूल्य का इनाम शुरू किया है। मुझे उम्मीद है कि यह काफी उचित है।
थॉमस वेलर

जवाबों:


29

अजगर

फ़ंक्शन delrowsसभी को हटाता है, लेकिन एक डुप्लिकेट पंक्तियों को हटाता है और ट्रांसपोज़्ड छवि को वापस करता है, इसे दो बार लागू करने से भी कॉलम हटाता है और इसे वापस भेजता है। इसके अतिरिक्त thresholdनियंत्रित करता है कि कितने पिक्सेल दो लाइनों के लिए अलग-अलग हो सकते हैं फिर भी समान माना जाता है

from scipy import misc
from pylab import *

im7 = misc.imread('win7.png')
im8 = misc.imread('win8.png')

def delrows(im, threshold=0):
    d = diff(im, axis=0)
    mask = where(sum((d!=0), axis=(1,2))>threshold)
    return transpose(im[mask], (1,0,2))

imsave('crop7.png', delrows(delrows(im7)))
imsave('crop8.png', delrows(delrows(im8)))

यहाँ छवि विवरण दर्ज करें
यहाँ छवि विवरण दर्ज करें

में तुलनित्र flipping maskसे >करने <=के बजाय उत्पादन हटाया क्षेत्रों जो ज्यादातर रिक्त स्थान हैं।

यहाँ छवि विवरण दर्ज करें यहाँ छवि विवरण दर्ज करें

गोल्फ (क्योंकि क्यों नहीं)
प्रत्येक पिक्सेल की तुलना करने के बजाय यह केवल राशि पर दिखता है, एक साइड इफेक्ट के रूप में यह स्क्रीनशॉट को ग्रेस्केल में भी परिवर्तित करता है और विन -8 के एड्रेस बार में डाउन-एरो की तरह राशि-संरक्षण क्रमपरिवर्तन से परेशानी होती है। स्क्रीनशॉट

from scipy import misc
from pylab import*
f=lambda M:M[where(diff(sum(M,1)))].T
imsave('out.png', f(f(misc.imread('in.png',1))),cmap='gray')

यहाँ छवि विवरण दर्ज करें
यहाँ छवि विवरण दर्ज करें


वाह, यहां तक ​​कि गोल्फ ... (मुझे आशा है कि आप जानते थे कि यह एक लोकप्रियता प्रतियोगिता है)
थॉमस वेलर

क्या आप गोल्फ स्कोर को हटाना चाहेंगे? यह सोच कर लोगों को छोड़ सकता है कि यह कोड गोल्फ है। धन्यवाद।
थॉमस वेलर

1
@ThomasW। स्कोर हटा दिया और इसे नीचे की ओर ले गया, दृष्टि से बाहर।
डेनडेनडो

15

जावा: सामग्री-जागरूक करने के लिए दोषरहित और कमबैक का प्रयास करें

(अब तक का सर्वश्रेष्ठ दोषरहित परिणाम!)

वांछित आकार के बिना XP स्क्रीनशॉट दोषरहित

जब मैंने पहली बार इस प्रश्न को देखा तो मुझे लगा कि यह कोई पहेली या चुनौती नहीं है, किसी को प्रोग्राम की जरूरत है और यह कोड है;) लेकिन दृष्टि समस्याओं को हल करना मेरे स्वभाव में है, इसलिए मैं इस चुनौती को आजमाने से अपने आप को रोक नहीं पाया। !

मैं एल्गोरिदम के निम्नलिखित दृष्टिकोण और संयोजन के साथ आया था।

छद्म कोड में यह इस तरह दिखता है:

function crop(image, desired) {
    int sizeChange = 1;
    while(sizeChange != 0 and image.width > desired){

        Look for a repeating and connected set of lines (top to bottom) with a minimum of x lines
        Remove all the lines except for one
        sizeChange = image.width - newImage.width
        image = newImage;
    }
    if(image.width > desired){
        while(image.width > 2 and image.width > desired){
           Create a "pixel energy" map of the image
           Find the path from the top of the image to the bottom which "costs" the least amount of "energy"
           Remove the lowest cost path from the image
           image = newImage;
        }
    }
}

int desiredWidth = ?
int desiredHeight = ?
Image image = input;

crop(image, desiredWidth);
rotate(image, 90);
crop(image, desiredWidth);
rotate(image, -90);

प्रयुक्त तकनीकें:

  • तीव्रता ग्रेस्केल
  • फैलाव
  • समान कॉलम खोज और निकालें
  • सीवन नक्काशी
  • Sobel बढ़त का पता लगाने
  • थ्रेशोल्डिंग

कार्यक्रम

यह कार्यक्रम स्क्रीनशॉट को दोषरहित कर सकता है, लेकिन इसमें कंटेंट-अवेयरिंग क्रॉपिंग का कमबैक करने का विकल्प है जो 100% दोषरहित नहीं है। बेहतर परिणाम प्राप्त करने के लिए कार्यक्रम के तर्कों को नया रूप दिया जा सकता है।

नोट: कार्यक्रम को कई तरीकों से बेहतर बनाया जा सकता है (मेरे पास इतना खाली समय नहीं है!)

तर्क

File name = file
Desired width = number > 0
Desired height = number > 0
Min slice width = number > 1
Compare threshold = number > 0
Use content aware = boolean
Max content aware cycles = number >= 0

कोड

import java.awt.Graphics2D;
import java.awt.image.BufferedImage;
import java.awt.image.ColorModel;
import java.io.File;
import java.io.IOException;
import javax.imageio.ImageIO;
import javax.swing.ImageIcon;
import javax.swing.JLabel;
import javax.swing.JOptionPane;

/**
 * @author Rolf Smit
 * Share and adapt as you like, but don't forget to credit the author!
 */
public class MagicWindowCropper {

    public static void main(String[] args) {
        if(args.length != 7){
            throw new IllegalArgumentException("At least 7 arguments are required: (file, desiredWidth, desiredHeight, minSliceSize, sliceThreshold, forceRemove, maxForceRemove)!");
        }

        File file = new File(args[0]);

        int minSliceSize = Integer.parseInt(args[3]); //4;
        int desiredWidth = Integer.parseInt(args[1]); //400;
        int desiredHeight = Integer.parseInt(args[2]); //400;

        boolean forceRemove = Boolean.parseBoolean(args[5]); //true
        int maxForceRemove = Integer.parseInt(args[6]); //40

        MagicWindowCropper.MATCH_THRESHOLD = Integer.parseInt(args[4]); //3;

        try {

            BufferedImage result = ImageIO.read(file);

            System.out.println("Horizontal cropping");

            //Horizontal crop
            result = doDuplicateColumnsMagic(result, minSliceSize, desiredWidth);
            if (result.getWidth() != desiredWidth && forceRemove) {
                result = doSeamCarvingMagic(result, maxForceRemove, desiredWidth);
            }

            result = getRotatedBufferedImage(result, false);


            System.out.println("Vertical cropping");

            //Vertical crop
            result = doDuplicateColumnsMagic(result, minSliceSize, desiredHeight);
            if (result.getWidth() != desiredHeight && forceRemove) {
                result = doSeamCarvingMagic(result, maxForceRemove, desiredHeight);
            }

            result = getRotatedBufferedImage(result, true);

            showBufferedImage("Result", result);

            ImageIO.write(result, "png", getNewFileName(file));
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    private static BufferedImage doSeamCarvingMagic(BufferedImage inputImage, int max, int desired) {
        System.out.println("Seam Carving magic:");

        int maxChange = Math.min(inputImage.getWidth() - desired, max);

        BufferedImage last = inputImage;
        int total = 0, change;
        do {
            int[][] energy = getPixelEnergyImage(last);
            BufferedImage out = removeLowestSeam(energy, last);

            change = last.getWidth() - out.getWidth();
            total += change;
            System.out.println("Carves removed: " + total);
            last = out;
        } while (change != 0 && total < maxChange);

        return last;
    }

    private static BufferedImage doDuplicateColumnsMagic(BufferedImage inputImage, int minSliceWidth, int desired) {
        System.out.println("Duplicate columns magic:");

        int maxChange = inputImage.getWidth() - desired;

        BufferedImage last = inputImage;
        int total = 0, change;
        do {
            BufferedImage out = removeDuplicateColumn(last, minSliceWidth, desired);

            change = last.getWidth() - out.getWidth();
            total += change;
            System.out.println("Columns removed: " + total);
            last = out;
        } while (change != 0 && total < maxChange);
        return last;
    }


    /*
     * Duplicate column methods
     */

    private static BufferedImage removeDuplicateColumn(BufferedImage inputImage, int minSliceWidth, int desiredWidth) {
        if (inputImage.getWidth() <= minSliceWidth) {
            throw new IllegalStateException("The image width is smaller than the minSliceWidth! What on earth are you trying to do?!");
        }

        int[] stamp = null;
        int sliceStart = -1, sliceEnd = -1;
        for (int x = 0; x < inputImage.getWidth() - minSliceWidth + 1; x++) {
            stamp = getHorizontalSliceStamp(inputImage, x, minSliceWidth);
            if (stamp != null) {
                sliceStart = x;
                sliceEnd = x + minSliceWidth - 1;
                break;
            }
        }

        if (stamp == null) {
            return inputImage;
        }

        BufferedImage out = deepCopyImage(inputImage);

        for (int x = sliceEnd + 1; x < inputImage.getWidth(); x++) {
            int[] row = getHorizontalSliceStamp(inputImage, x, 1);
            if (equalsRows(stamp, row)) {
                sliceEnd = x;
            } else {
                break;
            }
        }

        //Remove policy
        int canRemove = sliceEnd - (sliceStart + 1) + 1;
        int mayRemove = inputImage.getWidth() - desiredWidth;

        int dif = mayRemove - canRemove;
        if (dif < 0) {
            sliceEnd += dif;
        }

        int mustRemove = sliceEnd - (sliceStart + 1) + 1;
        if (mustRemove <= 0) {
            return out;
        }

        out = removeHorizontalRegion(out, sliceStart + 1, sliceEnd);
        out = removeLeft(out, out.getWidth() - mustRemove);
        return out;
    }

    private static BufferedImage removeHorizontalRegion(BufferedImage image, int startX, int endX) {
        int width = endX - startX + 1;

        if (endX + 1 > image.getWidth()) {
            endX = image.getWidth() - 1;
        }
        if (endX < startX) {
            throw new IllegalStateException("Invalid removal parameters! Wow this error message is genius!");
        }

        BufferedImage out = deepCopyImage(image);

        for (int x = endX + 1; x < image.getWidth(); x++) {
            for (int y = 0; y < image.getHeight(); y++) {
                out.setRGB(x - width, y, image.getRGB(x, y));
                out.setRGB(x, y, 0xFF000000);
            }
        }
        return out;
    }

    private static int[] getHorizontalSliceStamp(BufferedImage inputImage, int startX, int sliceWidth) {
        int[] initial = new int[inputImage.getHeight()];
        for (int y = 0; y < inputImage.getHeight(); y++) {
            initial[y] = inputImage.getRGB(startX, y);
        }
        if (sliceWidth == 1) {
            return initial;
        }
        for (int s = 1; s < sliceWidth; s++) {
            int[] row = new int[inputImage.getHeight()];
            for (int y = 0; y < inputImage.getHeight(); y++) {
                row[y] = inputImage.getRGB(startX + s, y);
            }

            if (!equalsRows(initial, row)) {
                return null;
            }
        }
        return initial;
    }

    private static int MATCH_THRESHOLD = 3;

    private static boolean equalsRows(int[] left, int[] right) {
        for (int i = 0; i < left.length; i++) {

            int rl = (left[i]) & 0xFF;
            int gl = (left[i] >> 8) & 0xFF;
            int bl = (left[i] >> 16) & 0xFF;

            int rr = (right[i]) & 0xFF;
            int gr = (right[i] >> 8) & 0xFF;
            int br = (right[i] >> 16) & 0xFF;

            if (Math.abs(rl - rr) > MATCH_THRESHOLD
                    || Math.abs(gl - gr) > MATCH_THRESHOLD
                    || Math.abs(bl - br) > MATCH_THRESHOLD) {
                return false;
            }
        }
        return true;
    }


    /*
     * Seam carving methods
     */

    private static BufferedImage removeLowestSeam(int[][] input, BufferedImage image) {
        int lowestValue = Integer.MAX_VALUE; //Integer overflow possible when image height grows!
        int lowestValueX = -1;

        // Here be dragons
        for (int x = 1; x < input.length - 1; x++) {
            int seamX = x;
            int value = input[x][0];
            for (int y = 1; y < input[x].length; y++) {
                if (seamX < 1) {
                    int top = input[seamX][y];
                    int right = input[seamX + 1][y];
                    if (top <= right) {
                        value += top;
                    } else {
                        seamX++;
                        value += right;
                    }
                } else if (seamX > input.length - 2) {
                    int top = input[seamX][y];
                    int left = input[seamX - 1][y];
                    if (top <= left) {
                        value += top;
                    } else {
                        seamX--;
                        value += left;
                    }
                } else {
                    int left = input[seamX - 1][y];
                    int top = input[seamX][y];
                    int right = input[seamX + 1][y];

                    if (top <= left && top <= right) {
                        value += top;
                    } else if (left <= top && left <= right) {
                        seamX--;
                        value += left;
                    } else {
                        seamX++;
                        value += right;
                    }
                }
            }
            if (value < lowestValue) {
                lowestValue = value;
                lowestValueX = x;
            }
        }

        BufferedImage out = deepCopyImage(image);

        int seamX = lowestValueX;
        shiftRow(out, seamX, 0);
        for (int y = 1; y < input[seamX].length; y++) {
            if (seamX < 1) {
                int top = input[seamX][y];
                int right = input[seamX + 1][y];
                if (top <= right) {
                    shiftRow(out, seamX, y);
                } else {
                    seamX++;
                    shiftRow(out, seamX, y);
                }
            } else if (seamX > input.length - 2) {
                int top = input[seamX][y];
                int left = input[seamX - 1][y];
                if (top <= left) {
                    shiftRow(out, seamX, y);
                } else {
                    seamX--;
                    shiftRow(out, seamX, y);
                }
            } else {
                int left = input[seamX - 1][y];
                int top = input[seamX][y];
                int right = input[seamX + 1][y];

                if (top <= left && top <= right) {
                    shiftRow(out, seamX, y);
                } else if (left <= top && left <= right) {
                    seamX--;
                    shiftRow(out, seamX, y);
                } else {
                    seamX++;
                    shiftRow(out, seamX, y);
                }
            }
        }

        return removeLeft(out, out.getWidth() - 1);
    }

    private static void shiftRow(BufferedImage image, int startX, int y) {
        for (int x = startX; x < image.getWidth() - 1; x++) {
            image.setRGB(x, y, image.getRGB(x + 1, y));
        }
    }

    private static int[][] getPixelEnergyImage(BufferedImage image) {

        // Convert Image to gray scale using the luminosity method and add extra
        // edges for the Sobel filter
        int[][] grayScale = new int[image.getWidth() + 2][image.getHeight() + 2];
        for (int x = 0; x < image.getWidth(); x++) {
            for (int y = 0; y < image.getHeight(); y++) {
                int rgb = image.getRGB(x, y);
                int r = (rgb >> 16) & 0xFF;
                int g = (rgb >> 8) & 0xFF;
                int b = (rgb & 0xFF);
                int luminosity = (int) (0.21 * r + 0.72 * g + 0.07 * b);
                grayScale[x + 1][y + 1] = luminosity;
            }
        }

        // Sobel edge detection
        final double[] kernelHorizontalEdges = new double[] { 1, 2, 1, 0, 0, 0, -1, -2, -1 };
        final double[] kernelVerticalEdges = new double[] { 1, 0, -1, 2, 0, -2, 1, 0, -1 };

        int[][] energyImage = new int[image.getWidth()][image.getHeight()];

        for (int x = 1; x < image.getWidth() + 1; x++) {
            for (int y = 1; y < image.getHeight() + 1; y++) {

                int k = 0;
                double horizontal = 0;
                for (int ky = -1; ky < 2; ky++) {
                    for (int kx = -1; kx < 2; kx++) {
                        horizontal += ((double) grayScale[x + kx][y + ky] * kernelHorizontalEdges[k]);
                        k++;
                    }
                }
                double vertical = 0;
                k = 0;
                for (int ky = -1; ky < 2; ky++) {
                    for (int kx = -1; kx < 2; kx++) {
                        vertical += ((double) grayScale[x + kx][y + ky] * kernelVerticalEdges[k]);
                        k++;
                    }
                }

                if (Math.sqrt(horizontal * horizontal + vertical * vertical) > 127) {
                    energyImage[x - 1][y - 1] = 255;
                } else {
                    energyImage[x - 1][y - 1] = 0;
                }
            }
        }

        //Dilate the edge detected image a few times for better seaming results
        //Current value is just 1...
        for (int i = 0; i < 1; i++) {
            dilateImage(energyImage);
        }
        return energyImage;
    }

    private static void dilateImage(int[][] image) {
        for (int x = 0; x < image.length; x++) {
            for (int y = 0; y < image[x].length; y++) {
                if (image[x][y] == 255) {
                    if (x > 0 && image[x - 1][y] == 0) {
                        image[x - 1][y] = 2; //Note: 2 is just a placeholder value
                    }
                    if (y > 0 && image[x][y - 1] == 0) {
                        image[x][y - 1] = 2;
                    }
                    if (x + 1 < image.length && image[x + 1][y] == 0) {
                        image[x + 1][y] = 2;
                    }
                    if (y + 1 < image[x].length && image[x][y + 1] == 0) {
                        image[x][y + 1] = 2;
                    }
                }
            }
        }
        for (int x = 0; x < image.length; x++) {
            for (int y = 0; y < image[x].length; y++) {
                if (image[x][y] == 2) {
                    image[x][y] = 255;
                }
            }
        }
    }

    /*
     * Utilities
     */

    private static void showBufferedImage(String windowTitle, BufferedImage image) {
        JOptionPane.showMessageDialog(null, new JLabel(new ImageIcon(image)), windowTitle, JOptionPane.PLAIN_MESSAGE, null);
    }

    private static BufferedImage deepCopyImage(BufferedImage input) {
        ColorModel cm = input.getColorModel();
        return new BufferedImage(cm, input.copyData(null), cm.isAlphaPremultiplied(), null);
    }

    private static final BufferedImage getRotatedBufferedImage(BufferedImage img, boolean back) {
        double oldW = img.getWidth(), oldH = img.getHeight();
        double newW = img.getHeight(), newH = img.getWidth();

        BufferedImage out = new BufferedImage((int) newW, (int) newH, img.getType());
        Graphics2D g = out.createGraphics();
        g.translate((newW - oldW) / 2.0, (newH - oldH) / 2.0);
        g.rotate(Math.toRadians(back ? -90 : 90), oldW / 2.0, oldH / 2.0);
        g.drawRenderedImage(img, null);
        g.dispose();
        return out;
    }

    private static BufferedImage removeLeft(BufferedImage image, int startX) {
        int removeWidth = image.getWidth() - startX;

        BufferedImage out = new BufferedImage(image.getWidth() - removeWidth,
                image.getHeight(), image.getType());

        for (int x = 0; x < startX; x++) {
            for (int y = 0; y < out.getHeight(); y++) {
                out.setRGB(x, y, image.getRGB(x, y));
            }
        }
        return out;
    }

    private static File getNewFileName(File in) {
        String name = in.getName();
        int i = name.lastIndexOf(".");
        if (i != -1) {
            String ext = name.substring(i);
            String n = name.substring(0, i);
            return new File(in.getParentFile(), n + "-cropped" + ext);
        } else {
            return new File(in.getParentFile(), name + "-cropped");
        }
    }
}

परिणाम


वांछित आकार के बिना XP स्क्रीनशॉट दोषरहित (अधिकतम दोषरहित संपीड़न)

तर्क: "image.png" 1 1 5 10 गलत 0

परिणाम: 836 x 323

वांछित आकार के बिना XP स्क्रीनशॉट दोषरहित


XP स्क्रीनशॉट 800x600 तक

तर्क: "image.png" 800 600 6 10 सच 60

परिणाम: 800 x 600

दोषरहित एल्गोरिथ्म लगभग 155 क्षैतिज रेखाओं को हटा देता है, एल्गोरिथ्म सामग्री-जागरूक हटाने के लिए वापस आ जाता है, इसके बाद कुछ कलाकृतियों को देखा जा सकता है।

Xp स्क्रीनशॉट 800x600 तक


विंडोज 10 स्क्रीनशॉट 700x300 तक

तर्क: "image.png" 700 300 6 10 सच 60

परिणाम: 700 x 300

दोषरहित एल्गोरिथ्म 270 क्षैतिज रेखाओं को हटा देता है, एल्गोरिथ्म सामग्री-जागरूक हटाने के लिए वापस आता है जो एक और 29 को हटाता है। ऊर्ध्वाधर केवल दोषरहित एल्गोरिथ्म का उपयोग किया जाता है।

विंडोज 10 स्क्रीनशॉट 700x300 तक


400x200 (परीक्षण) के लिए विंडोज 10 स्क्रीनशॉट सामग्री-जागरूक

तर्क: "image.png" 400 200 5 10 सच 600

परिणाम: 400 x 200

यह देखने के लिए एक परीक्षण था कि सामग्री-जागरूक सुविधा के गंभीर उपयोग के बाद परिणामी छवि कैसी दिखेगी। परिणाम भारी क्षतिग्रस्त है, लेकिन अपरिचित नहीं है।

400x200 (परीक्षण) के लिए विंडोज 10 स्क्रीनशॉट सामग्री-जागरूक



पहला आउटपुट पूरी तरह से छंटनी नहीं है। इतना मुझे सही से छोटा किया जा सकता है
अनुकूलक

ऐसा इसलिए है क्योंकि तर्क (मेरे कार्यक्रम के) का कहना है कि इसे 800 पिक्सल से आगे किसी भी रूप में अनुकूलित नहीं करना चाहिए :)
रॉल्फ

इस पॉपकॉन के बाद से, आपको संभवतः सबसे अच्छे परिणाम दिखाने चाहिए :)
ऑप्टिमाइज़र

मेरा कार्यक्रम अन्य उत्तर के समान ही आरंभिक है, लेकिन इसमें आगे और नीचे की ओर स्केलिंग के लिए एक सामग्री-जागरूक कार्य भी है। इसमें वांछित चौड़ाई और ऊंचाई पर फसल लगाने का विकल्प भी है (प्रश्न देखें)।
रॉल्फ R

3

सी #, एल्गोरिथ्म जैसे मैं इसे मैन्युअल रूप से करता हूं

यह मेरा पहला इमेज प्रोसेसिंग प्रोग्राम है और उस सभी LockBitsसामानों के साथ इसे लागू करने में थोड़ा समय लगा । लेकिन मैं चाहता था कि यह Parallel.Forलगभग त्वरित प्रतिक्रिया प्राप्त करने के लिए तेज (उपयोग ) हो।

मूल रूप से मेरा एल्गोरिथ्म एक स्क्रीनशॉट से मैन्युअल रूप से पिक्सेल निकालने के तरीके पर आधारित है:

  • मैं दाहिने किनारे से शुरू कर रहा हूं, क्योंकि संभावना अधिक है कि अप्रयुक्त पिक्सेल हैं।
  • मैं सिस्टम बटन को सही ढंग से पकड़ने के लिए किनारे का पता लगाने के लिए एक सीमा निर्धारित करता हूं। विंडोज 10 स्क्रीनशॉट के लिए, 48 पिक्सेल की एक सीमा अच्छी तरह से काम करती है।
  • किनारे का पता लगने के बाद (नीचे लाल रंग में चिह्नित), मैं उसी रंग के पिक्सल की तलाश कर रहा हूं। मैं पाया गया पिक्सेल की न्यूनतम संख्या लेता हूं और इसे सभी पंक्तियों (चिह्नित वायलेट) पर लागू करता हूं।
  • फिर मैं फिर से एज डिटेक्शन (चिह्नित लाल), एक ही रंग के पिक्सल (नीले, फिर हरे, फिर पीले) और आगे के साथ शुरू करता हूं

फिलहाल मैं इसे केवल क्षैतिज रूप से करता हूं। ऊर्ध्वाधर परिणाम एक ही एल्गोरिथ्म का उपयोग कर सकता है और 90 ° घुमाए गए छवि पर काम कर सकता है, इसलिए सिद्धांत रूप में यह संभव है।

परिणाम

यह पता लगाए गए क्षेत्रों के साथ मेरे आवेदन का स्क्रीनशॉट है:

दोषरहित स्क्रीनशॉट Resizer

और यह विंडोज 10 स्क्रीनशॉट और 48 पिक्सल थ्रेशोल्ड के लिए परिणाम है। आउटपुट 681 पिक्सल चौड़ा है। दुर्भाग्य से यह सही नहीं है ("खोज डाउनलोड" और कुछ ऊर्ध्वाधर स्तंभ बार देखें)।

विंडोज 10 परिणाम, 48 पिक्सेल सीमा

और 64 पिक्सेल दहलीज (567 पिक्सेल चौड़ा) के साथ एक और एक। यह और भी अच्छा लगता है।

विंडोज 10 परिणाम, 64 पिक्सेल थ्रेशोल्ड

कुल मिलाकर परिणाम फसल के लिए रोटेशन के साथ ही नीचे से (567x304 पिक्सल)।

विंडोज 10 परिणाम, 64 पिक्सल थ्रेशोल्ड, घुमाया गया

Windows XP के लिए, मुझे कोड को थोड़ा बदलने की आवश्यकता है क्योंकि पिक्सेल बिल्कुल समान नहीं हैं। मैं 8 (आरजीबी मान में अंतर) की एक समानता सीमा लागू कर रहा हूं। कॉलम में कुछ कलाकृतियों पर ध्यान दें।

दोषरहित स्क्रीनशॉट Resizer विंडोज एक्सपी स्क्रीनशॉट लोड के साथ

Windows XP परिणाम

कोड

खैर, इमेज प्रोसेसिंग पर मेरा पहला प्रयास। बहुत अच्छा नहीं लगता है, है ना? यह केवल कोर एल्गोरिथ्म को सूचीबद्ध करता है, न कि यूआई और 90 ° रोटेशन को।

using System;
using System.Collections.Generic;
using System.Diagnostics;
using System.Drawing;
using System.Linq;
using System.Threading.Tasks;

namespace LosslessScreenshotResizer.BL
{
    internal class PixelAreaSearcher
    {
        private readonly Bitmap _originalImage;

        private readonly int _edgeThreshold;
        readonly Color _edgeColor = Color.FromArgb(128, 255, 0, 0);
        readonly Color[] _iterationIndicatorColors =
        {
            Color.FromArgb(128, 0, 0, 255), 
            Color.FromArgb(128, 0, 255, 255), 
            Color.FromArgb(128, 0, 255, 0),
            Color.FromArgb(128, 255, 255, 0)
        };

        public PixelAreaSearcher(Bitmap originalImage, int edgeThreshold)
        {
            _originalImage = originalImage;
            _edgeThreshold = edgeThreshold;

            // cache width and height. Also need to do that because of some GDI exceptions during LockBits
            _imageWidth = _originalImage.Width;
            _imageHeight = _originalImage.Height;            
        }

        public Bitmap SearchHorizontal()
        {
            return Search();
        }

        /// <summary>
        /// Find areas of pixels to keep and to remove. You can get that information via <see cref="PixelAreas"/>.
        /// The result of this operation is a bitmap of the original picture with an overlay of the areas found.
        /// </summary>
        /// <returns></returns>
        private unsafe Bitmap Search()
        {
            // FastBitmap is a wrapper around Bitmap with LockBits enabled for fast operation.
            var input = new FastBitmap(_originalImage);
            // transparent overlay
            var overlay = new FastBitmap(_originalImage.Width, _originalImage.Height);

            _pixelAreas = new List<PixelArea>(); // save the raw data for later so that the image can be cropped
            int startCoordinate = _imageWidth - 1; // start at the right edge
            int iteration = 0; // remember the iteration to apply different colors
            int minimum;
            do
            {
                var indicatorColor = GetIterationColor(iteration);

                // Detect the edge which is not removable
                var edgeStartCoordinates = new PixelArea(_imageHeight) {AreaType = AreaType.Keep};
                Parallel.For(0, _imageHeight, y =>
                {
                    edgeStartCoordinates[y] = DetectEdge(input, y, overlay, _edgeColor, startCoordinate);
                }
                    );
                _pixelAreas.Add(edgeStartCoordinates);

                // Calculate how many pixels can theoretically be removed per line
                var removable = new PixelArea(_imageHeight) {AreaType = AreaType.Dummy};
                Parallel.For(0, _imageHeight, y =>
                {
                    removable[y] = CountRemovablePixels(input, y, edgeStartCoordinates[y]);
                }
                    );

                // Calculate the practical limit
                // We can only remove the same amount of pixels per line, otherwise we get a non-rectangular image
                minimum = removable.Minimum;
                Debug.WriteLine("Can remove {0} pixels", minimum);

                // Apply the practical limit: calculate the start coordinates of removable areas
                var removeStartCoordinates = new PixelArea(_imageHeight) { AreaType = AreaType.Remove };
                removeStartCoordinates.Width = minimum;
                for (int y = 0; y < _imageHeight; y++) removeStartCoordinates[y] = edgeStartCoordinates[y] - minimum;
                _pixelAreas.Add(removeStartCoordinates);

                // Paint the practical limit onto the overlay for demo purposes
                Parallel.For(0, _imageHeight, y =>
                {
                    PaintRemovableArea(y, overlay, indicatorColor, minimum, removeStartCoordinates[y]);
                }
                    );

                // Move the left edge before starting over
                startCoordinate = removeStartCoordinates.Minimum;
                var remaining = new PixelArea(_imageHeight) { AreaType = AreaType.Keep };
                for (int y = 0; y < _imageHeight; y++) remaining[y] = startCoordinate;
                _pixelAreas.Add(remaining);

                iteration++;
            } while (minimum > 1);


            input.GetBitmap(); // TODO HACK: release Lockbits on the original image 
            return overlay.GetBitmap();
        }

        private Color GetIterationColor(int iteration)
        {
            return _iterationIndicatorColors[iteration%_iterationIndicatorColors.Count()];
        }

        /// <summary>
        /// Find a minimum number of contiguous pixels from the right side of the image. Everything behind that is an edge.
        /// </summary>
        /// <param name="input">Input image to get pixel data from</param>
        /// <param name="y">The row to be analyzed</param>
        /// <param name="output">Output overlay image to draw the edge on</param>
        /// <param name="edgeColor">Color for drawing the edge</param>
        /// <param name="startCoordinate">Start coordinate, defining the maximum X</param>
        /// <returns>X coordinate where the edge starts</returns>
        private int DetectEdge(FastBitmap input, int y, FastBitmap output, Color edgeColor, int startCoordinate)
        {
            var repeatCount = 0;
            var lastColor = Color.DodgerBlue;
            int x;

            for (x = startCoordinate; x >= 0; x--)
            {
                var currentColor = input.GetPixel(x, y);
                if (almostEquals(lastColor,currentColor))
                {
                    repeatCount++;
                }
                else
                {
                    lastColor = currentColor;
                    repeatCount = 0;
                    for (int i = x; i < startCoordinate; i++)
                    {
                        output.SetPixel(i,y,edgeColor);
                    }
                }

                if (repeatCount > _edgeThreshold)
                {
                    return x + _edgeThreshold;
                }
            }
            return repeatCount;
        }

        /// <summary>
        /// Counts the number of contiguous pixels in a row, starting on the right and going to the left
        /// </summary>
        /// <param name="input">Input image to get pixels from</param>
        /// <param name="y">The current row</param>
        /// <param name="startingCoordinate">X coordinate to start from</param>
        /// <returns>Number of equal pixels found</returns>
        private int CountRemovablePixels(FastBitmap input, int y, int startingCoordinate)
        {
            var lastColor = input.GetPixel(startingCoordinate, y);
            for (int x=startingCoordinate; x >= 0; x--)
            {
                var currentColor = input.GetPixel(x, y);
                if (!almostEquals(currentColor,lastColor)) 
                {
                    return startingCoordinate-x; 
                }
            }
            return startingCoordinate;
        }

        /// <summary>
        /// Calculates color equality.
        /// Workaround for Windows XP screenshots which do not have 100% equal pixels.
        /// </summary>
        /// <returns>True if the RBG value is similar (maximum R+G+B difference is 8)</returns>
        private bool almostEquals(Color c1, Color c2)
        {
            int r = c1.R;
            int g = c1.G;
            int b = c1.B;
            int diff = (Math.Abs(r - c2.R) + Math.Abs(g - c2.G) + Math.Abs(b - c2.B));
            return (diff < 8) ;
        }

        /// <summary>
        /// Paint pixels that can be removed, starting at the X coordinate and painting to the right
        /// </summary>
        /// <param name="y">The current row</param>
        /// <param name="output">Overlay output image to draw on</param>
        /// <param name="removableColor">Color to use for drawing</param>
        /// <param name="width">Number of pixels that can be removed</param>
        /// <param name="start">Starting coordinate to begin drawing</param>
        private void PaintRemovableArea(int y, FastBitmap output, Color removableColor, int width, int start)
        {
            for(int i=start;i<start+width;i++)
            {
                output.SetPixel(i, y, removableColor);
            }
        }

        private readonly int _imageHeight;
        private readonly int _imageWidth;
        private List<PixelArea> _pixelAreas;

        public List<PixelArea> PixelAreas
        {
            get { return _pixelAreas; }
        }
    }
}

1
+1 दिलचस्प दृष्टिकोण, मुझे यह पसंद है! यह मजेदार होगा अगर मेरा और आपके जैसे कुछ एल्गोरिदम यहां पोस्ट किए जाएं, जो इष्टतम परिणाम प्राप्त करने के लिए संयुक्त होंगे। संपादित करें: C # पढ़ने के लिए एक राक्षस है, मुझे यकीन नहीं है कि अगर कोई क्षेत्र है या तर्क के साथ एक फ़ंक्शन / गटर है।
रॉल्फ R

1

हास्केल, डुप्लिकेट अनुक्रमिक लाइनों के भोलेपन का उपयोग करके

दुर्भाग्य से, इस मॉड्यूल केवल बहुत सामान्य प्रकार के साथ एक समारोह प्रदान करता है Eq a => [[a]] -> [[a]], के बाद से मुझे पता नहीं कैसे हास्केल में संपादित छवि फ़ाइलों के लिए, हालांकि, मैं इसे एक करने के लिए एक PNG छवि tranform संभव है कुछ कर रहा हूँ है [[Color]]मूल्य और मैं कल्पना करता instance Eq Colorहोने की आसानी से निश्चित है।

सवाल में समारोह है resizeL

कोड:

import Data.List

nubSequential []    = []
nubSequential (a:b) = a : g a b where
 g x (h:t)  | x == h =     g x t
            | x /= h = h : g h t
 g x []     = []

resizeL     = nubSequential . transpose . nubSequential . transpose

स्पष्टीकरण:

नोट: का a : b अर्थ तत्व के प्रकार की सूची मेंa उपसर्ग है , जिसके परिणामस्वरूप एक सूची है। यह सूचियों का मूलभूत निर्माण है। रिक्त सूची को दर्शाता है।a[]

नोट: a :: b साधन aप्रकार का है b। उदाहरण के लिए, यदि a :: k, तब (a : []) :: [k], जहां [x]प्रकार की चीजों वाली सूची को दर्शाता है x
इसका मतलब है कि (:)स्वयं, बिना किसी तर्क के :: a -> [a] -> [a],। ->कुछ के लिए कुछ से एक समारोह को दर्शाता है।

import Data.Listबस कुछ काम कुछ अन्य लोगों ने हमारे लिए किया जाता है और हम उन्हें फिर से लिखने के बिना उनके कार्यों का उपयोग करने देता है।

सबसे पहले, एक फ़ंक्शन को परिभाषित करें nubSequential :: Eq a => [a] -> [a]
यह फ़ंक्शन किसी सूची के बाद के तत्वों को निकालता है जो समान हैं।
तो, nubSequential [1, 2, 2, 3] === [1, 2, 3]अब हम इस फ़ंक्शन को संक्षिप्त करेंगे nS

यदि nSएक खाली सूची पर लागू किया जाता है, तो कुछ भी नहीं किया जा सकता है, और हम साधारण सूची को खाली कर देते हैं।

यदि nSसामग्री के साथ सूची में लागू किया जाता है, तो वास्तविक प्रसंस्करण किया जा सकता है। इसके लिए, हमें एक दूसरे फंक्शन की आवश्यकता है, यहाँ-इन where-क्लाउज़, पुनरावर्तन का उपयोग करने के लिए, क्योंकि हमारी nSतुलना करने के लिए एक तत्व का ट्रैक नहीं रखता है।
हम इस फंक्शन को नाम देते हैं g। यह इसके पहले तर्क की सूची के प्रमुख से तुलना करके काम करता है, और यदि वे पहले पुराने तर्क के साथ पूंछ पर मेल खाते हैं और कॉल करते हैं तो सिर को त्याग देते हैं। यदि वे नहीं करते हैं, तो यह पूंछ पर सिर को जोड़ देता है, नए पहले तर्क के रूप में सिर के माध्यम से खुद को गुजरता है।
उपयोग करने के लिए g, हम इसे nSऔर उसके दो तर्कों के रूप में पूंछ के सिर को देते हैं ।

nSअब प्रकार का है Eq a => [a] -> [a], एक सूची ले रहा है और एक सूची लौटा रहा है। इसके लिए आवश्यक है कि हम तत्वों के बीच समानता की जांच कर सकें क्योंकि यह फ़ंक्शन परिभाषा में किया गया है।

फिर, हम फ़ंक्शन और ऑपरेटर का उपयोग करके रचना करते हैं । कार्यों की रचना का अर्थ निम्न है :।nStranspose(.)
(f . g) x = f (g (x))

हमारे उदाहरण में, transposeएक तालिका 90 ° घूमती है, nSसूची के सभी अनुक्रमिक समान तत्वों को निकालती है, इस मामले में अन्य सूचियां (कि एक मेज क्या है), transposeइसे वापस घुमाता है और nSफिर से अनुक्रमिक समान तत्वों को निकालता है। यह अनिवार्य रूप से बाद की डुप्लिकेट पंक्तियों को एक कॉलम से हटा रहा है।

यह संभव है क्योंकि अगर aसमानता ( instance Eq a) के लिए जांच योग्य है , तो [a]यह भी है।
संक्षेप में:instance Eq a => Eq [a]

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.