बाहरी उपयोगिताओं बनाम जावा के पाचन के साथ अलग-अलग परिणाम


194

मैंने विंडोज कैलकुलेटर फ़ाइल के हैश मूल्यों को उत्पन्न करने के लिए एक सरल जावा वर्ग लिखा है। मैं उपयोग कर रहा हूं Windows 7 Professional with SP1। मैं कोशिश की है Java 6.0.29और Java 7.0.03। क्या कोई मुझे बता सकता है कि मुझे जावा बनाम (कई!) बाहरी उपयोगिताओं और / या वेबसाइटों से अलग-अलग हैश मूल्य क्यों मिल रहे हैं? एक दूसरे के साथ सब कुछ बाहरी मैच करता है, केवल जावा विभिन्न परिणाम दे रहा है।

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.util.LinkedHashMap;
import java.util.Map;
import java.util.Map.Entry;
import java.util.zip.CRC32;
import java.security.DigestInputStream;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;

public class Checksum 
{
    private static int size = 65536;
    private static File calc = new File("C:/Windows/system32/calc.exe");

    /*
        C:\Windows\System32\calc.exe (verified via several different utilities)
        ----------------------------
        CRC-32b = 8D8F5F8E
        MD5     = 60B7C0FEAD45F2066E5B805A91F4F0FC
        SHA-1   = 9018A7D6CDBE859A430E8794E73381F77C840BE0
        SHA-256 = 80C10EE5F21F92F89CBC293A59D2FD4C01C7958AACAD15642558DB700943FA22
        SHA-384 = 551186C804C17B4CCDA07FD5FE83A32B48B4D173DAC3262F16489029894FC008A501B50AB9B53158B429031B043043D2
        SHA-512 = 68B9F9C00FC64DF946684CE81A72A2624F0FC07E07C0C8B3DB2FAE8C9C0415BD1B4A03AD7FFA96985AF0CC5E0410F6C5E29A30200EFFF21AB4B01369A3C59B58


        Results from this class
        -----------------------
        CRC-32  = 967E5DDE
        MD5     = 10E4A1D2132CCB5C6759F038CDB6F3C9
        SHA-1   = 42D36EEB2140441B48287B7CD30B38105986D68F
        SHA-256 = C6A91CBA00BF87CDB064C49ADAAC82255CBEC6FDD48FD21F9B3B96ABF019916B    
    */    

    public static void main(String[] args)throws Exception {
        Map<String, String> hashes = getFileHash(calc);
        for (Map.Entry<String, String> entry : hashes.entrySet()) {
            System.out.println(String.format("%-7s = %s", entry.getKey(), entry.getValue()));
        }
    }

    private static Map<String, String> getFileHash(File file) throws NoSuchAlgorithmException, IOException {
        Map<String, String> results = new LinkedHashMap<String, String>();

        if (file != null && file.exists()) {
            CRC32 crc32 = new CRC32();
            MessageDigest md5 = MessageDigest.getInstance("MD5");
            MessageDigest sha1 = MessageDigest.getInstance("SHA-1");
            MessageDigest sha256 = MessageDigest.getInstance("SHA-256");

            FileInputStream fis = new FileInputStream(file);
            byte data[] = new byte[size];
            int len = 0;
            while ((len = fis.read(data)) != -1) {
                crc32.update(data, 0, len);
                md5.update(data, 0, len);
                sha1.update(data, 0, len);
                sha256.update(data, 0, len);
            }
            fis.close();

            results.put("CRC-32", toHex(crc32.getValue()));
            results.put(md5.getAlgorithm(), toHex(md5.digest()));
            results.put(sha1.getAlgorithm(), toHex(sha1.digest()));
            results.put(sha256.getAlgorithm(), toHex(sha256.digest()));
        }
        return results;
    }

    private static String toHex(byte[] bytes) {
        String result = "";
        if (bytes != null) {
            StringBuilder sb = new StringBuilder(bytes.length * 2);
            for (byte element : bytes) {
                if ((element & 0xff) < 0x10) {
                    sb.append("0");
                }
                sb.append(Long.toString(element & 0xff, 16));
            }
            result = sb.toString().toUpperCase();
        }
        return result;
    }

    private static String toHex(long value) {
        return Long.toHexString(value).toUpperCase();
    }

}

मुझे लगता है कि आपका टोक्स गलत है। यदि आप ऐसा करते हैं int newElement = ((int) element) & 0xffऔर इसका उपयोग करते हैं तो क्या इससे आपकी समस्या का समाधान होगा?
zapl

64
चेक राशि की गणना करने के समानांतर, फ़ाइल को कुछ अस्थायी फ़ाइल में कॉपी करें, ताकि आप तुलना कर सकें कि जावा आपको क्या मिलता है जब आप अन्य उपकरणों का उपयोग करते हैं। विंडोज इस तरह से अजीब हो सकता है ... मैंने जावा को कभी भी हैश की गणना करने की गलती नहीं करते देखा ...
पावेल वेसलोव

3
सभी प्रोग्रामर को इस तरह प्रोग्राम करना चाहिए! कोड बहुत साफ और स्वच्छ है।
मार्टिअन कोर्टको

2
@ user567496: जो आपके कोड के लायक है, वह अन्य जावा SHA-1 कार्यान्वयन की तुलना में सही SHA-1 हैश देता है और कमांडलाइन sha1sum उपयोग की तुलना में ... (लिनक्स पर फ़ाइलों के साथ परीक्षण किया गया, न कि calc.exe के साथ
TacticalCoder

1
@ फ़िडो: इस मामले में यह एक परेशान करने वाला मुद्दा नहीं हो सकता क्योंकि ओपी कच्चे बाइट्स पढ़ रहा है: वह पात्रों को डिकोड नहीं कर रहा है।
टैक्टिकलकोडर

जवाबों:


239

समझ गया। आपकी प्रक्रिया की वास्तुकला के आधार पर विंडोज फाइल सिस्टम अलग तरह से व्यवहार कर रहा है। यह लेख यह सब बताता है - विशेष रूप से:

लेकिन उन 32-बिट अनुप्रयोगों के बारे में क्या है जिनके पास सिस्टम पथ हार्ड कोडित है और 64-बिट विंडोज में चल रहा है? प्रोग्राम कोड में बदलाव के बिना वे नया SysWOW64 फ़ोल्डर कैसे पा सकते हैं, आप सोच सकते हैं। इसका उत्तर यह है कि एमुलेटर System32 फ़ोल्डर को SysWOW64 फ़ोल्डर में पारदर्शी रूप से कॉल करता है, भले ही फ़ोल्डर को System32 फ़ोल्डर (जैसे C: \ Windows \ System32) पर कोडित किया गया हो, एमुलेटर सुनिश्चित करेगा कि SysWOW64 फ़ोल्डर का उपयोग किया जाता है । तो वही स्रोत कोड, जो सिस्टम 32 फ़ोल्डर का उपयोग करता है, को 32-बिट और 64-बिट प्रोग्राम कोड दोनों में संकलित किया जा सकता है।

calc.exeकहीं और कॉपी करने की कोशिश करें ... फिर उसी टूल को फिर से चलाएं। आपको जावा के समान परिणाम मिलेंगे। Windows फ़ाइल सिस्टम के बारे में कुछ उपकरण जावा को दे रहे हैं की तुलना में उपकरणों को अलग-अलग डेटा दे रहा है ... मुझे यकीन है कि यह विंडोज निर्देशिका में होने के साथ कुछ करना है, और इस तरह शायद "अलग ढंग से" संभाला।

इसके अलावा, मैंने इसे C # ... में पुन: पेश किया है और पाया कि यह उस प्रक्रिया की वास्तुकला पर निर्भर करता है जो आप चला रहे हैं । तो यहाँ एक नमूना कार्यक्रम है:

using System;
using System.IO;
using System.Security.Cryptography;

class Test
{
    static void Main()
    {
        using (var md5 = MD5.Create())
        {
            string path = "c:/Windows/System32/Calc.exe";
            var bytes = md5.ComputeHash(File.ReadAllBytes(path));
            Console.WriteLine(BitConverter.ToString(bytes));
        }
    }
}

और यहाँ एक सांत्वना सत्र (कंपाइलर से घटा):

c:\users\jon\Test>csc /platform:x86 Test.cs    

c:\users\jon\Test>test
60-B7-C0-FE-AD-45-F2-06-6E-5B-80-5A-91-F4-F0-FC

c:\users\jon\Test>csc /platform:x64 Test.cs

c:\users\jon\Test>test
10-E4-A1-D2-13-2C-CB-5C-67-59-F0-38-CD-B6-F3-C9

64
C: \ Windows \ SysWOW64` calc.exeमें 64bit के दो संस्करण हैं C:\Windows\system32` and 32bit in । 32 बिट प्रक्रिया C:\Windows\system32` is mapped to C: \ Windows \ SysWOW64` में अनुकूलता के लिए । 64bit प्रक्रियाएं 64bit calc लॉन्च करेंगी, 32bit 32bit calc प्रक्रियाएं शुरू करेंगी। आश्चर्य नहीं कि उनके चेकसम अलग हैं। यदि आप फ़ाइल को खुला रखते हैं handles.exeया एक्सप्लोरर के साथ देखते हैं तो आपको अलग रास्ता दिखाई देगा।
रिचर्ड

25
@ जो कुछ फ़ाइल सिस्टम पुनर्निर्देशक के रूप में जाना जाता है।
डेविड हेफर्नन

9
@DavidHeffernan राय भिन्न हैं, शायद 'व्यवहार्य' की परिभाषा के साथ। यह सब वर्चुअलाइजेशन कम से कम आश्चर्य के सिद्धांत का उल्लंघन करता है और लागत (आवंटन और क्रम) जोड़ता है। अन्य ऑपरेटिंग सिस्टम कम स्नैग / लीकी एब्स्ट्रक्शन (Wow64 पर कचरा एकत्रित करने वाले प्रोग्राम चलाने की कोशिश करना, या ओपी की तरह md5 sums और कुछ अन्य आला मामलों की तुलना करने की कोशिश) के साथ बेहतर 32-ऑन -64 समर्थन और बेहतर एप्लीकेशन वर्चुअलाइजेशन दोनों प्रदान करते हैं।
सेह

5
कभी-कभी मुझे आश्चर्य होता है कि लोग आपको उकसाते हैं क्योंकि आप जोंन स्कीट हैं, केवल उत्तर के कारण नहीं । मैं यह नहीं कह रहा हूं कि उत्तर अच्छा या कुछ भी नहीं है, लेकिन 145 उत्तोलन करता है जब उत्तर होता है "कुछ विंडोज़ में हो रहा है" (निष्पक्ष होने के लिए आप एक लिंक प्रदान करते हैं, लेकिन फिर भी) ऐसा लगता है जैसे लोग अधिक विचार कर रहे हैं तब बस आपका जवाब होगा जब वे उखड़ गए। मैं तुमसे नफरत नहीं कर रहा हूँ, लेकिन इसका मतलब यह है कि मैं तुम्हारे पकड़ने से पहले थोड़ी देर के लिए
जेसन रिज

5
ब्लॉग है कि मैंने इसे कैसे पाया। मैं कुछ जॉन स्कीट जादू की उम्मीद कर रहा था लेकिन मुझे ऐसा महसूस हुआ कि "अरे, मैं ऐसा कर सकता था"। शायद नहीं के रूप में जल्दी के बारे में है, लेकिन वहाँ तुम जाओ। ठीक है, शायद मैं नहीं कर सकता, लेकिन फिर भी। टोपी के लिए, इसमें थोड़ी सांत्वना है क्योंकि इसका मतलब है कि किसी भी दिन आप उस तक पहुंच जाएंगे, और इसलिए मैं कभी भी आपको पकड़ नहीं सकता। ओह अच्छा ...
जेसन रिज
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.