sha1sum निर्देशिकाओं की एक निर्देशिका के लिए


33
sha1sum ./path/to/directory/* | sha1sum 

ऊपर एक निर्देशिका के एक sha1sum की गणना करने के तरीके के रूप में पोस्ट किया गया था जिसमें फाइलें शामिल हैं। यदि निर्देशिका में अधिक निर्देशिका शामिल हैं, तो यह आदेश विफल रहता है। क्या सार्वभौमिक निर्देशिकाओं के निर्देशिका के sha1sum को सार्वभौमिक रूप से गणना करने का एक तरीका है (कस्टम फिटिंग के बिना प्रश्न में विशेष निर्देशिका के लिए एक एल्गोरिथ्म)?

जवाबों:


14

इस SO पोस्ट के लिए धन्यवाद -

find . -type f \( -exec sha1sum "$PWD"/{} \; \) | sha1sum

चेतावनी: यह कोड अप्राप्त है ! इस प्रश्न को संपादित करें यदि यह गलत है और आप इसे ठीक कर सकते हैं; मैं आपके संपादन को मंजूरी दूंगा।


माफ़ कीजिये; मैं विरोध नहीं कर सका! ;-) पुनर्मिलन मजेदार है। जरूर कोई रास्ता है। मैं अब एक उचित उत्तर लिखूंगा।
allquixotic

3
यह विभिन्न मशीनों पर सटीक समान फ़ोल्डरों के लिए समान हैश उत्पन्न नहीं करेगा क्योंकि आउटपुट में <हैश> और <फ़ाइल पथ> भी होता है, जो फ़ाइल पथ विभिन्न मशीनों पर भिन्न होता है और विभिन्न मशीनों पर अलग-अलग हैश का कारण बनता है। सही रेखा find . -type f \( -exec sha1sum "$PWD"/{} \; \) | awk '{print $1}' | sort | sha1sum@allquixotic
alper

1
इसके अलावा, फ़ाइलों का हैश क्रम में होना चाहिए जो अलग-अलग मशीनों पर क्रमबद्ध भिन्न होने पर अलग-अलग हैश का कारण होगा।
alper

40

मुझे आम तौर पर "खोज | xargs" पैटर्न पसंद है, जैसे:

find ./path/to/directory/ -type f -print0  | xargs -0 sha1sum

यदि फ़ाइल नाम में रिक्त स्थान हैं, तो आपको "-print0" और "-0" का उपयोग करना होगा।

हालाँकि, यह "find -exec cmd {}" पैटर्न के समान है।

यहां दो पैटर्न की तुलना करते हुए एक चर्चा देखें: https://stackoverflow.com/questions/896808/find-exec-cmd-vs-xargs


आपके उत्तर में केवल फाइलों की हैश है। फ़ोल्डर का हैश का उपयोग करके प्राप्त किया जाना चाहिए find . -type f -print0 | xargs -0 sha1sum | awk '{print $1}' | sha1sum
alper

5

अद्यतन: जब से मैंने इस उत्तर को पोस्ट किया है, कुछ साल हो गए हैं और इस बीच मैंने कई बार यहां प्रस्तुत की गई स्क्रिप्ट को फिर से लिखा और सुधार किया है। मैंने नई स्क्रिप्ट को एक नए उत्तर के रूप में प्रतिष्ठित करने का निर्णय लिया है। मैं इसे इस पर अत्यधिक अनुशंसा करूंगा।

परिचय

मैंने देखा है कि जिस क्रम में एक निर्देशिका के भीतर पाया गया कमांड आउटपुट तत्वों को अलग-अलग विभाजनों पर समान निर्देशिकाओं के भीतर बदलता रहता है। यदि आप उसी निर्देशिका के हैश की तुलना कर रहे हैं, तो आपको इस बारे में चिंता करने की ज़रूरत नहीं है, लेकिन यदि आपको यह सुनिश्चित करने के लिए हैश मिल रहा है कि कॉपी के दौरान कोई फ़ाइल छूटी या दूषित नहीं हुई, तो आपको इसके लिए एक अतिरिक्त लाइन शामिल करने की आवश्यकता है निर्देशिका की सामग्री को छाँटना और यह तत्व है। उदाहरण के लिए, मैथ्यू बोहन्सक का उत्तर काफी सुरुचिपूर्ण है:

find ./path/to/directory/ -type f -print0  | xargs -0 sha1sum

लेकिन अगर आप इसका उपयोग कॉपी किए गए डायरेक्टरी की तुलना करने के लिए कर रहे हैं तो यह मूल है, आप आउटपुट को एक txt फ़ाइल में भेज देंगे, जिसकी आप अन्य निर्देशिका से आउटपुट सूची की तुलना करेंगे Kom Kom या WinMerge का उपयोग करके या बस प्रत्येक लिस के हैश को प्राप्त करके। । बात यह है कि जिस क्रम में खोज उपकरण आउटपुट करेगा, वह सामग्री एक निर्देशिका से दूसरी में भिन्न हो सकती है, कोम्पर कई अंतरों को संकेत देगा क्योंकि हैश उसी क्रम में कैलकल्चर नहीं थे। यदि आप 30000 फ़ाइलों के साथ काम कर रहे हैं तो छोटी निर्देशिकाओं के लिए कोई बड़ी बात नहीं है। इसलिए, आपके पास दो निर्देशिकाओं के बीच हैश सूचियों की तुलना करना आसान बनाने के लिए आउटपुट को छाँटने के अतिरिक्त चरण हैं।

find ./path/to/directory/ -type f -print0  | xargs -0 sha1sum > sha1sum_list_unsorted.txt
sort sha1sum_list_unsorted.txt > sha1sum_list_sorted.txt

यह आउटपुट को सॉर्ट करेगा ताकि विभिन्‍न प्रोग्राम को चलाते समय एक ही हैश वाली फाइलें उसी तर्ज पर हों (बशर्ते कि कोई भी फाइल नई डायरेक्टरी को याद न कर रही हो)।

और SCRIPT पर ...

यहाँ एक स्क्रिप्ट है जो मैंने लिखी है। यह वही काम करता है जो खोज / xarg उत्तर करता है, लेकिन यह sha1sum (उन्हें उसी निर्देशिका में रखते हुए) प्राप्त करने से पहले फ़ाइलों को सॉर्ट करेगा। स्क्रिप्ट की पहली पंक्ति निर्देशिका की सभी फ़ाइलों को पुनरावर्ती रूप से ढूँढती है। अगले एक वर्णानुक्रम में परिणामों को क्रमबद्ध करता है। निम्न दो, सॉर्ट की गई सामग्री को लेता है और सॉर्ट की गई सूची में फ़ाइलों के लिए एक sha1sum और उद्धरण चिह्नों को जोड़ता है, जिससे एक बड़ी शेल स्क्रिप्ट बनती है जो प्रत्येक फ़ाइल को एक बार में गणना करती है, वह इसे content_sha1sc.txt पर आउटपुट करती है।

#!/bin/bash
find . -type f > content.txt
sort content.txt > content_sorted.txt
awk '{print "sha1sum \""$0}' content_sorted.txt > temp.txt
awk '{print $0"\""}' temp.txt > get_sha1.sh
chmod +x get_sha1.sh
./get_sha1.sh > content_sha1sum.txt
rm content.txt
rm content_sorted.txt
rm temp.txt
rm get_sha1.sh
xdg-open content_sha1sum.txt

उम्मीद है की यह मदद करेगा।


जब सभी फ़ाइल नामों की कुल लंबाई कमांड लाइन के भीतर फिट होती है, तो पाइपिंग sort -z( --zero-terminated) के माध्यम से फाइल का एक गुच्छा के साथ गड़बड़ करने की तुलना में आसान होता है।
एंटोन सैमसनोव

@AntonSamsonov यह एक बहुत पुरानी स्क्रिप्ट है, मैं उस समय स्क्रिप्टिंग सीख रहा था। मैं तब से इसे कई बार लिख चुका हूँ। आपकी टिप्पणी के संबंध में, शून्य समापक छँटाई करते समय क्या करता है: मैं छँटाई के आदमी पृष्ठ को पढ़ता हूँ। वे कहते हैं कि शून्य समाप्ति एक पंक्ति के अंत में एक नई बाइट के बजाय एक शून्य बाइट चिपक जाती है। वह क्या पूरा करता है?
thebunnyrules

मैंने इस स्क्रिप्ट के लिए एक अलग उत्तर के रूप में एक अद्यतन पोस्ट किया है: superuser.com/questions/458326/…
thebunnyrules

4

परिचय

कुछ साल पहले, मैंने एक ऐसी स्क्रिप्ट लिखी और प्रस्तुत की (इस थ्रेड में) जो वर्तमान निर्देशिका संरचना में सभी अलग-अलग फाइलों के हैश हस्ताक्षर की जांच कर सकती है और इसे एक टेक्स्ट फाइल में एक सूची के रूप में आउटपुट कर सकती है।

तब से, मैंने इस सूत्र को कई बार परिष्कृत किया है। मैंने अपनी नई और बेहतर स्क्रिप्ट को एक अलग उत्तर के रूप में यहां फिर से पोस्ट करने का फैसला किया है। यह sha256 के लिए लिखा गया है, लेकिन कोई भी अभी भी sha1 का उपयोग करना चाहता है, एक सरल खोज कर सकता है और g1it में बदलकर sha256 को sha1 के साथ बदल सकता है। व्यक्तिगत रूप से, मैंने कुछ वर्षों के लिए sha1 का उपयोग नहीं किया है और मैं इसे अनुशंसित नहीं करूंगा क्योंकि यह पुरातन हो गया है और Google ने प्रदर्शित किया है कि यह कैसे समझौता किया जा सकता है

यहाँ मेरी नई स्क्रिप्ट है:

  1. आप बस उस निर्देशिका में जा कर स्क्रिप्ट का उपयोग कर सकते हैं जिसे आप हैश और इनपुट करना चाहते हैं:

    sha256rec

    वैकल्पिक रूप से, आप इस स्क्रिप्ट को किसी अन्य निर्देशिका से कॉल कर सकते हैं:

    sha256rec "/path/to/target/directory/you/want/hash"
  2. यदि आप वर्तमान डायर में विशेषाधिकार लिखते हैं तो स्क्रिप्ट का पता चल जाएगा। यदि आप करते हैं, तो परिणाम वर्तमान निर्देशिका में सहेजे जाएंगे। यदि आपके पास विशेषाधिकार नहीं हैं या यदि आपकी वर्तमान निर्देशिका केवल-पढ़ने की प्रणाली (जैसे कि cdrom) में है, तो परिणाम वर्तमान उपयोगकर्ता के घर निर्देशिका में सहेजे जाएंगे।

  3. स्क्रिप्ट का पता चलेगा कि क्या कुछ उप निर्देशिकाएं वर्तमान उपयोगकर्ता विशेषाधिकारों तक पहुंच योग्य नहीं हैं। यदि सभी पठनीय हैं, तो विशेषाधिकार का कोई उत्थान नहीं होता है, यदि वे नहीं हैं, तो उपयोगकर्ता के विशेषाधिकार जड़ तक बढ़ जाते हैं।

  4. ढूँढें का उपयोग वर्तमान dir संरचना की सभी फ़ाइलों को खोजने के लिए किया जाता है (सभी उप-निर्देशिकाओं सहित)। सॉर्ट का उपयोग यह सुनिश्चित करने के लिए किया जाता है कि परिणाम वर्णानुक्रम में आउटपुट किए जाते हैं। परिणामी सूची sha256sum से गुजरती है और एक पाठ फ़ाइल में आउटपुट की जाती है।

  5. पुरानी स्क्रिप्ट लिखने के बाद से मैंने एक डिज़ाइन दर्शन को अपनाया है कि अस्थायी फ़ाइलें बुराई हैं और जब संभव हो तो उन्हें टालना चाहिए क्योंकि वे उपयोगकर्ताओं को दुर्भावनापूर्ण तृतीय पक्षों द्वारा स्नूपिंग और छेड़छाड़ करने के लिए छोड़ देते हैं। इसलिए इस नई स्क्रिप्ट में सभी डेटा को अंतिम मिनट तक चर के रूप में हेरफेर किया जाता है, जहां परिणाम एक पाठ फ़ाइल के रूप में आउटपुट होते हैं।

  6. परिणामी फ़ाइल ही हैशेड है और टर्मिनल में पाथ / हैश आउटपुट हैं। मैं एक पुराने स्कूल के ऑफ़लाइन कैमरे के साथ इन हैश की तस्वीरें लेना सुनिश्चित करना चाहता हूं ताकि बाद की तारीख में इसका उल्लेख करने पर परिणाम फ़ाइल के साथ छेड़छाड़ न हो सके।

  7. पुरानी रिजल्ट फाइलों को टैली में नजरअंदाज कर दिया जाता है। यह परिणामों की तुलना को आसान बनाता है।

मेरी स्क्रिप्ट चलाते समय टर्मिनल आउटपुट का एक उदाहरण है:

kernelcrunch@ubuntu:/usr/src/linux-headers-4.13.0-16-generic$ sha256rec
======================================================================= 
sha256rec:         
=======================================================================        
Current Folder : /usr/src/linux-headers-4.13.0-16-generic   
Target Folder  : /usr/src/linux-headers-4.13.0-16-generic
Output File    : /home/kernelcrunch/000_sha256sum_recurs_linux-headers-4.13.0-16-generic_d_22-04-2018_t_02.17.txt


Seems you're currently in either a Read-Only system or a root owned directory as a regular user. You can find the hash results in your home folder.
f3ddb06212622c375c6bcc11bd629ce38f6c48b7474054ca6f569ded4b4af9d8  /home/kernelcrunch/000_sha256sum_recurs_linux-headers-4.13.0-16-generic_d_22-04-2018_t_02.17.txt
Operation Length: 10 Seconds.
=======================================================================
kernelcrunch@ubuntu:/usr/src/linux-headers-4.13.0-16-generic$ 

यहाँ आउटपुट का एक स्निपेट है जो 000_sha256sum_recurs_linux-headers-4.13.0-16-generic_d_22-04-2018_t_02.17.txt में पाया जा सकता है:

79c3f378a42bd225642220cc1e4801deb35c046475bb069a96870ad773082805  ./.9491.d
2e336c69cde866c6f01a3495048d0ebc2871dd9c4cb5d647be029e0205d15ce6  ./.config
174f23ff7a7fba897bfb7cf17e9a501bcecacf7ef0c0d5cf030414c1e257d4e3  ./.config.old
389d83f546b250304a9a01bb3072ff79f9d9e380c8a2106cadbf714a872afe33  ./.missing-syscalls.d
035dc77da819101cb9889b4e515023dddd2c953f00d2653b87c6196a6560903e  ./Module.symvers
b28054d7995233e6d003ceb9ed119a0b3354f5ccf77b8d687fc0353ae3c5bfb8  ./arch/x86/include/generated/asm/.syscalls_32.h.cmd
01cf821170e3e6e592e36a96e8628377151c762ac2ee3210c96004bfaef22f5f  ./arch/x86/include/generated/asm/.syscalls_64.h.cmd
111efa83187c58a74a9b0170fd496b497b0682d109a7c240c17e2ffcc734f4f4  ./arch/x86/include/generated/asm/.unistd_32_ia32.h.cmd
fcba4e8abf9e95472c31708555db844ac43c87260fb0ba706b6f519404bf9aba  ./arch/x86/include/generated/asm/.unistd_64_x32.h.cmd
3264438a54cbf7e62b05d38a93c5df8fe4202ac782a5d83ed202cba9eee71139  ./arch/x86/include/generated/asm/.xen-hypercalls.h.cmd
4bd7a45837da7de379b87242efe562ce06bf9d8ab8f636c205bb5ef384c8f759  ./arch/x86/include/generated/asm/clkdev.h
0d96461abd23bbf2da522822948455413a345f9ef8ac7a7f81c6126584b3c964  ./arch/x86/include/generated/asm/dma-contiguous.h
b1a54c24a12ce2c0f283661121974436cdb09ae91822497458072f5f97447c5d  ./arch/x86/include/generated/asm/early_ioremap.h
dd864107295503e102ea339e0fd4496204c697bdd5c1b1a35864dfefe504a990  ./arch/x86/include/generated/asm/mcs_spinlock.h
782ce66804d000472b3c601978fa9bd98dcf3b2750d608c684dc52dd1aa0eb7e  ./arch/x86/include/generated/asm/mm-arch-hooks.h
cd9913197f90cd06e55b19be1e02746655b5e52e388f13ec29032294c2f75897  ./arch/x86/include/generated/asm/syscalls_32.h
758ce35908e8cfeec956f57a206d8064a83a49298e47d47b7e9a7d37b5d96d59  ./arch/x86/include/generated/asm/syscalls_64.h
1147ca3a8443d9ccbdf9cd1f4b9b633f0b77f0559b83ec5e4fa594eadb2548be  ./arch/x86/include/generated/asm/unistd_32_ia32.h
ca5223fbf8f03613a6b000e20eb275d9b8081c8059bc540481a303ce722d42f3  ./arch/x86/include/generated/asm/unistd_64_x32.h
31703052c0d2ab8fe14b4e5dfcc45fcbd5feb5016b0a729b6ba92caa52b069e2  ./arch/x86/include/generated/asm/xen-hypercalls.h
c085ff1b6e9d06faa3fc6a55f69f9065c54098d206827deec7fe0a59d316fc99  ./arch/x86/include/generated/uapi/asm/.unistd_32.h.cmd
7929c16d349845cebb9e303e0ff15f67d924cac42940d0f7271584f1346635fc  ./arch/x86/include/generated/uapi/asm/.unistd_64.h.cmd
9aa492c5a75f5547f8d1dc454bef78189b8f262d1c4b00323a577907f138a63e  ./arch/x86/include/generated/uapi/asm/.unistd_x32.h.cmd
f568e151bbbb5d51fd531604a4a5ca9f17004142cd38ce019f0d5c661d32e36b  ./arch/x86/include/generated/uapi/asm/unistd_32.h
c45cf378498aa06b808bb9ccf5c3c4518e26501667f06c907a385671c60f14ae  ./arch/x86/include/generated/uapi/asm/unistd_64.h
a0088d8d86d7fd96798faa32aa427ed87743d3a0db76605b153d5124845161e2  ./arch/x86/include/generated/uapi/asm/unistd_x32.h
e757eb6420dffa6b24b7aa38ca57e6d6f0bfa7d6f3ea23bbc08789c7e31d15fa  ./arch/x86/kernel/.asm-offsets.s.cmd
f9e703e4f148d370d445c2f8c95f4a1b1ccde28c149cff2db5067c949a63d542  ./arch/x86/kernel/asm-offsets.s
7971fb3e0cc3a3564302b9a3e1ad188d2a00b653189968bbc155d42c70ce6fbf  ./arch/x86/purgatory/.entry64.o.cmd
8352d79fe81d2cf694880f428e283d79fd4b498cea5a425644da25a9641be26b  ./arch/x86/purgatory/.kexec-purgatory.c.cmd
37f3edbee777e955ba3b402098cb6c07500cf9dc7e1d44737f772ac222e6eb3e  ./arch/x86/purgatory/.purgatory.o.cmd
bb8b895cbd2611b69e2f46c2565b4c2e63a85afb56cff946a555f2d277ee99b2  ./arch/x86/purgatory/.purgatory.ro.cmd
bcc2365c9d3d027f1469806eb4f77b0f3ede6eb0855ea0fcd28aa65884046a54  ./arch/x86/purgatory/.setup-x86_64.o.cmd
872229f334fdcc8562e31b9f6581008c1571ac91f12889cd0ff413590585155a  ./arch/x86/purgatory/.sha256.o.cmd
6fb0cbef120aadee282f7bc3b5ea2f912980f16712281f8f7b65901005194422  ./arch/x86/purgatory/.stack.o.cmd
cd1b61063ae3cf45ee0c58b2c55039f3eac5f67a5154726d288b4708c4d43deb  ./arch/x86/purgatory/.string.o.cmd
e5826f0216fd590972bbc8162dd175f87f9f7140c8101505d8ca5849c850ec91  ./arch/x86/purgatory/entry64.o

(यह इस तरह की एक और 7000+ लाइनों के लिए आगे बढ़ता है लेकिन आपको यह विचार मिलता है)

इंस्टालेशन

  1. एक टर्मिनल खोलें और निम्नलिखित कमांड इनपुट करें:

    cd /usr/bin
    sudo su
    echo '#!/bin/bash'> /usr/bin/sha256rec
    chmod +x /usr/bin/sha256rec
    touch /usr/bin/sha256rec
    nano /usr/bin/sha256rec
  2. नैनो में, पेस्ट करने के लिए Shif + Ctrl + v का उपयोग करें। Ctrl-O और सेव करने के लिए एंटर करें। सीटीआर-एक्स से बाहर निकलता है। वहां मेरी स्क्रिप्ट चिपकाएँ:

(#! / बिन / बैश के बाद पेस्ट करें)

  #FUNCTIONS OR FUNCTYOU?
  function s_readonly { err=$(date +%s%N); cd "$1"; mkdir $err 2> /tmp/$err; rmdir $err 2>/dev/null; echo $(cat /tmp/$err|grep -i "Read-only file system"|wc -l);shred -n 0 -uz /tmp/$err; }
  function w_denied { echo $(err=$(date +%s%N); cd "$1"; mkdir $err 2> /tmp/$err; rmdir $err 2>/dev/null; cat /tmp/$err|grep -i "Permission denied"|wc -l;shred -n 0 -uz /tmp/$err); }
  function r_denied { echo $(err=$(date +%s%N); cd "$1" >/dev/null 2> /tmp/$err; find . >/dev/null 2>> /tmp/$err; cat /tmp/$err|grep -i "Permission denied"|wc -l;shred -n 0 -uz /tmp/$err); }
  function rando_name { rando=$(echo $(date +%s%N)|sha256sum|awk '{print $1}'); rando=${rando::$(shuf -i 30-77 -n 1)}; echo $rando;}
  function ms0 { ms0=$(($(date +%s%N)/1000000)); }; function mstot { echo $(($(($(date +%s%N)/1000000))-$ms0));}
  function s0 { s0=$(date +%s); }; function stot { echo $(($(date +%s)-$s0));}
  s0

  #CHECK IF A TARGET DIR WAS SPECIFIED (-t= or --target= switch)
  if [ ! -z "$1" ]; then arg1="$1"; arg1_3=${arg1::3}; arg1_9=${arg1::9};fi
  if [ "$arg1_3" = "-t=" -o "$arg1_9" = "--target=" ]; then 
    switch=$(echo $arg1|awk -F '=' '{print $1}')
    switch_chr=$((${#switch}+1))
    target=${arg1:$switch_chr}
    current=$(pwd)
    cd "$target"
    arg1="" #<- cancels the not path in the find line
  else
    current=$(pwd)
    target=$(pwd) 
  fi

  echo -e  "=======================================================================\
    \nsha256rec: \
          \n=======================================================================\
          \nCurrent Folder : $current \
    \nTarget Folder  : $target"

  #GETS DEFAULT_USER, ASSUME'S YOU'RE USER 1000, IF 1000 DOESN'T EXIST SEARCHES 999, THEN 1001, 1002
  default_user=$(awk -v val=1000 -F ":" '$3==val{print $1}' /etc/passwd)
  if [ -z "$default_user" ]; then default_user=$(awk -v val=999 -F ":" '$3==val{print $1}' /etc/passwd); fi
  if [ -z "$default_user" ]; then default_user=$(awk -v val=1001 -F ":" '$3==val{print $1}' /etc/passwd); fi
  if [ -z "$default_user" ]; then default_user=$(awk -v val=1002 -F ":" '$3==val{print $1}' /etc/passwd); fi

  if [ "$(users | wc -l)" = "1" ]; then USER=$(users|awk '{print $1}'); else USER=$default_user;fi #not perfect but meh...

  #running rando_name in this very specific spot between USER detection and Permission detection, some interfers somehow with detection functions... 
  #the rando function placed underneath the user detection is somehow turning c=$current from the dir path to whatever rando_name puts out.

  #FIGURE OUT WHERE TO PUT HASH LIST
  hash_file="000_sha256sum_recurs_${target##*/}_d_$(date +%d-%m-20%y)_t_$(date +%H.%M).txt"
  if [ $(s_readonly "$current") -gt 0 -o $(w_denied "$current") -gt 0 ]; then if [ "$(whoami)" != root ]; then dest="/home/$(whoami)";echo -e "Output File    : $dest/$hash_file\n\n";echo "Seems you're currently in either a Read-Only system or a root owned directory as a regular user. You can find the hash results in your home folder."; else dest="/home/$USER";echo -e "Output File    : $dest/$hash_file\n\n";echo "Seems you're currently a Read-Only system. You can find the hash results in $USER's home folder.";fi; else dest="$current";echo -e "Output File    : $dest/$hash_file\n\n";echo "Results will be saved here.";fi



  #CAN REGULAR USER ACCESS TARGET DIR? ARE ALL IT'S SUBDIRS READABLE?
  if [ $(r_denied "$target") -gt 0 ]; then sudo=sudo; echo "Some folder were not read-able as a regular user. User elevation will be required.";fi

  #PERFORM RECURSIVE HASHING
  command=$($sudo find . -type f -not -type l -not -path "$arg1"  -not -path "$2"  -not -path "$3" -not -path "$4"  -not -path "$5"  -not -path "$6" -not -path "$7"  -not -path "$8"  -not -path "$9" |grep -v "\./000_sha"|sort|awk "{print \"$sudo sha256sum \\\"\"\$0}"|awk '{print $0"\""}'|tr '\n' ';')
  eval $command > "$dest/$hash_file"

  sha256sum "$dest/$hash_file"
  echo "Operation Length: $(stot) Seconds."
  echo -e  "======================================================================="



  if [ "$target" != "$current" ]; then cd "$current";fi


  exit
  #||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  #||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  #||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  #||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  1. जब आप नैनो से बाहर निकलते हैं, तो प्रवेश करके उन्नत स्थिति से बाहर निकलना सुनिश्चित करें:

    exit

अंतिम विचार

  1. यह केवल तभी काम करेगा जब आपके पास बैश इंस्टॉल हो। मैनें हेरफेर के विकल्प के लिए कुछ सिंटैक्स का उपयोग किया है जो श, डैश, क्श या zsh के साथ काम नहीं करता है। आप अभी भी अपने दैनिक ड्राइवरों के रूप में किसी भी अन्य गोले का उपयोग कर सकते हैं लेकिन बैश स्थापित करने की आवश्यकता है।

  2. आउटपुट सूचियों की तुलना विभिन्न उपकरणों से की जा सकती है जैसे: (टर्मिनल में), sdiff (और ग्राफिकल) diffuse, kdiff, winmerge।

  3. मेरी फ़ाइल पथ के आधार पर आउटपुट को छाँटती है, ताकि मनुष्यों द्वारा इसे पढ़ा जा सके। मैंने देखा है कि अलग-अलग डिस्ट्रोस में अलग-अलग तरीके से काम करने वाली कमांड। उदाहरण के लिए, एक डिस्ट्रो कैपिटल पत्रों में गैर-कैप पर प्राथमिकता दी गई और दूसरे में उन्होंने नहीं किया। यह आउटपुट फाइलों के लाइन ऑर्डर को प्रभावित करता है और फाइलों की तुलना करना मुश्किल बना सकता है। यदि आप हमेशा एक ही डिस्ट्रो में स्क्रिप्ट का उपयोग कर रहे हैं तो यह कोई समस्या नहीं पेश करनी चाहिए, लेकिन हो सकता है कि दो अलग-अलग वातावरणों में हैश सूचियाँ उत्पन्न हुई हों। यह हैश फ़ाइलों को एक अतिरिक्त समय छाँटकर आसानी से निकाल लेता है ताकि पंक्तियाँ पाथ के बजाय हैश द्वारा आदेशित हो जाएँ:

     cat 000_sha256sum_oldhashlist|sort> ./old
     cat 000_sha256sum_newhashlist|sort> ./new
     sha256sum ./old ./new; diff ./old ./new

एक और अधिक मजबूत कुटिया लाइन होगा #!/usr/bin/env bash- यह, साथ ही अन्य निर्देशिका में बैश मिलेगा उत्तरार्द्ध में स्थापित किया जा सकता है क्योंकि / usr / bin बजाय / bin , उदाहरण के लिए, इस बीच env में हो जाता है / usr / bin हर समय जहाँ तक मैंने ध्यान दिया। यह भी ध्यान देने योग्य है कि, चूंकि आपको बैश की आवश्यकता होती है, आप [[ blah-blah ]]अधिक सामान्य [ blah-blah ]एकल-ब्रैकेट संस्करण के बजाय डबल-ब्रैकेट सशर्त अभिव्यक्ति का उपयोग कर सकते हैं ।
एंटोन सैमसनोव

संकेत के लिए धन्यवाद। मैंने अभी [[कंडीशन्स] को पूरा किया। वे वास्तव में उपयोगी दिखते हैं।
thebunnyrules

SHA1 के बारे में समझौता किए जाने की चिंता वास्तव में अखंडता की पुष्टि करने के बाद फाइलों की तुलना करने के मामले में लागू नहीं है। एक फ़ाइल के पारगमन में भ्रष्ट होने की संभावना है, लेकिन अभी भी समान SHA1 होने के कारण व्यावहारिक रूप से शून्य हैं। यदि आपको संदेह है कि किसी हमलावर के पास टकराने वाले SHA1 के साथ एक अलग फ़ाइल बनाने के लिए पर्याप्त समय हो सकता है, तो SHA256 का उपयोग करें, लेकिन फ़ाइलों की प्रतिलिपि बनाने के विशिष्ट मामले के लिए, वह SHA1 या MD5 की तुलना में अधिक धीमी और धीमी है
डैन डस्केल्सस्कू

आप अपने तर्क खुद के खिलाफ इस्तेमाल किया जा सकता है। यदि आप सामान्य (गैर हमले से संबंधित) भ्रष्टाचार के बारे में चिंतित हैं, तो sha1 ही ओवरकिल है। आप md5 / crc32 का उपयोग करके तेजी से परिणाम प्राप्त कर सकते हैं। किसी भी स्थिति में (छेड़छाड़ का पता लगाने या भ्रष्टाचार) sha1 एक अच्छा फिट नहीं है। व्यक्तिगत रूप से, मैं इन हैश सूचियों को दोनों परिदृश्यों के लिए उपयोग करता हूं और जब से मैंने sha256 में अपग्रेड किया है तब से किसी भी उल्लेखनीय प्रदर्शन पर ध्यान नहीं दिया है, लेकिन मैं मेगा सर्वर भी नहीं चला रहा हूं। जैसा कि मैंने उत्तर में कहा है, आप अपने sha256sum कमांड को अपने इच्छित स्थान से उपयोग करने के लिए स्वतंत्र हैं, जिसे आप चाहते हैं: sha1sum, md5sum, b2sum, crc32 ...
thebnnyrules

1

यह मेरे लिए काम करने लगता है:

find . \( -not -name . \) -type f -exec cat {} + | sha1sum

EDIT: यह केवल डायरेक्टरी ट्री में मौजूद सभी फाइलों को sha1sum करेगा। यदि किसी निर्देशिका का नाम बदल दिया गया है, तो यह उसे पकड़ नहीं पाएगा। शायद कुछ इस तरह:

find . -exec sha1sum {} + 2>&1 | sha1sum

कर लेंगे। हालांकि दूसरे के रूप में एक ही जवाब के बारे में


1

फ़ाइल सामग्री और मेटाडेटा को हैश करने के लिए टार का उपयोग करने के लिए एक और चाल हो सकती है:

tar -cf - ./path/to/directory | sha1sum

बहुत बुरा है कि मेरे पास केवल एक वोट है
166_MMX

1
यह काम नहीं करता। टार में कुछ OSs (जैसे OSX) के लिए टाइमस्टैम्प शामिल है और प्रत्येक रन में sha1sum अलग होगा।
srossross

@Srossross ने क्या कहा। साथ ही, यदि आपके पास दो मेजबानों पर टार के विभिन्न संस्करण हैं, तो आउटपुट अलग-अलग होंगे।
डेन डस्केल्सस्कु

1

तेज, मजबूत और पोर्टेबल समाधान

इसमें शामिल कुछ अन्य समाधानों के विपरीत tar, नीचे दिया गया समाधान किसी भी मशीन पर काम करता है जिसमें मानक यूनिक्स उपयोगिताओं हैं, और चेकसमिंग को समानांतर करके सभी अन्य समाधानों की तुलना में तेज है:

find . -type f | xargs -d'\n' -P0 -n1 md5sum | sort -k 2 | md5sum

चूंकि यह अंत में एक प्रकार का उपयोग करता है, कोई वास्तविक समय प्रगति नहीं है, इसलिए केवल कमांड को चलाने दें।

यहाँ तर्क क्या करते हैं:

  • find . -type f वर्तमान निर्देशिका और इसके उपनिर्देशिकाओं में सभी फाइलों को ढूँढता है
  • xargs -d'\n'लाइनों में खोज के उत्पादन को विभाजित करता है (यदि आप उन में newlines के साथ फ़ाइलों की अपेक्षा करते हैं, तो सामान्य करें find -print0 | xargs -0)
  • -P0 n1md5sumमशीन द्वारा समर्थित प्रक्रियाओं की अधिकतम संख्या (मल्टी-कोर!) का उपयोग करके समानांतर प्रक्रियाओं में चलता है ।
  • sort -k 2md5sumआउटपुट के दूसरे क्षेत्र के अनुसार , जो प्रत्येक फ़ाइल का पूर्ण पथ है (पहला MD5 है)
  • अंतिम md5sumफ़ाइल चेकसमों की सूची के एक चेकसम की गणना करता है, इसलिए आपको एक लाइन पर पूरी निर्देशिका का एक चेकसम मिलता है, जिसे आप टर्मिनल विंडो में आसानी से तुलना कर सकते हैं

इससे पहले कि आप कहें कि "एमडी 5 से समझौता किया गया है", ध्यान रखें कि आपका खतरा मॉडल क्या है। क्या आप यह सुनिश्चित करने की कोशिश कर रहे हैं कि आपके द्वारा किसी अन्य होस्ट या डिस्क से कॉपी की गई फाइलें बरकरार हैं? तब एमडी 5 पर्याप्त से अधिक है, क्योंकि एक फाइल के पारगमन में भ्रष्ट होने की संभावना है लेकिन एक ही एमडी 5 होने शून्य हैं। लेकिन अगर आप किसी हमलावर को एक फ़ाइल को एक अलग चेकिंग के साथ टकराकर बदलने का समय दे रहे हैं, तो उपयोग करें sha256sum। नकारात्मक पक्ष यह है कि SHA फ़ंक्शन MD5 की तुलना में धीमा हैं

वास्तविक समय क्रिया की प्रगति

अंत में, यदि आप वास्तविक समय की प्रगति देखना चाहते हैं, तो चेकसम के लिए एक अस्थायी फ़ाइल का उपयोग करने के लिए पाइपलाइन को संशोधित करें:

find . -type f | xargs -d\\n -P0 -n1 md5sum | tee /tmp/sums && sort -k 2 /tmp/sums | md5sum

(ध्यान दें कि sortसही findकाम करने के बाद काम नहीं करेगा, क्योंकि xargs -P0समानांतर md5sum, और परिणाम क्रम से बाहर आ सकते हैं।)

आदेश के इस संस्करण में भी आप की सुविधा देता है diff दो /tmp/sumsफ़ाइलों और देखें कि कौन फ़ाइलें अलग (अगर यह एक ही मशीन पर है दूसरा एक नाम बदलने के लिए सुनिश्चित कर लें)।


0

बल्कि एक बहुत बड़ी फ़ाइल है जिसमें सभी हैशेड जानकारी है जो मैं एक पेड़ के प्रत्येक फ़ोल्डर में एक फ़ाइल बनाने के तरीके की तलाश में था। मैंने यहाँ टिप्पणियों से कुछ प्रेरणा ली। मेरा यहाँ पोस्ट किया गया की तुलना में थोड़ा अधिक जटिल है। मैं फ़ाइल रोटेशन का उपयोग करता हूं लेकिन नए खिलाड़ियों के लिए यह सबसे कम जटिल है। इस संस्करण में यह नए लोगों के साथ पुराने चेक रकमों को अधिलेखित कर देगा। आप इसे कितनी बार चलाते हैं और। गहराई ’की आवश्यकता के आधार पर 2-3 संस्करण रखना अच्छा हो सकता है।

[उपयोगकर्ता @ मेजबान बिन] $ बिल्ली मक्षिंदर 
#! / Bin / पानी का छींटा
cd $ 1
sha512sum *> .sha512sum

[उपयोगकर्ता @ होस्ट बिन] $ खोज / var / tmp -type d -print0 | xargs -0 -आई मक्षिन्दर {}

ध्यान दें कि मेरे उद्देश्यों के लिए, मक्सिंदिर एक अलग घटक है, क्योंकि मेरे लिए नए फ़ोल्डर में फ़ाइलों का हैश या हाल ही में परिवर्तित किए गए एक की आवश्यकता हो सकती है। यदि आवश्यक हो तो यह सब एक स्क्रिप्ट में जोड़ा जा सकता है।

बाकी को पाठक के लिए एक अभ्यास के रूप में छोड़ दिया जाता है।


0

पिछले उत्तर पर आधारित :

find ./path/to/directory -print0 | LC_ALL=C sort --zero-terminated | tar --create --no-recursion --null --files-from /dev/stdin --file /dev/stdout --verbose --numeric-owner | sha1sum

  • स्थिर प्रकार
  • संख्यात्मक स्वामी और समूह आईडी
  • क्रिया की प्रगति
  • फ़ाइल नाम सुरक्षित

यह केवल एक फ़ाइल वाली प्रतिलिपि निर्देशिका पर काम नहीं करता था, और मुझे संदेह है कि ऐसा इसलिए था क्योंकि मैं रिमोट होस्ट पर टार (1.28) का थोड़ा पुराना संस्करण चला रहा था, स्थानीय होस्ट पर बनाम 1.29। दुर्भाग्यवश, टार 1.29 को एक्सनियल पर वापस नहीं भेजा गया है
दानस्केलस्कु

0

@allquixoticविभिन्न मशीनों पर एक ही हैश का जवाब नहीं है जो हमें सत्यापित करने और सुसंगत हैश करने में मदद नहीं करेगा।

find . -type f \( -exec md5sum "$PWD"/{} \; \)निम्नलिखित आउटपुट के बाद लाइन रिटर्न:

d41d8cd98f00b204e9800998ecf8427e  /home/helloWorld.c
24811012be8faa36c8f487bbaaadeb71  /home/helloMars.c

इसलिए अलग-अलग मशीनों पर रास्ता अलग होगा। awk '{print $1}'हमें पहला कॉलम प्राप्त करने में मदद करेगा, जिसमें केवल फाइलों का हैश है। बाद में हमें उन हैश को क्रमबद्ध करना होगा, जहां विभिन्न मशीनों पर ऑर्डर अलग-अलग हो सकते हैं, जिसके कारण दो से अधिक फाइलें होने पर अलग-अलग हैश भी हो सकते हैं।


समाधान:

मैक के लिए:

find ./path/to/directory/ -type f \( -exec md5 -q  "$PWD"/{} \; \) | awk '{print $1}' | sort | md5

लिनक्स के लिए:

find ./path/to/directory/ -type f \( -exec md5sum "$PWD"/{} \; \) | awk '{print $1}' | sort | md5sum | awk '{print $1}'
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.