rsync निर्देशिकाओं की तुलना करें?


63

क्या rsync के साथ दो निर्देशिकाओं की तुलना करना और केवल अंतर प्रिंट करना संभव है? एक ड्राई-रन विकल्प है, लेकिन जब मैं एक निश्चित स्तर पर वर्बोसिटी बढ़ाता हूं, तो तुलना की गई प्रत्येक फ़ाइल दिखाई जाती है।

ls -alRऔर diffयहाँ कोई विकल्प नहीं है, क्योंकि हर लाइन को अलग बनाने वाले स्रोत में हार्डलिंक हैं। (बेशक, मैं इस कॉलम को पर्ल के साथ हटा सकता हूं।)


जवाबों:


46

आपको संभवतः rsync -avun --deleteदोनों दिशाओं में कुछ चलाना होगा ।

लेकिन क्या आप वास्तव में पूरा करने की कोशिश कर रहे हैं?

अपडेट :

rsync -avun --delete $TARGET $SOURCE |grep "^deleting " आपको उन फ़ाइलों की एक सूची देगा जो लक्ष्य-निर्देशिका में मौजूद नहीं हैं।

"grep delet" क्योंकि प्रत्येक पंक्ति प्रिंट: delet ..file ing ..

rsync -avun $SOURCE $TARGET आपको "अलग" फ़ाइलों (नई फ़ाइलों सहित) की एक सूची देगा।


49

निल्स के उत्तर (Google के माध्यम से इस पार आने वाले किसी के लिए) को जोड़ने के लिए, डिफ़ॉल्ट रूप से rsyncकेवल फ़ाइल आकार और संशोधन समय की तुलना करके यह बताता है कि क्या कोई अंतर है। (यदि वे भिन्न हैं तो यह अधिक होता है, लेकिन यदि वे समान हैं, तो यह वहीं रुक जाता है।)

यदि आप वास्तविक फ़ाइल सामग्री की तुलना करना चाहते हैं , यहां तक ​​कि उन फ़ाइलों के लिए भी जिनके पास समान आकार और अंतिम संशोधन समय है, तो चेक -cको जोड़ने के rsyncलिए फ़ाइलों की तुलना करने के लिए बताने के लिए ध्वज जोड़ें ।

rsync -avnc $SOURCE $TARGET

( -uविकल्प उन फ़ाइलों को अनदेखा करने के लिए rsync को बताता है , जो $TARGETउस की तुलना में नए हैं $SOURCE, जो आप शायद नहीं चाहते हैं यदि आप सामग्री की तुलना कर रहे हैं।)


6
यदि आप केवल इस बात का ध्यान रखते हैं कि डेटा वही है जिसे आप --no-group --no-owner --no-perms --no-timesअपनी आवश्यकताओं के आधार पर जोड़ना चाहते हैं या इनमें से कुछ संयोजन बना सकते हैं।
फ्लुंगो

1
@flungo, या -aइसके बजाय निहित विकल्पों के एक सबसेट का उपयोग करें -a, जैसेrsync -rlDcnv --delete $SOURCE $TARGET
maxschlepzig

कृपया --deleteसूची को केवल मौजूदा फ़ाइलों में जोड़ें$TARGET
टॉम हेल

25

बस उन कम परिचितों के लिए rsync:

rsync -rvnc --delete ${SOURCE}/ ${DEST}
  • -n: सबसे महत्वपूर्ण बिट - कुछ भी मत बदलो;
  • -rc: केवल सामग्री की तुलना करें (अन्यथा उपयोग करें -ac);
  • -v : फाइलों को सूचीबद्ध करें)
  • --delete : एक सममितीय के लिए देखें, न कि एक-दिशात्मक अंतर।
  • अंत में, का /अर्थ है "निर्देशिका के अंदर देखो, और गंतव्य के लिए इसकी सामग्री की तुलना करें "।

यह एक सामान्य rsyncआउटपुट प्रिंट करेगा ,

  • हर "नई" फ़ाइल के लिए एक लाइन पर एक <फ़ाइल नाम> के साथ${SOURCE}
  • और प्रत्येक "नई" फ़ाइल के लिए एक "डिलीट <filename>" लाइन ${DEST}

  • यह कुछ चेतावनियों को भी प्रिंट कर सकता है, जैसे "नॉन-रेगुलर फ़ाइल <फ़ाइलनाम> को लंघन" सिम्बल के लिए।

पुनश्च। मुझे पता है कि यह एक भयानक PS है - लेकिन यह वास्तव में एक भीड़ में जोड़ा गया था। फिर भी, मैं शर्त लगा सकता हूं कि यह उपयोगी हो सकता है।


पी पी एस। वैकल्पिक रूप से, एक भी कर सकता था

find $SOURCE -type f -exec md5sum {} \; | tee source.md5
find $DEST   -type f -exec md5sum {} \; | tee dest.md5

यदि फ़ाइल नाम में नई लाइनें नहीं हैं, तो हम दोनों *.md5फ़ाइलों को सॉर्ट कर सकते हैं , और diffउन्हें। (यह केवल फाइलों के लिए काम करेगा, हालांकि, दोनों तरफ एक खाली निर्देशिका का पता नहीं लगाया जाएगा।)


15

आश्चर्यजनक रूप से 6 वर्षों में कोई जवाब नहीं -iविकल्प का उपयोग करता है या अच्छा उत्पादन देता है इसलिए यहां मैं जाऊंगा:

TLDR - बस मुझे कमांड दिखाओ

rsync -rin --ignore-existing "$LEFT_DIR"/ "$RIGHT_DIR"/|sed -e 's/^[^ ]* /L             /'
rsync -rin --ignore-existing "$RIGHT_DIR"/ "$LEFT_DIR"/|sed -e 's/^[^ ]* /R             /'
rsync -rin --existing "$LEFT_DIR"/ "$RIGHT_DIR"/|sed -e 's/^/X /'

आउटपुट को समझना

यहाँ आउटपुट का एक उदाहरण है:

L             file-only-in-Left-dir
R             file-only-in-right-dir
X >f.st...... file-with-dif-size-and-time
X .f...p..... file-with-dif-perms

हर पंक्ति के पहले वर्ण पर ध्यान दें:

  • L/ Rइसका मतलब है कि फ़ाइल / dir केवल Left या Right dir पर दिखाई देती है ।
  • Xउस फ़ाइल को दोनों पक्षों पर दिखाई देता है, लेकिन एक ही नहीं है (। जो मामले में अगले 11 वर्ण आप और अधिक जानकारी देने के का मतलब है s, tऔर pमें मतभेद को दर्शाती रों ize, टी IME और पी - कोशिश अधिक जानकारी के लिए क्रमश: ermissions man rsyncऔर के लिए खोज --itemize-changes) ।

अतिरिक्त विकल्प आप उपयोग करना चाह सकते हैं

यदि आप फ़ाइलों के स्वामी / समूह / अनुमतियों की तुलना करना चाहते हैं, तो क्रमशः विकल्प -o/ -g/ जोड़ दें -p। अंत में ध्यान दें कि डिफ़ॉल्ट रूप से rsync दो फ़ाइलों को समान मानता है यदि उनके पास समान नाम, समय और आकार है। यह बहुत तेज़ है और अधिकांश समय पर्याप्त से अधिक है, लेकिन यदि आप 100% सुनिश्चित करना चाहते हैं तो -cएक ही नाम, समय और आकार के साथ फ़ाइलों की सामग्री की तुलना भी करें।

TLDR - बस मुझे कॉल करने के लिए एक स्क्रिप्ट दें

यही पर है। इसे इस तरह बुलाओ

diff-dirs Left_Dir Right_Dir [options]

ऊपर दिए गए सभी विकल्प अनुभाग में "अतिरिक्त विकल्प जिन्हें आप उपयोग करना चाहते हैं" यहां भी लागू हो सकते हैं।

#!/bin/bash
# Compare two directories using rsync and print the differences
# CAUTION: options MUST appear after the directories
#
# SYNTAX
#---------
# diff-dirs Left_Dir Right_Dir [options]
#
# EXAMPLE OF OUTPUT
#------------------
# L             file-only-in-Left-dir
# R             file-only-in-right-dir
# X >f.st...... file-with-dif-size-and-time
# X .f...p..... file-with-dif-perms
#
# L / R mean that the file/dir appears only at the `L`eft or `R`ight dir. 
#
# X     means that a file appears on both sides but is not the same (in which
#       case the next 11 characters give you more info. In most cases knowing
#       that s,t,T and p depict differences in Size, Time and Permissions 
#       is enough but `man rsync` has more info
#       (look at the --itemize-changes option)
#
# OPTIONS
#---------
# All options are passed to rsync. Here are the most useful for the purpose
# of directory comparisons:
#
# -c will force comparison of file contents (otherwise only
#    time & size is compared which is much faster)
#
# -p/-o/-g will force comparison of permissions/owner/group

if [[ -z $2 ]] ; then
    echo "USAGE: $0 dir1 dir2 [optional rsync arguments]"
    exit 1
fi

set -e

LEFT_DIR=$1; shift
RIGHT_DIR=$1; shift
OPTIONS="$*"

# Files that don't exist in Right_Dir
rsync $OPTIONS -rin --ignore-existing "$LEFT_DIR"/ "$RIGHT_DIR"/|sed -e 's/^[^ ]* /L             /'
# Files that don't exist in Left_Dir
rsync $OPTIONS -rin --ignore-existing "$RIGHT_DIR"/ "$LEFT_DIR"/|sed -e 's/^[^ ]* /R             /'
# Files that exist in both dirs but have differences
rsync $OPTIONS -rin --existing "$LEFT_DIR"/ "$RIGHT_DIR"/|sed -e 's/^/X /'

यह कैसे काम करता है?

हम rsync को इस तरह बुला रहे हैं:

rsync -rin ...

हम हर फाइल के लिए आउटपुट की एक लाइन प्रिंट करने के लिए rsync को बताने के लिए -i( --itemize-changes) का उपयोग करते हैं जिसमें दो निर्देशिकाओं के बीच किसी भी अंतर के बारे में जानकारी होती है। हमें -nrsync के सामान्य व्यवहार को दबाने की आवश्यकता है (जो फ़ाइलों को कॉपी / डिलीट करके दो डायर को सिंक करने का प्रयास करना है)। हमें -rसभी फ़ाइलों / उप-डायरियों के लिए पुनरावर्ती रूप से काम करने की भी आवश्यकता है।

हम तीन बार rsync कहते हैं:

पहली कॉल : प्रिंट फ़ाइलें जो Dir_B में मौजूद नहीं हैं। हमें उन --ignore-existingफ़ाइलों को अनदेखा करने की आवश्यकता है जो दोनों तरफ मौजूद हैं।

rsync -rin --ignore-existing $DIR_A/ $DIR_B/

2 कॉल : बिल्कुल के रूप में पहले, लेकिन हम DIR_A / DIR_B के आदेश स्वैप।

तीसरा कॉल : अंत में हम --existingकेवल उन फाइलों की जांच करते हैं, जो दोनों dirs में दिखाई देती हैं।

rsync -rin --existing $DIR_A/ $DIR_B/

दूसरों के बारे में न जानें, लेकिन मैं आपकी स्क्रिप्ट का उपयोग कर रहा हूं। अच्छा कार्य! धन्यवाद
मरीनायो

7

मैं आपके प्रश्न से समझता हूं कि आप एलएस पर अंतर का उपयोग नहीं करना चाहते हैं , लेकिन आप निर्देशिका पर पुनरावृत्ति में भी भिन्नता का उपयोग कर सकते हैं:

diff -rq DIR1 DIR2

2

मुझे यह काम करने के लिए कुछ प्रयास करने में मदद मिली। निल्स के उत्तर की आवश्यकता होती है जो $TARGETएक अनुगामी में समाप्त होती है /, जैसा कि ョthat that that द्वारा समझाया गया है।

यहाँ एक संस्करण है जो स्पष्ट रूप से अनुगामी जोड़ता है /:

rsync -avun --delete ${TARGET}/ ${SOURCE}  | sed -ne 's/^deleting *//p'

यह उन फ़ाइलों की सूची देता है जो ${SOURCE}निर्देशिका के नीचे मौजूद हैं, लेकिन निर्देशिका से नीचे नहीं ${TARGET}

मैं आउटपुट लाइनों से sedअग्रणी को हटाने के लिए deleting, और केवल उन लाइनों को प्रिंट करने के लिए यहां उपयोग करता हूं ।

मैं rsyncविकल्प का उपयोग नहीं करता -cक्योंकि फ़ाइल सामग्री की तुलना मेरे उपयोग के मामलों के लिए बहुत धीमी होगी, और केवल फ़ाइल आकार और संशोधन समय की तुलना करना भी इन मामलों में पर्याप्त लगता है। मुझे यह संदेह करने का कोई कारण नहीं है कि मेरे कंप्यूटर घड़ी की विषम समस्याओं से पीड़ित हैं या कुछ दुर्भावनापूर्ण रूप से समय टिकटों को बदल दिया है। साथ ही, -cफ़ाइल को हटाने का निर्णय नहीं बदल सकता है, केवल फ़ाइल को अपडेट या रखने का निर्णय।

मैं भी उपयोग करें -uऔर -a(बजाय -rइतना है कि मैं बाद में कमांड लाइन का फिर से उपयोग और से चयनित निर्देशिका और फ़ाइलों की प्रतिलिपि करने के लिए इसे बदल सकते हैं), ${SOURCE}करने के लिए ${TARGET}इस तरह,:

rsync -avu ${SOURCE}/{dirA,dirB,fileX} ${TARGET}   # copy some files

0

मुझे ऐसा करने का एक और विचार है:

rsync -rn --out-format=FILEDETAIL::%n  $TARGET $SOURCE  | grep "^FILEDETAIL"

आप कमांड के आउटपुट के साथ "FILEDETAIL ::" का मिलान कर सकते हैं। इसके अलावा, आप स्ट्रिंग "FILEDETAIL ::" को बदल सकते हैं। "% N" फ़ाइल नाम है।

-r यह rsync को पुनरावर्ती निर्देशिकाओं को कॉपी करने के लिए कहता है।

-इससे rsync एक ट्रायल रन करता है जो कोई बदलाव नहीं करता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.