यह स्क्रिप्ट शेल बैकग्राउंड जॉब्स के उपयोग के माध्यम से , समान रूप से , होस्ट की एक मनमानी संख्या में, इनपुट निर्देशिकाओं की एक अनियंत्रित संख्या की नकल करेगी । यहाँ मैंने cpio का उपयोग किया है क्योंकि इनपुट फ़ाइलों को विभाजित और पाइप करना आसान है, लेकिन आप इसे rsync --files-from
भी उपयोग करने के लिए संशोधित कर सकते हैं।
उपयोग: multi-cpio.sh <srcfile> <dstfile>
(गैर-संवादात्मक लॉगिन के लिए ssh- कुंजियों की आवश्यकता है)
srcfile
प्रति पंक्ति एक निर्देशिका होती है, जैसे:
/usr/share/man/man1
/usr/share/man/man3
/usr/share/man/man5
dstfile
प्रति पंक्ति एक दूरस्थ लक्ष्य होता है, जैसे:
user@host:/tmp/a
user@host:/tmp/b
user@host:/tmp/c
... और इसके लिए स्रोत multi-cpio.sh
:
#!/bin/bash
SRCLIST=$1
DSTLIST=$2
# create temporary files, safely, in /tmp with mcpio prefix
TEMP=`tempfile -p mcpio`
# loop over input file and create a list of all files to be copied
for I in `cat $SRCLIST` ; do
find $I -depth -print >>$TEMP
done
# split the file into CPU count + factor
# set to '4' here, seems like ~6x CPIO will max my 1Gb Ethernet link to ~800Mbps in atop
SPLITCOUNT= $(( $( wc -l $TEMP | cut -d' ' -f1) / $(( $( grep processor /proc/cpuinfo | wc -l ) + 4 )) ))
split -l $SPLITCOUNT $TEMP $TEMP
# nested loops, for each target and for each chunk, start a background copy
for DEST in `cat $DSTLIST` ; do
# this selects the "user@host" from user@host:/target/path
HOST=$(expr substr $DEST 1 $(($(expr index $DEST :)-1)))
# this selects the "/target/path" from user@host:/target/path
DIR=$(expr substr $DEST $(($(expr index $DEST :)+1)) $(expr length $DEST))
# loop over all the split tempfiles with ${TEMP}??
for I in ${TEMP}?? ; do
# use cpio in copy-out mode to stream the files through ssh
# then ensure the target is in place in the remote host, cd into it,
# and copy-in the files.
# note the '&' at the end backgrounds this command, so the loop
# will continue and generate more concurrent background jobs
cat $I | cpio -o | ssh $HOST \
"mkdir $DIR ; cd $DIR && cpio -idum --no-absolute-filenames" &
# sleep for a second before the next spawn to allow for ssh auth
# and so sshd doesn't start dropping new sessions
sleep 1
done
done
# cleanup the tempfiles
rm ${TEMP}??
rm $TEMP
अतिरिक्त cpio संदर्भ और इस स्क्रिप्ट की प्रेरणा के लिए http://rightsock.com/~kjw/Ramblings/tar_v_cpio.html भी देखें ।
संपादित करें: केवल एक src dst के लिए वैकल्पिक सिंटैक्स, srcfile डेस्टाइल बनाने के बिना:
multi-cpio.sh <(echo "/path/to/src") <(echo "user@host:/path/to/dest")
~/path/
तो आपको rsync का--files-from
विकल्प देखना चाहिए ।