dd: इष्टतम अवरोध की गणना कैसे करें? [बन्द है]


122

जब आप रनिंग करते हैं तो आप इष्टतम अवरोधक की गणना कैसे करते हैं dd? मैंने इस पर थोड़ा शोध किया है और मुझे कुछ भी सुझाव नहीं मिला है कि यह कैसे पूरा होगा।

मैं इस धारणा के तहत हूं कि एक बड़ा अवरोधक एक त्वरित परिणाम देगा dd... क्या यह सच है?

मैं ddदो समान 500gb Hitachi HDDs के बारे में 7200rpm पर एक Intel Core i3 पर चलने वाले बॉक्स में 4GB DDR3 1333mhz RAM के साथ चलाता हूं, इसलिए मैं यह पता लगाने की कोशिश कर रहा हूं कि किस ब्लॉक का उपयोग करना है। (मैं उबंटू 10.10 x86 को फ्लैश ड्राइव से बूट करने जा रहा हूं, और उसी से चल रहा हूं।)


MacOS के लिए @ tdg5 उत्तर को अपनाया - macos_dd_ibs_test.sh और macos_dd_obs_test.sh
मिक्सेल

1
सबसे अच्छा जवाब ddफ़ाइल को स्थानांतरित करते समय इष्टतम अवरोध को खोजने के लिए एक सुविधा का योगदान करना होगा
बोरिस

इस विषय को चिह्नित क्यों नहीं किया गया और सुपरयुसर को नहीं भेजा गया?
user267092

जवाबों:


95

इष्टतम ब्लॉक आकार विभिन्न कारकों पर निर्भर करता है, जिसमें ऑपरेटिंग सिस्टम (और इसका संस्करण) शामिल है, और विभिन्न हार्डवेयर बसें और डिस्क शामिल हैं। कई यूनिक्स जैसी प्रणालियाँ (लिनक्स सहित और BSD के कम से कम कुछ फ्लेवर) उस st_blksizeसदस्य को परिभाषित करते हैं जो struct statयह बताता है कि कर्नेल को क्या लगता है कि यह सबसे इष्टतम ब्लॉक आकार है:

#include <sys/stat.h>
#include <stdio.h>

int main(void)
{
    struct stat stats;

    if (!stat("/", &stats))
    {
        printf("%u\n", stats.st_blksize);
    }
}

प्रयोग करने का सबसे अच्छा तरीका हो सकता है: विभिन्न ब्लॉक आकारों और समय के साथ एक गीगाबाइट की प्रतिलिपि बनाएँ। (प्रत्येक रन से पहले कर्नेल बफर कैश को याद रखना:) echo 3 > /proc/sys/vm/drop_caches

हालांकि, अंगूठे के एक नियम के रूप में, मैंने पाया है कि एक बड़ा पर्याप्त ब्लॉक आकार ddएक अच्छा काम करने देता है, और कहते हैं, 4 KiB बनाम 64 KiB की तुलना में, 64 KiB और 1 MiB मामूली हैं। (हालांकि, माना जाता है, जब से मैंने ऐसा किया है, तब से कुछ समय हो गया है। मैं अब डिफ़ॉल्ट रूप से mebibyte का उपयोग करता हूं, या बस ddआकार चुनने देता हूं ।)


11
मैं इस जवाब के रूप में स्वीकार नहीं करने के लिए बहुत माफी चाहता हूँ ... धन्यवाद!
एकजा

कैश छोड़ने के लिए याद रखने के बारे में उत्कृष्ट बिंदु। यह मेरे माप को गड़बड़ कर रहा था! (हालांकि छोटी सी बात: यह "drop_caches" है, एक अंडरस्कोर के साथ। जाहिर तौर पर संपादन में कम से कम 6 अक्षर होने चाहिए ... :()
Tom

73

जैसा कि दूसरों ने कहा है, कोई सार्वभौमिक रूप से सही ब्लॉक आकार नहीं है; क्या एक स्थिति के लिए इष्टतम है या हार्डवेयर का एक टुकड़ा दूसरे के लिए बहुत अक्षम हो सकता है। इसके अलावा, डिस्क के स्वास्थ्य के आधार पर "इष्टतम" की तुलना में एक अलग ब्लॉक आकार का उपयोग करना बेहतर हो सकता है।

आधुनिक हार्डवेयर पर एक बात जो बहुत विश्वसनीय है, वह यह है कि 512 बाइट्स का डिफ़ॉल्ट ब्लॉक आकार लगभग एक अधिक इष्टतम विकल्प की तुलना में परिमाण धीमे होने का आदेश देता है। जब संदेह में, मैंने पाया है कि 64K एक बहुत ठोस आधुनिक डिफ़ॉल्ट है। हालांकि 64K आमतौर पर इष्टतम ब्लॉक आकार नहीं है, मेरे अनुभव में यह डिफ़ॉल्ट की तुलना में बहुत अधिक कुशल है। 64K में मज़बूती से परफॉर्म करने का एक ठोस ठोस इतिहास भी है: आप युग-लुग मेलिंग लिस्ट से एक संदेश पा सकते हैं, लगभग 2002, 64K के ब्लॉक आकार की सिफारिश यहाँ: http://www.mail-archive.com/eug- lug@efn.org/msg12073.html

इष्टतम आउटपुट ब्लॉक आकार का निर्धारण करने के लिए, मैंने निम्नलिखित स्क्रिप्ट लिखी है, जो विभिन्न बाइट आकारों की एक सीमा में dd के साथ 128M टेस्ट फाइल लिखने का परीक्षण करती है, जो 512 बाइट्स के डिफ़ॉल्ट से लेकर अधिकतम 64M है। सावधान रहें, यह स्क्रिप्ट आंतरिक रूप से dd का उपयोग करती है, इसलिए सावधानी के साथ उपयोग करें।

dd_obs_test.sh:

#!/bin/bash

# Since we're dealing with dd, abort if any errors occur
set -e

TEST_FILE=${1:-dd_obs_testfile}
TEST_FILE_EXISTS=0
if [ -e "$TEST_FILE" ]; then TEST_FILE_EXISTS=1; fi
TEST_FILE_SIZE=134217728

if [ $EUID -ne 0 ]; then
  echo "NOTE: Kernel cache will not be cleared between tests without sudo. This will likely cause inaccurate results." 1>&2
fi

# Header
PRINTF_FORMAT="%8s : %s\n"
printf "$PRINTF_FORMAT" 'block size' 'transfer rate'

# Block sizes of 512b 1K 2K 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M
for BLOCK_SIZE in 512 1024 2048 4096 8192 16384 32768 65536 131072 262144 524288 1048576 2097152 4194304 8388608 16777216 33554432 67108864
do
  # Calculate number of segments required to copy
  COUNT=$(($TEST_FILE_SIZE / $BLOCK_SIZE))

  if [ $COUNT -le 0 ]; then
    echo "Block size of $BLOCK_SIZE estimated to require $COUNT blocks, aborting further tests."
    break
  fi

  # Clear kernel cache to ensure more accurate test
  [ $EUID -eq 0 ] && [ -e /proc/sys/vm/drop_caches ] && echo 3 > /proc/sys/vm/drop_caches

  # Create a test file with the specified block size
  DD_RESULT=$(dd if=/dev/zero of=$TEST_FILE bs=$BLOCK_SIZE count=$COUNT conv=fsync 2>&1 1>/dev/null)

  # Extract the transfer rate from dd's STDERR output
  TRANSFER_RATE=$(echo $DD_RESULT | \grep --only-matching -E '[0-9.]+ ([MGk]?B|bytes)/s(ec)?')

  # Clean up the test file if we created one
  if [ $TEST_FILE_EXISTS -ne 0 ]; then rm $TEST_FILE; fi

  # Output the result
  printf "$PRINTF_FORMAT" "$BLOCK_SIZE" "$TRANSFER_RATE"
done

गिटहब पर देखें

मैंने इस स्क्रिप्ट का केवल डेबियन (उबंटू) सिस्टम और OSX योसेमाइट पर परीक्षण किया है, इसलिए यह संभवत: अन्य यूनिक्स फ्लेवर्स पर काम करने के लिए कुछ ट्विकिंग लेगा।

डिफ़ॉल्ट रूप से कमांड वर्तमान निर्देशिका में dd_obs_testfile नामक एक परीक्षण फ़ाइल बनाएगी । वैकल्पिक रूप से, आप स्क्रिप्ट नाम के बाद एक पथ प्रदान करके कस्टम परीक्षण फ़ाइल को पथ प्रदान कर सकते हैं:

$ ./dd_obs_test.sh /path/to/disk/test_file

स्क्रिप्ट का आउटपुट परीक्षण किए गए ब्लॉक आकार और उनके संबंधित हस्तांतरण दरों की एक सूची है:

$ ./dd_obs_test.sh
block size : transfer rate
       512 : 11.3 MB/s
      1024 : 22.1 MB/s
      2048 : 42.3 MB/s
      4096 : 75.2 MB/s
      8192 : 90.7 MB/s
     16384 : 101 MB/s
     32768 : 104 MB/s
     65536 : 108 MB/s
    131072 : 113 MB/s
    262144 : 112 MB/s
    524288 : 133 MB/s
   1048576 : 125 MB/s
   2097152 : 113 MB/s
   4194304 : 106 MB/s
   8388608 : 107 MB/s
  16777216 : 110 MB/s
  33554432 : 119 MB/s
  67108864 : 134 MB/s

(नोट: हस्तांतरण दरों की इकाई OS द्वारा भिन्न होगी)

इष्टतम रीड ब्लॉक आकार का परीक्षण करने के लिए, आप कम या ज्यादा उसी प्रक्रिया का उपयोग कर सकते हैं, लेकिन / dev / शून्य से पढ़ने और डिस्क पर लिखने के बजाय, आप डिस्क से पढ़ेंगे और / dev / null को लिखेंगे। ऐसा करने के लिए एक स्क्रिप्ट ऐसा लग सकता है:

dd_ibs_test.sh:

#!/bin/bash

# Since we're dealing with dd, abort if any errors occur
set -e

TEST_FILE=${1:-dd_ibs_testfile}
if [ -e "$TEST_FILE" ]; then TEST_FILE_EXISTS=$?; fi
TEST_FILE_SIZE=134217728

# Exit if file exists
if [ -e $TEST_FILE ]; then
  echo "Test file $TEST_FILE exists, aborting."
  exit 1
fi
TEST_FILE_EXISTS=1

if [ $EUID -ne 0 ]; then
  echo "NOTE: Kernel cache will not be cleared between tests without sudo. This will likely cause inaccurate results." 1>&2
fi

# Create test file
echo 'Generating test file...'
BLOCK_SIZE=65536
COUNT=$(($TEST_FILE_SIZE / $BLOCK_SIZE))
dd if=/dev/urandom of=$TEST_FILE bs=$BLOCK_SIZE count=$COUNT conv=fsync > /dev/null 2>&1

# Header
PRINTF_FORMAT="%8s : %s\n"
printf "$PRINTF_FORMAT" 'block size' 'transfer rate'

# Block sizes of 512b 1K 2K 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M
for BLOCK_SIZE in 512 1024 2048 4096 8192 16384 32768 65536 131072 262144 524288 1048576 2097152 4194304 8388608 16777216 33554432 67108864
do
  # Clear kernel cache to ensure more accurate test
  [ $EUID -eq 0 ] && [ -e /proc/sys/vm/drop_caches ] && echo 3 > /proc/sys/vm/drop_caches

  # Read test file out to /dev/null with specified block size
  DD_RESULT=$(dd if=$TEST_FILE of=/dev/null bs=$BLOCK_SIZE 2>&1 1>/dev/null)

  # Extract transfer rate
  TRANSFER_RATE=$(echo $DD_RESULT | \grep --only-matching -E '[0-9.]+ ([MGk]?B|bytes)/s(ec)?')

  printf "$PRINTF_FORMAT" "$BLOCK_SIZE" "$TRANSFER_RATE"
done

# Clean up the test file if we created one
if [ $TEST_FILE_EXISTS -ne 0 ]; then rm $TEST_FILE; fi

गिटहब पर देखें

इस मामले में एक महत्वपूर्ण अंतर यह है कि परीक्षण फ़ाइल एक फ़ाइल है जो स्क्रिप्ट द्वारा लिखी गई है। किसी मौजूदा फ़ाइल पर इस कमांड को इंगित न करें या मौजूदा फ़ाइल को शून्य से अधिलेखित कर दिया जाएगा!

मेरे विशेष हार्डवेयर के लिए मैंने पाया कि एक HDD पर 128K सबसे इष्टतम इनपुट ब्लॉक आकार था और एक SSD पर 32K सबसे इष्टतम था।

यद्यपि यह उत्तर मेरे अधिकांश निष्कर्षों को शामिल करता है, मैं इस स्थिति में पर्याप्त बार चला हूं कि मैंने इसके बारे में एक ब्लॉग पोस्ट लिखा है: http://blog.tdg5.com/tuning-dd-block-size/ आप अधिक विवरण पा सकते हैं मैंने वहां किए गए परीक्षणों पर।


1
मैंने दूसरी स्क्रिप्ट को चलाया है, पठन प्रदर्शन का परीक्षण, 512G SSD के साथ 2015 rMBP पर। सबसे अच्छा ब्लॉक आकार 8388608: 3.582 जीबी बाइट्स / सेक था।
क्विन कंटेंडर

1
सुधार: मैंने 512GB SSD के साथ 2015 के rMBP पर दूसरी स्क्रिप्ट, परीक्षण पठन प्रदर्शन का परीक्षण किया है। सबसे अच्छा ब्लॉक का आकार 524288 (5.754 जीबी / सेकंड) था। दूसरे सर्वश्रेष्ठ ब्लॉक का आकार 131072 (5.133 जीबी / सेकंड) था। (मैंने अपनी अंतिम टिप्पणी के लिए मूल्यों को उत्पन्न करने में गलत तरीके से परिणामों को
छाँटा

के लिए dd_obs_test.sh conv=fsyncmacOS पर काम नहीं करता है और इसे हटाया जा सकता है।
रेनॉप

मेरे अनुभव में, बड़े ब्लॉक साइज़ बेंचमार्किंग को सटीक होने के लिए एक बड़ा नमूना चाहिए (कई सेकंड। मुझे अनुमान है कि 128 एमबी की फाइल को बनाना चाहिए, लेकिन मुझे यकीन नहीं है)। यकीन नहीं है कि क्यों।
रॉल्फ

2
Dude! क्या अद्भुत जवाब है। यह एक सोने की खदान को खोजने के समान है, एक टन गंदगी को खोदकर फिर उसे सोने के नगेट को खोजने के लिए संसाधित करना जो मैं चाहता था: 64,000 धन्यवाद।
एसडीसोलर

10

मैंने पाया है कि मेरा इष्टतम ब्लॉक 8 एमबी (डिस्क कैश के बराबर है?) मुझे इसे संकुचित छवि बनाने से पहले डिस्क पर खाली जगह को पोंछने की जरूरत है (कुछ कहते हैं: धोएं)। मैंनें इस्तेमाल किया:

cd /media/DiskToWash/
dd if=/dev/zero of=zero bs=8M; rm zero

मैंने 4K से 100M तक के मूल्यों के साथ प्रयोग किया।

Dd को थोड़ी देर तक चलने देने के बाद मैंने उसे मार दिया (Ctlr + C) और आउटपुट पढ़ें:

36+0 records in
36+0 records out
301989888 bytes (302 MB) copied, 15.8341 s, 19.1 MB/s

जैसा कि dd इनपुट / आउटपुट रेट (19.1MB / s इस मामले में) प्रदर्शित करता है, यह देखना आसान है कि आपके द्वारा लिया गया मान पिछले एक से बेहतर प्रदर्शन कर रहा है या बुरा।

मेरा स्कोर:

bs=   I/O rate
---------------
4K    13.5 MB/s
64K   18.3 MB/s
8M    19.1 MB/s <--- winner!
10M   19.0 MB/s
20M   18.6 MB/s
100M  18.6 MB/s   

नोट: यह जांचने के लिए कि आपका डिस्क कैश / बफर आकार क्या है, आप इसका उपयोग कर सकते हैं sudo hdparm -i /dev/sda


4
क्या आपने केवल प्रत्येक परीक्षा एक बार चलाई थी? मुझे लगता है कि आप K64K से जो देख सकते हैं, वह यह है कि बफर पहले से ही भरा हुआ है और अंतर सिर्फ यादृच्छिक विचरण है।
मैड्स Y

मैंने एक बार बड़े मूल्यों को सुना है जो संभावित रूप से सिस्टम को टोंटी मार रहा है। वह व्यक्ति एक बड़ी फाइल के साथ काम कर रहा था। यह अच्छा होगा अगर मैं इस बारे में अधिक सुन सकता हूं।
टॉड पार्ट्रिज

1
मेरा अनुभव यह भी बताता 8Mहै कि हराना मुश्किल है।
श्रीधर सरनोबत

दिलचस्प। क्या आपको लगता है कि यह L3 कैश आकार से संबंधित है या नहीं? अगर L3 कैश की तुलना में बड़ा आकार धीमा हो जाएगा तो मैं सोच रहा हूँ।
सरप्राइज़डॉग

3

यह पूरी तरह से सिस्टम पर निर्भर है। आपको इष्टतम समाधान खोजने के लिए प्रयोग करना चाहिए। के साथ शुरू करने की कोशिश करो bs=8388608। (हिताची के रूप में HDD में 8MB कैश लगता है।)


5
बहुत सारे dd संस्करण शॉर्टहैंड को स्वीकार करते हैं: अर्थात bs=8MGNU / लिनक्स bs=8mपर या BSD पर
पास्कल

4
योग्य, सोचा था कि आप कहने जा रहे हैं " bs=8388608हर कदम पर एक बार शुरू करने और
क्षय

1
  • बेहतर प्रदर्शन के लिए रैम का उपयोग कर सकते हैं सबसे बड़ी रुकावट का उपयोग कर सकते हैं (ओएस पर कम आई / ओ कॉल भेजेंगे)
  • बेहतर शुद्धता और डेटा रिकवरी के लिए इनपुट के मूल क्षेत्र के आकार के लिए रुकावट सेट करें

जैसा कि dd कांफ्रेंस = noerror, सिंक विकल्प के साथ डेटा को कॉपी करता है, इसका सामना करने वाली किसी भी त्रुटि के परिणामस्वरूप शेष ब्लॉक को शून्य-बाइट्स के साथ बदल दिया जाएगा। बड़े ब्लॉक आकार अधिक तेज़ी से कॉपी होंगे, लेकिन हर बार एक त्रुटि का सामना करना पड़ता है ब्लॉक के शेष को अनदेखा किया जाता है।

स्रोत


1
मुझे लगता है कि अगर कोई लिखने त्रुटियाँ हैं आप, मध्यम बदल दिया जाना चाहिए ... ब्लॉक आकार को बदल नहीं
unfa
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.