जब एक PostgreSQL डेटाबेस अंतिम बार बदला गया था, तो निर्धारित करें


10

मैं यह देख रहा हूं कि बैकअप कैसे किया जाता है और मैं सोच रहा हूं कि क्या यह निर्धारित करने का कोई तरीका है कि पोस्टग्रेक्ल क्लस्टर में कौन से डेटाबेस हाल ही में नहीं बदले गए हैं?

Pg_dumpall का उपयोग करने के बजाय, मैं pg_dump का उपयोग करना चाहूंगा और केवल उन डेटाबेस को डंप करूंगा, जो पिछले बैकअप के बाद बदल गए हैं (कुछ डेटाबेस बहुत बार अपडेट नहीं होते हैं) - यह विचार किया जा रहा है कि यदि कुछ भी नहीं बदला है तो वर्तमान बैकअप चाहिए अभी भी अच्छा है।

क्या किसी को यह निर्धारित करने का तरीका पता है कि किसी विशिष्ट डेटाबेस को अंतिम रूप से अद्यतन / परिवर्तित कब किया गया था?

धन्यवाद...

अपडेट करें:

मैं उम्मीद कर रहा था कि सभी थान जगह पर ट्रिगर्स नहीं लिखना होगा क्योंकि एक विशेष क्लस्टर में डेटाबेस के निर्माण पर मेरा कोई नियंत्रण नहीं है (अकेले डेटाबेस के भीतर db ऑब्जेक्ट्स का निर्माण करें)।

आगे खुदाई, ऐसा लगता है कि $ PGDATA / वैश्विक / pg_database फ़ाइल (विशेष रूप से दूसरा फ़ील्ड) की सामग्री और $ PGDATA / बेस के अंतर्गत निर्देशिका नामों के बीच सहसंबंध है।

एक अंग के बाहर जाने पर, मुझे लगता है कि pg_database फ़ाइल का दूसरा क्षेत्र डेटाबेस oid है और प्रत्येक डेटाबेस का अपना उपनिर्देशिका $ PGDATA / आधार (उपनिर्देशिका नाम के लिए oid के साथ) है। क्या वो सही है? यदि हां, तो क्या बैकअप की आवश्यकता के लिए ट्रिगर के रूप में $ PGDATA / आधार / * के तहत फाइलों से फ़ाइल टाइमस्टैम्प का उपयोग करना उचित है?

...या कोई बेहतर तरीका है?

एक बार फिर धन्यवाद...



कभी यह न समझें कि वर्तमान बैकअप अच्छा है। आप हमेशा अपने नियमित समय पर नए बैकअप लेना चाहते हैं।
mrdenny

सोनू सिंह - मैं डेटाबेस को जोड़ने को नियंत्रित नहीं कर सकता, इस क्लस्टर में अकेले तालिकाओं को दें ताकि ट्रिगर काम न करें - प्लस (मेरी जानकारी के लिए) ट्रिगर ddl परिवर्तनों को पकड़ नहीं पाएंगे। mrdenny ♦ - सही। हालाँकि, मैं आवधिक पूर्ण बैकअप के बीच अनावश्यक वृद्धिशील बैकअप लेने से बचना चाहूँगा।

जवाबों:


9

का उपयोग करते समय select datname, xact_commit from pg_stat_database;के रूप में @Jack डगलस ने सुझाव दिया काफी नहीं काम (जाहिरा तौर पर autovacuum के कारण) करता है, select datname, tup_inserted, tup_updated, tup_deleted from pg_stat_databaseकाम करने के लिए प्रकट होता है। DML और DDL दोनों परिवर्तन tup_ * कॉलम के मूल्यों को बदल देंगे, जबकि vacuumऐसा नहीं है ( vacuum analyzeदूसरी तरफ ...)।

इस बंद मौका में कि यह दूसरों के लिए उपयोगी हो सकता है, मैं बैकअप स्क्रिप्ट को शामिल कर रहा हूं जो मैंने जगह में रखा है। यह Pg 8.4.x के लिए काम करता है लेकिन 8.2.x-- YMMV के लिए नहीं है जो Pg के वर्जन के आधार पर उपयोग किया जाता है।

#!/usr/bin/env perl
=head1 Synopsis

pg_backup -- selectively backup a postgresql database cluster

=head1 Description

Perform backups (pg_dump*) of postgresql databases in a cluster on an
as needed basis.

For some database clusters, there may be databases that are:

 a. rarely updated/changed and therefore shouldn't require dumping as 
    often as those databases that are frequently changed/updated.

 b. are large enough that dumping them without need is undesirable.

The global data is always dumped without regard to whether any 
individual databses need backing up or not.

=head1 Usage

pg_backup [OPTION]...

General options:

  -F, --format=c|t|p    output file format for data dumps 
                          (custom, tar, plain text) (default is custom)
  -a, --all             backup (pg_dump) all databases in the cluster 
                          (default is to only pg_dump databases that have
                          changed since the last backup)
  --backup-dir          directory to place backup files in 
                          (default is ./backups)
  -v, --verbose         verbose mode
  --help                show this help, then exit

Connection options:

  -h, --host=HOSTNAME   database server host or socket directory
  -p, --port=PORT       database server port number
  -U, --username=NAME   connect as specified database user
  -d, --database=NAME   connect to database name for global data

=head1 Notes

This utility has been developed against PostgreSQL version 8.4.x. Older 
versions of PostgreSQL may not work.

`vacuum` does not appear to trigger a backup unless there is actually 
something to vacuum whereas `vacuum analyze` appears to always trigger a 
backup.

=head1 Copyright and License

Copyright (C) 2011 by Gregory Siems

This library is free software; you can redistribute it and/or modify it 
under the same terms as PostgreSQL itself, either PostgreSQL version 
8.4 or, at your option, any later version of PostgreSQL you may have 
available.

=cut

use strict;
use warnings;
use Getopt::Long;
use Data::Dumper;
use POSIX qw(strftime);

my %opts = get_options();

my $connect_options = '';
$connect_options .= "--$_=$opts{$_} " for (qw(username host port));

my $shared_dump_args = ($opts{verbose})
    ? $connect_options . ' --verbose '
    : $connect_options;

my $backup_prefix = (exists $opts{host} && $opts{host} ne 'localhost')
    ? $opts{backup_dir} . '/' . $opts{host} . '-'
    : $opts{backup_dir} . '/';

do_main();


########################################################################
sub do_main {
    backup_globals();

    my $last_stats_file = $backup_prefix . 'last_stats';

    # get the previous pg_stat_database data
    my %last_stats;
    if ( -f $last_stats_file) {
        %last_stats = parse_stats (split "\n", slurp_file ($last_stats_file));
    }

    # get the current pg_stat_database data
    my $cmd = 'psql ' . $connect_options;
    $cmd .= " $opts{database} " if (exists $opts{database});
    $cmd .= "-Atc \"
        select date_trunc('minute', now()), datid, datname, 
            xact_commit, tup_inserted, tup_updated, tup_deleted 
        from pg_stat_database 
        where datname not in ('template0','template1','postgres'); \"";
    $cmd =~ s/\ns+/ /g;
    my @stats = `$cmd`;
    my %curr_stats = parse_stats (@stats);

    # do a backup if needed
    foreach my $datname (sort keys %curr_stats) {
        my $needs_backup = 0;
        if ($opts{all}) {
            $needs_backup = 1;
        }
        elsif ( ! exists $last_stats{$datname} ) {
            $needs_backup = 1;
            warn "no last stats for $datname\n" if ($opts{debug});
        }
        else {
            for (qw (tup_inserted tup_updated tup_deleted)) {
                if ($last_stats{$datname}{$_} != $curr_stats{$datname}{$_}) {
                    $needs_backup = 1;
                    warn "$_ stats do not match for $datname\n" if ($opts{debug});
                }
            }
        }
        if ($needs_backup) {
            backup_db ($datname);
        }
        else {
            chitchat ("Database \"$datname\" does not currently require backing up.");
        }
    }

    # update the pg_stat_database data
    open my $fh, '>', $last_stats_file || die "Could not open $last_stats_file for output. !$\n";
    print $fh @stats;
    close $fh;
}

sub parse_stats {
    my @in = @_;
    my %stats;
    chomp @in;
    foreach my $line (@in) {
        my @ary = split /\|/, $line;
        my $datname = $ary[2];
        next unless ($datname);
        foreach my $key (qw(tmsp datid datname xact_commit tup_inserted tup_updated tup_deleted)) {
            my $val = shift @ary;
            $stats{$datname}{$key} = $val;
        }
    }
    return %stats;
}

sub backup_globals {
    chitchat ("Backing up the global data.");

    my $backup_file = $backup_prefix . 'globals-only.backup.gz';
    my $cmd = 'pg_dumpall --globals-only ' . $shared_dump_args;
    $cmd .= " --database=$opts{database} " if (exists $opts{database});

    do_dump ($backup_file, "$cmd | gzip");
}

sub backup_db {
    my $database = shift;
    chitchat ("Backing up database \"$database\".");

    my $backup_file = $backup_prefix . $database . '-schema-only.backup.gz';
    do_dump ($backup_file, "pg_dump --schema-only --create --format=plain $shared_dump_args $database | gzip");

    $backup_file = $backup_prefix . $database . '.backup';
    do_dump ($backup_file, "pg_dump --format=". $opts{format} . " $shared_dump_args $database");
}

sub do_dump {
    my ($backup_file, $cmd) = @_;

    my $temp_file = $backup_file . '.new';
    warn "Command is: $cmd > $temp_file" if ($opts{debug});

    chitchat (`$cmd > $temp_file`);
    if ( -f $temp_file ) {
        chitchat (`mv $temp_file $backup_file`);
    }
}

sub chitchat {
    my @ary = @_;
    return unless (@ary);
    chomp @ary;
    my $first   = shift @ary;
    my $now     = strftime "%Y%m%d-%H:%M:%S", localtime;
    print +(join "\n                  ", "$now $first", @ary), "\n";
}

sub get_options {
    Getopt::Long::Configure('bundling');

    my %opts = ();
    GetOptions(
        "a"             => \$opts{all},
        "all"           => \$opts{all},
        "p=s"           => \$opts{port},
        "port=s"        => \$opts{port},
        "U=s"           => \$opts{username},
        "username=s"    => \$opts{username},
        "h=s"           => \$opts{host},
        "host=s"        => \$opts{host},
        "F=s"           => \$opts{format},
        "format=s"      => \$opts{format},
        "d=s"           => \$opts{database},
        "database=s"    => \$opts{database},
        "backup-dir=s"  => \$opts{backup_dir},
        "help"          => \$opts{help},
        "v"             => \$opts{verbose},
        "verbose"       => \$opts{verbose},
        "debug"         => \$opts{debug},
        );

    # Does the user need help?
    if ($opts{help}) {
        show_help();
    }

    $opts{host}         ||= $ENV{PGHOSTADDR} || $ENV{PGHOST}     || 'localhost';
    $opts{port}         ||= $ENV{PGPORT}     || '5432';
    $opts{host}         ||= $ENV{PGHOST}     || 'localhost';
    $opts{username}     ||= $ENV{PGUSER}     || $ENV{USER}       || 'postgres';
    $opts{database}     ||= $ENV{PGDATABASE} || $opts{username};
    $opts{backup_dir}   ||= './backups';

    my %formats = (
        c       => 'custom',
        custom  => 'custom',
        t       => 'tar',
        tar     => 'tar',
        p       => 'plain',
        plain   => 'plain',
    );
    $opts{format} = (defined $opts{format})
        ? $formats{$opts{format}} || 'custom'
        : 'custom';

    warn Dumper \%opts if ($opts{debug});
    return %opts;
}

sub show_help {
    print `perldoc -F $0`;
    exit;
}

sub slurp_file { local (*ARGV, $/); @ARGV = shift; <> }

__END__

अद्यतन: स्क्रिप्ट को यहाँ गिटब पर रखा गया है


काफी अच्छा कोड, साझा करने के लिए धन्यवाद। BTW, यह github'ed हो सकता है, क्या आपको ऐसा नहीं लगता? :-)
पीओजी

2

ऐसा लगता है कि आप pg_stat_databaseलेन-देन की गणना प्राप्त करने और जांचने के लिए उपयोग कर सकते हैं कि क्या यह एक बैकअप रन से अगले में बदलता है:

select datname, xact_commit from pg_stat_database;

  datname  | xact_commit 
-----------+-------------
 template1 |           0
 template0 |           0
 postgres  |      136785

अगर किसी ने pg_stat_resetआपको बुलाया है तो निश्चित नहीं हो सकता है कि कोई db बदल गया है या नहीं, लेकिन आप इस पर पर्याप्त विचार नहीं कर सकते हैं कि ऐसा होगा, इसके बाद आपके अंतिम रीडिंग से मिलान करने के लिए लेनदेन की सही संख्या होगी।

--EDIT

यह क्यों काम नहीं कर सकता है के लिए यह SO प्रश्न देखें । यकीन नहीं होता कि ऐसा क्यों हो सकता है लेकिन लॉगिंग को सक्षम करने से कुछ प्रकाश डाला जा सकता है ...।


अगर किसी ने फोन किया था pg_stat_resetतो पिछले व्हाट्स से मेल करने वाले xact_commit मूल्य की संभावना बहुत कम होगी, नहीं? ताकि निश्चित रूप से डीएमएल परिवर्तनों के अस्तित्व को पकड़ सके। अगर मुझे डीडीएल में बदलाव हुए हैं तो मुझे बस पकड़ने की जरूरत है।
gsiems

DDL पोस्टग्रेज में ट्रांजेक्शनल है - मुझे उम्मीद है कि कमिटमेंट उस मामले में भी बढ़ेगा। हालांकि चेक नहीं किया गया ...
जैक कहते हैं कि टॉपanswers.xyz

आप सर, सही हैं। मैं Pg DDL के लेन-देन के बारे में भूल गया था और एक त्वरित create table ...परीक्षण xact_commit वेतन वृद्धि के लिए प्रकट होता है।
२१

1
इसके अलावा परीक्षण से पता चलता है कि उपयोगकर्ता गतिविधि सक्रिय नहीं होने के बावजूद xact_commit बढ़ती जा रही है - शायद ऑटोवैक्यूम?
22

यह निश्चित रूप से बैकअप उद्देश्यों के लिए काम नहीं करता है। xact_commit बहुत बार बढ़ता है, तब भी जब कोई भी डेटाबेस से जुड़ा नहीं है।
mivk

1

पोस्टग्रेज डॉक्स और न्यूजग्रुप के आसपास खुदाई करने से:

txid_current()आपको एक नया देगा xid- यदि आप बाद की तारीख में फ़ंक्शन को फिर से कॉल करते हैं, यदि आपको xidएक अधिक मिलता है , तो आप जानते हैं कि दोनों कॉल के बीच कोई लेनदेन नहीं हुआ है। हालांकि आपको गलत सकारात्मकता मिल सकती है - जैसे अगर कोई और कॉल करता हैtxid_current()


सुझाव के लिए धन्यवाद। मुझे विश्वास नहीं है कि यह txid_current () डेटाबेस स्तर के बजाय क्लस्टर स्तर पर काम करने के लिए प्रकट होता है।
1

मैंने उस पर कुछ डॉक्टर की तलाश की और पाया - क्या आपके पास लिंक है?
जैक का कहना है कि topanswers.xyz

1
कोई मेल नहीं। मैंने डेटाबेस के बीच स्विच करके और "चुनिंदा current_database (), txid_current ();" और परिणामों की तुलना करना।
gsiems

0

डीबी-डेटा युक्त आपकी फ़ाइलों पर समय-स्टैम्प को इकट्ठा करें और देखें कि क्या वे बदल गए हैं। अगर वे वहाँ एक लेखन था।

वाल-हंट के बाद संपादित करें: आपको बकाया लेखन को फ्लश करने के बाद ही करना चाहिए।


2
यह विश्वसनीय नहीं है। ऐसे परिवर्तन हो सकते हैं जो अभी तक डेटाफाइल्स को नहीं लिखे गए (फ्लश किए गए), अर्थात वे केवल वाल के लिए लिखे गए थे।
a_horse_with_no_name

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.