SQL सर्वर एजेंट नौकरियां और उपलब्धता समूह


37

मैं SQL Server 2012 उपलब्धता समूहों में अनुसूचित SQL सर्वर एजेंट नौकरियों से निपटने के लिए सर्वोत्तम अभ्यास की तलाश कर रहा हूं। हो सकता है कि मुझे कुछ याद हो, हालांकि वर्तमान स्थिति में मुझे लगता है कि SQL सर्वर एजेंट वास्तव में इस महान SQL2012 सुविधा के साथ एकीकृत नहीं है।

मैं एक निर्धारित SQL एजेंट नौकरी नोड स्विच के बारे में कैसे पता कर सकता हूं? उदाहरण के लिए मेरे पास एक प्राथमिक नोड पर चलने वाला काम है जो प्रत्येक घंटे डेटा लोड करता है। अब अगर प्राइमरी कम हो जाती है, तो मैं सेकेंडरी पर जॉब को कैसे एक्टिवेट कर सकता हूं जो अब प्राइमरी हो गया है?

यदि मैं नौकरी को हमेशा द्वितीयक पर शेड्यूल करता हूं तो यह विफल हो जाता है क्योंकि तब माध्यमिक केवल-पढ़ने के लिए होता है।


जवाबों:


40

अपने SQL Server एजेंट नौकरी के भीतर, कुछ सशर्त तर्क के लिए परीक्षण करें कि क्या वर्तमान उदाहरण उस विशेष भूमिका की सेवा कर रहा है जिसे आप उपलब्धता के लिए देख रहे हैं:

if (select
        ars.role_desc
    from sys.dm_hadr_availability_replica_states ars
    inner join sys.availability_groups ag
    on ars.group_id = ag.group_id
    where ag.name = 'YourAvailabilityGroupName'
    and ars.is_local = 1) = 'PRIMARY'
begin
    -- this server is the primary replica, do something here
end
else
begin
    -- this server is not the primary replica, (optional) do something here
end

यह सब स्थानीय प्रतिकृति की वर्तमान भूमिका को खींचता है, और यदि यह PRIMARYभूमिका में है, तो आप जो कुछ भी कर सकते हैं वह यह है कि आपकी नौकरी की जरूरत है अगर यह प्राथमिक प्रतिकृति है। ELSEब्लॉक वैकल्पिक है, लेकिन यह संभव तर्क को संभालने के लिए अगर अपने स्थानीय प्रतिकृति प्राथमिक नहीं है।

बेशक, 'YourAvailabilityGroupName'उपरोक्त क्वेरी को अपने वास्तविक उपलब्धता समूह नाम में बदलें ।

विफलता क्लस्टर इंस्टेंसेस के साथ उपलब्धता समूहों को भ्रमित न करें। उदाहरण किसी दिए गए उपलब्धता समूह के लिए प्राथमिक या द्वितीयक प्रतिकृति है या नहीं, यह सर्वर-स्तरीय ऑब्जेक्ट, जैसे SQL सर्वर एजेंट कार्य और अन्य को प्रभावित नहीं करता है।


14

प्रति कार्य के आधार पर ऐसा करने के बजाय (जारी रखने का निर्णय लेने से पहले सर्वर की स्थिति के लिए हर काम की जाँच करना), मैंने यह देखने के लिए दोनों सर्वरों पर काम किया है कि यह देखने के लिए कि सर्वर किस अवस्था में है।

  • यदि इसका प्राथमिक है, तो किसी भी नौकरी को सक्षम करें जिसमें एजी में एक डेटाबेस को लक्षित करना है।
  • यदि सर्वर द्वितीयक है, तो AG में किसी डेटाबेस को लक्षित करने वाली किसी भी नौकरी को अक्षम करें।

यह दृष्टिकोण कई चीजें प्रदान करता है

  • यह उन सर्वरों पर काम करता है जहां एजी (या एजी के बाहर डीबी के मिश्रण) में कोई डेटाबेस नहीं हैं
  • कोई भी एक नया काम बना सकता है और इस बारे में चिंता करने की ज़रूरत नहीं है कि डीबी एक एजी में है (हालांकि उन्हें दूसरे सर्वर पर नौकरी जोड़ने के लिए याद रखना होगा)
  • प्रत्येक नौकरी में एक विफलता ईमेल है जो उपयोगी बनी हुई है (आपकी सभी नौकरियों में विफलता ईमेल सही है?)
  • नौकरी के इतिहास को देखने के दौरान, आपको वास्तव में यह देखने को मिलता है कि क्या नौकरी वास्तव में चली और कुछ किया (यह प्राथमिक है), सफलता की एक लंबी सूची देखने के बजाय जो वास्तव में कुछ भी नहीं चला (माध्यमिक पर)

स्क्रिप्ट नीचे क्षेत्र में डेटाबेस की जाँच करता है यदि यह डेटाबेस उपलब्धता समूह में है तो स्क्रिप्ट कुछ कार्रवाई करेगी

यह खरीद प्रत्येक सर्वर पर हर 15 मिनट में निष्पादित की जाती है। (लोगों को यह बताने के लिए एक टिप्पणी जोड़ने का अतिरिक्त बोनस दिया गया है कि नौकरी अक्षम क्यों थी)

/*
    This proc goes through all SQL Server agent jobs and finds any that refer to a database taking part in the availability Group 
    It will then enable/disable the job dependant on whether the server is the primary replica or not   
        Primary Replica = enable job
    It will also add a comment to the job indicating the job was updated by this proc
*/
CREATE PROCEDURE dbo.sp_HADRAgentJobFailover (@AGname varchar(200) = 'AG01' )
AS 

DECLARE @SQL NVARCHAR(MAX)

;WITH DBinAG AS (  -- This finds all databases in the AG and determines whether Jobs targeting these DB's should be turned on (which is the same for all db's in the AG)
SELECT  distinct
        runJobs = CASE WHEN role_desc = 'Primary' THEN 1 ELSE 0 END   --If this is the primary, then yes we want to run the jobs
        ,dbname = db.name
        ,JobDescription = CASE WHEN hars.role_desc = 'Primary'  -- Add the reason for the changing the state to the Jobs description
                THEN '~~~ [Enabled] using automated process (DBA_tools.dbo.sp_HADRAgentJobFailover) looking for jobs running against Primary Replica AG ~~~ '
                ELSE '~~~ [Diabled] using Automated process (DBA_tools.dbo.sp_HADRAgentJobFailover) because the job cant run on READ-ONLY Replica AG~~~ ' END 
FROM sys.dm_hadr_availability_replica_states hars
INNER JOIN sys.availability_groups ag ON ag.group_id = hars.group_id
INNER JOIN sys.Databases db ON  db.replica_id = hars.replica_id
WHERE is_local = 1
AND ag.Name = @AGname
) 

SELECT @SQL = (
SELECT DISTINCT N'exec msdb..sp_update_job @job_name = ''' + j.name + ''', @enabled = ' + CAST(d.runJobs AS VARCHAR) 
                + ',@description = ''' 
                + CASE WHEN j.description = 'No description available.' THEN JobDescription -- if there is no description just add our JobDescription
                       WHEN PATINDEX('%~~~%~~~',j.description) = 0 THEN j.description + '    ' + JobDescription  -- If our JobDescription is NOT there, add it
                       WHEN PATINDEX('%~~~%~~~',j.description) > 0 THEN SUBSTRING(j.description,1,CHARINDEX('~~~',j.description)-1) + d.JobDescription  --Replace our part of the job description with what we are doing.
                       ELSE d.JobDescription  -- Should never reach here...
                    END 
                + ''';'
FROM msdb.dbo.sysjobs j
INNER JOIN msdb.dbo.sysjobsteps s
INNER JOIN DBinAG d ON d.DbName =s.database_name     
ON j.job_id = s.job_id
WHERE j.enabled != d.runJobs   -- Ensure we only actually update the job, if it needs to change
FOR XML PATH ('')
)
PRINT REPLACE(@SQL,';',CHAR(10))
EXEC sys.sp_executesql @SQL

इसका मूर्खतापूर्ण सबूत नहीं है, लेकिन रात भर के भार और प्रति घंटे के काम के लिए यह काम पूरा हो जाता है।

इस प्रक्रिया को शेड्यूल पर चलाने से भी बेहतर, इसके बजाय इसे अलर्ट 1480 (एजी रोल चेंज अलर्ट) के जवाब में चलाएं।


9

मैं इसे पूरा करने के लिए दो अवधारणाओं से अवगत हूं।

शर्त: थॉमस स्ट्रिंगर के उत्तर के आधार पर, मैंने हमारे दो सर्वरों के मास्टर डीबी में दो कार्य बनाए:

CREATE FUNCTION [dbo].[svf_AgReplicaState](@availability_group_name sysname)
RETURNS bit
AS
BEGIN

if EXISTS(
    SELECT        ag.name
    FROM            sys.dm_hadr_availability_replica_states AS ars INNER JOIN
                             sys.availability_groups AS ag ON ars.group_id = ag.group_id
    WHERE        (ars.is_local = 1) AND (ars.role_desc = 'PRIMARY') AND (ag.name = @availability_group_name))

    RETURN 1

RETURN 0

END
GO

CREATE FUNCTION [dbo].[svf_DbReplicaState](@database_name sysname)
RETURNS bit
AS
BEGIN

IF EXISTS(
    SELECT        adc.database_name
    FROM            sys.dm_hadr_availability_replica_states AS ars INNER JOIN
                             sys.availability_databases_cluster AS adc ON ars.group_id = adc.group_id
    WHERE        (ars.is_local = 1) AND (ars.role_desc = 'PRIMARY') AND (adc.database_name = @database_name))

    RETURN 1
RETURN 0

END

GO


  1. यदि यह प्राथमिक प्रतिकृति पर निष्पादित नहीं है, तो नौकरी समाप्त करें

    इस स्थिति के लिए, दोनों सर्वरों पर प्रत्येक कार्य को चरण 1 के रूप में निम्न दो कोड स्निपेट की आवश्यकता होती है:

    समूह नाम से जांचें:

    IF master.dbo.svf_AgReplicaState('my_group_name')=0
      raiserror ('This is not the primary replica.',2,1)
    

    डेटाबेस नाम से जांचें:

    IF master.dbo.svf_AgReplicaState('my_db_name')=0
      raiserror ('This is not the primary replica.',2,1)
    

    यदि आप इस दूसरे का उपयोग करते हैं, तो सिस्टम डेटाबेस से सावधान रहें - हालांकि परिभाषा के अनुसार वे किसी भी उपलब्धता समूह का हिस्सा नहीं हो सकते हैं, इसलिए यह उन लोगों के लिए हमेशा विफल रहेगा।

    ये दोनों व्यवस्थापक उपयोगकर्ताओं के लिए बॉक्स से बाहर काम करते हैं। गैर-व्यवस्थापक उपयोगकर्ताओं के लिए, आपको अतिरिक्त अनुमतियाँ डालनी होंगी, उनमें से एक यहाँ सुझाई गई है :

    GRANT VIEW SERVER STATE TO [user];
    GRANT VIEW ANY DEFINITION TO [user];
    

    यदि आप इस पहले चरण पर सफलता की रिपोर्ट करने में सफलता की विफलता के लिए विफलता की कार्रवाई निर्धारित करते हैं , तो आपको मुख्य लॉग के बदले वे जॉब लॉग इन बदसूरत रेड क्रॉस के संकेत नहीं देंगे।

    हमारे अनुभव से, यह आदर्श नहीं है। हमने पहली बार इस दृष्टिकोण को अपनाया था, लेकिन नौकरियों को खोजने के बारे में जल्दी से खो दिया ट्रैक जो वास्तव में एक समस्या थी, क्योंकि सभी माध्यमिक प्रतिकृति नौकरियों ने चेतावनी संदेशों के साथ नौकरी लॉग को बंद कर दिया था।

    इसके बाद हम जो गए:

  2. प्रॉक्सी नौकरियां

    यदि आप इस अवधारणा को अपनाते हैं, तो आपको वास्तव में प्रति कार्य दो कार्य करने होंगे जो आप करना चाहते हैं। पहला "प्रॉक्सी जॉब" है जो यह जांचता है कि क्या इसे प्राथमिक प्रतिकृति पर निष्पादित किया जा रहा है। यदि ऐसा है, तो यह "कार्यकर्ता नौकरी" शुरू करता है, यदि नहीं, तो यह केवल चेतावनी या त्रुटि संदेशों के साथ लॉग को बंद किए बिना इनायत से समाप्त होता है।

    जबकि मुझे व्यक्तिगत रूप से हर सर्वर पर प्रति कार्य दो नौकरियां होने का विचार पसंद नहीं है, मुझे लगता है कि यह निश्चित रूप से अधिक बनाए रखने योग्य है, और आपको नौकरी की सफलता की सफलता के लिए कदम की विफलता कार्रवाई को सेट करने की आवश्यकता नहीं है , जो थोड़ा सा है अजीब।

    नौकरियों के लिए, हमने एक नामकरण योजना को अपनाया। प्रॉक्सी जॉब को ही कहा जाता है {put jobname here}। कर्मी ने कार्य कहा जाता है {put jobname here} worker। यह प्रॉक्सी से कार्यकर्ता की नौकरी को स्वचालित करना संभव बनाता है। ऐसा करने के लिए, मैंने निम्नलिखित प्रक्रिया को दोनों मास्टर dbs में जोड़ा:

    CREATE procedure [dbo].[procStartWorkerJob](@jobId uniqueidentifier, @availabilityGroup sysname, @postfix sysname = ' worker') as
    declare @name sysname
    
    if dbo.svf_AgReplicaState(@availabilityGroup)=0
        print 'This is not the primary replica.'
    else begin
        SELECT @name = name FROM msdb.dbo.sysjobs where job_id = @jobId
    
        set @name = @name + @postfix
        if exists(select name from msdb.dbo.sysjobs where name = @name)
            exec msdb.dbo.sp_start_job @name
        else begin
            set @name = 'Job '''+@name+''' not found.'
            raiserror (@name ,2,1)
        end
    end
    GO
    

    यह svf_AgReplicaStateऊपर दिखाए गए फ़ंक्शन का उपयोग करता है , आप आसानी से बदल सकते हैं कि दूसरे फ़ंक्शन को कॉल करके डेटाबेस के नाम का उपयोग करके जांच करें।

    प्रॉक्सी जॉब के एकमात्र चरण के भीतर, आप इसे इस तरह कहते हैं:

    exec procStartWorkerJob $(ESCAPE_NONE(JOBID)), '{my_group_name}'

    यह वर्तमान नौकरी की आईडी पर प्राप्त करने के लिए यहां और यहां दिखाए गए अनुसार टोकन का उपयोग करता है । प्रक्रिया फिर msdb से वर्तमान नौकरी का नाम प्राप्त करती है,  workerइसे संलग्न करती है और कार्यकर्ता नौकरी का उपयोग करके शुरू करती है sp_start_job

    हालांकि यह अभी भी आदर्श नहीं है, लेकिन यह पिछले विकल्पों की तुलना में जॉब लॉग को अधिक सुव्यवस्थित और बनाए रखता है। इसके अलावा, आप हमेशा एक sysadmin उपयोगकर्ता के साथ प्रॉक्सी काम चला सकते हैं, इसलिए किसी भी अतिरिक्त अनुमतियों को जोड़ना आवश्यक नहीं है।


3

यदि डेटा लोड प्रक्रिया एक सरल क्वेरी या प्रक्रिया कॉल है, तो आप दोनों नोड्स पर कार्य बना सकते हैं और यह निर्धारित कर सकते हैं कि डेटा लोड प्रक्रिया को निष्पादित करने से पहले डेटाबेस के अपडेटैटैबिलिटी गुण के आधार पर इसकी प्राथमिक नोड आधारित है:

IF (SELECT CONVERT(sysname,DatabasePropertyEx(DB_NAME(),'Updateability'))) != 'READ_ONLY'
BEGIN

-- Data Load code goes under here

END

1

एक नया जॉब स्टेप बनाने के लिए हमेशा बेहतर होता है जो यह जाँचता है कि अगर यह एक प्राइमरी रेप्लिका है तो जॉब एक्जीक्यूशन के साथ जारी रखने के लिए सब कुछ ठीक है अगर यह सेकेंडरी रेप्लिका है तो जॉब रोक दें। नौकरी को असफल न करें अन्यथा यह अनावश्यक सूचनाएं भेजता रहेगा। इसके बजाय नौकरी रोक दें ताकि इसे रद्द कर दिया जाए और जब भी इन नौकरियों को माध्यमिक प्रतिकृति पर निष्पादित किया जाए, तो कोई सूचना नहीं भेजी जाए।

नीचे एक विशिष्ट कार्य के लिए पहला कदम जोड़ने की स्क्रिप्ट है।

स्क्रिप्ट निष्पादित करने के लिए ध्यान दें:

  • Job_ID के साथ 'XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX' को बदलें
  • जॉबनेम से 'YYYYYYYYYYYYYYYYYYYYYYYYYY' की जगह लें
  • यदि कई उपलब्धता समूह हैं, तो एजी नाम को चर @AGNameToCheck_IfMoreThanSingleAG में सेट करें, जिसके अनुसार एजी को अपनी प्रतिकृति स्थिति के लिए जाँच की जानी चाहिए।

  • यह भी ध्यान दें कि इस स्क्रिप्ट को उन सर्वरों पर भी अच्छा काम करना चाहिए जिनमें उपलब्धता समूह नहीं हैं। केवल SQL सर्वर संस्करणों 2012 और उसके बाद के लिए निष्पादित करेगा।

            USE [msdb]
            GO
            EXEC msdb.dbo.sp_add_jobstep @job_id=N'XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX', @step_name=N'CheckForSecondaryReplica', 
                    @step_id=1, 
                    @cmdexec_success_code=0, 
                    @on_success_action=3, 
                    @on_fail_action=2, 
                    @retry_attempts=0, 
                    @retry_interval=0, 
                    @os_run_priority=0, @subsystem=N'TSQL', 
                    @command=N'
            DECLARE @AGNameToCheck_IfMoreThanSingleAG VARCHAR(100)
            SET @AGNameToCheck_IfMoreThanSingleAG = ''AGName_IfMoreThanOneAG'' -- If there are Multiple AGs, then a single server can have Primary of one AG and Secondary of other. So Job creator has to define as to which AG needs to verified before the job is automatically run on Primary.
    
            DECLARE @NumberofAGs INT
            SELECT @NumberofAGs = COUNT(group_id) FROM sys.availability_groups ags
    
    
            IF(@NumberofAGs < 2)
                IF EXISTS(Select * FROM sys.dm_hadr_availability_replica_states hars WHERE role_desc = ''Secondary'' AND hars.is_local = 1)                 
                                    EXEC msdb.dbo.sp_stop_job N''YYYYYYYYYYYYYYYYYYYYYYYYYY'' ;
                                    --RAISERROR(''This is a Secondary Replica'',16,1)
    
            IF(@NumberofAGs >= 2)
                IF EXISTS(SELECT 1 FROM sys.availability_groups WHERE name = @AGNameToCheck_IfMoreThanSingleAG)
                BEGIN
                            IF EXISTS(Select * from  sys.availability_groups ag
                                            JOIN sys.dm_hadr_availability_replica_states hars
                                                        ON ag.group_id = hars.group_id
                                                        Where role_desc = ''Secondary''
                                                        AND hars.is_local = 1
                                                        AND ag.name = @AGNameToCheck_IfMoreThanSingleAG)
                            BEGIN
                                    EXEC msdb.dbo.sp_stop_job N''YYYYYYYYYYYYYYYYYYYYYYYYYY'' ;
                                    --RAISERROR(''This is a Secondary Replica'',16,1)
                            END
                END
                ELSE
                            BEGIN
                                    RAISERROR(''The Defined AG in the Variable is not a part of this Server. Please Check!!!!!!!!!!!'',16,1)
                            END', 
                    @database_name=N'master', 
                    @flags=0
            GO
    

0

एक और तरीका यह है कि प्रत्येक नौकरी में एक कदम डाला जाए, जो कि निम्नलिखित कोड के साथ पहले चलना चाहिए:

IF (SELECT ars.role_desc
    FROM sys.dm_hadr_availability_replica_states ars
    INNER JOIN sys.availability_groups ag
    ON ars.group_id = ag.group_id
    AND ars.is_local = 1) <> 'PRIMARY'
BEGIN
   --We're on the secondary node, throw an error
   THROW 50001, 'Unable to execute job on secondary node',1
END

सफलता पर अगले कदम के साथ जारी रखने के लिए इस कदम को सेट करें, और विफलता पर नौकरी रिपोर्टिंग सफलता को छोड़ दें।

मुझे मौजूदा कदम में अतिरिक्त तर्क जोड़ने के बजाय एक अतिरिक्त कदम जोड़ने के लिए क्लीनर लगता है।


0

एक और, नया विकल्प, मास्टर। Sys.fn_hadr_is_primary_replica ('DbName') का उपयोग कर रहा है। जब मैंने SQL अनुरक्षण करने के लिए SQL एजेंट का उपयोग कर (एक कर्सर जो मैंने वर्षों से उपयोग किया है) और साथ ही ETL या अन्य डेटाबेस विशिष्ट कार्य को निष्पादित करते समय मैंने यह सुपर उपयोगी पाया है। लाभ यह है कि यह पूरे उपलब्धता समूह को देखने के बजाय डेटाबेस को एकल कर देता है ... यदि आपको इसकी आवश्यकता है। यह बहुत अधिक असंभव बना देता है कि एक कमांड को एक डेटाबेस के खिलाफ निष्पादित किया जाएगा जो कि "प्राथमिक" पर था, लेकिन मान लें कि नौकरी के निष्पादन के दौरान एक स्वचालित विफलता हुई, और यह अब एक द्वितीयक प्रतिकृति पर है। उपरोक्त तरीके जो प्राथमिक प्रतिकृति को देखते हैं वे एक नज़र लेते हैं और अपडेट नहीं करते हैं। ध्यान रखें, यह बहुत ही समान परिणाम प्राप्त करने और अधिक दानेदार नियंत्रण देने का एक अलग तरीका है, अगर आपको इसकी आवश्यकता है। जब यह प्रश्न पूछा गया था, तब भी इस विधि पर चर्चा नहीं की गई थी, क्योंकि Microsoft ने SQL 2014 के रिलीज़ होने तक इस फ़ंक्शन को जारी नहीं किया था। नीचे कुछ नमूने दिए गए हैं कि इस फ़ंक्शन का उपयोग कैसे किया जा सकता है:

   IF master.dbo.fn_hadr_database_is_primary_replica('Admin') = 1
    BEGIN 
        -- do whatever you were going to do in the Primary:
        PRINT 'Doing stuff in the Primary Replica';
    END
ELSE 
    BEGIN 
        -- we're not in the Primary - exit gracefully:
        PRINT 'This is not the primary replica - exiting with success';
    END

यदि आप इसका उपयोग उपयोगकर्ता डेटाबेस रखरखाव के लिए करना चाहते हैं, तो यही है जो मैं उपयोग करता हूं:

/*Below evaluates all user databases in the instance and gives stubs to do work; must change to get anything other than print statements*/
declare @dbname varchar(1000)
declare @sql nvarchar(4000)

declare AllUserDatabases cursor for
    select [name] from master.sys.databases
    where database_id > 4 --this excludes all sysdbs; if all but tempdb is desired, change to <> 2
    and [state] = 0

open AllUserDatabases
fetch AllUserDatabases into @dbname

while (@@FETCH_STATUS = 0)
    begin
    --PRINT @dbname
        set @sql = '
            IF master.sys.fn_hadr_is_primary_replica(''' + @dbname + ''') = 1
                BEGIN 
                    -- do whatever you are going to do in the Primary:
                    PRINT ''Doing stuff in the Primary Replica''
                END
            ELSE 
                BEGIN 
                    -- not in the Primary - exit gracefully:
                    PRINT ''This is not the primary replica - exiting with success''
                END             
        '
        exec sp_executesql @sql
        fetch AllUserDatabases into @dbname
    end
close AllUserDatabases
deallocate AllUserDatabases

मुझे आशा है कि यह एक उपयोगी टिप है!


0

मैं इसका उपयोग करता हूं:

if (select primary_replica from sys.dm_hadr_availability_group_states) = @@SERVERNAME begin
... paste your t-sql here ...

end
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.