MySQL: delete… where..in () बनाम delete..from..join, और सबसिलेक्ट के साथ डिलीट पर टेबल को लॉक करें


9

डिस्क्लेमर: कृपया डेटाबेस इंटर्न के बारे में मेरे ज्ञान की कमी का बहाना करें। ये रहा:

हम एक एप्लिकेशन चलाते हैं (हमारे द्वारा लिखित नहीं) जो डेटाबेस में आवधिक सफाई कार्य में एक बड़ी प्रदर्शन समस्या है। प्रश्न इस तरह दिखता है:

delete from VARIABLE_SUBSTITUTION where BUILDRESULTSUMMARY_ID in (
       select BUILDRESULTSUMMARY_ID from BUILDRESULTSUMMARY
       where BUILDRESULTSUMMARY.BUILD_KEY = "BAM-1");

सीधे आगे, पढ़ने में आसान और मानक एसक्यूएल। लेकिन दुर्भाग्य से बहुत धीमी गति से। क्वेरी को स्पष्ट करने से पता चलता है कि मौजूदा सूचकांक VARIABLE_SUBSTITUTION.BUILDRESULTSUMMARY_IDका उपयोग नहीं किया गया है:

mysql> explain delete from VARIABLE_SUBSTITUTION where BUILDRESULTSUMMARY_ID in (
    ->        select BUILDRESULTSUMMARY_ID from BUILDRESULTSUMMARY
    ->        where BUILDRESULTSUMMARY.BUILD_KEY = "BAM-1");
| id | select_type        | table                 | type            | possible_keys                    | key     | key_len | ref  | rows    | Extra       |
+----+--------------------+-----------------------+-----------------+----------------------------------+---------+---------+------+---------+-------------+
|  1 | PRIMARY            | VARIABLE_SUBSTITUTION | ALL             | NULL                             | NULL    | NULL    | NULL | 7300039 | Using where |
|  2 | DEPENDENT SUBQUERY | BUILDRESULTSUMMARY    | unique_subquery | PRIMARY,key_number_results_index | PRIMARY | 8       | func |       1 | Using where |

यह इसे बहुत धीमा (120 सेकंड और अधिक) बनाता है। इसके अलावा, यह उन प्रश्नों को ब्लॉक करने लगता है जो इसमें सम्मिलित करने की कोशिश करते हैं BUILDRESULTSUMMARY, इससे आउटपुट show engine innodb status:

---TRANSACTION 68603695, ACTIVE 157 sec starting index read
mysql tables in use 1, locked 1
LOCK WAIT 2 lock struct(s), heap size 360, 1 row lock(s)
MySQL thread id 127964, OS thread handle 0x7facd0670700, query id 956555826 localhost 127.0.0.1 bamboosrv updating
update BUILDRESULTSUMMARY set CREATED_DATE='2015-06-18 09:22:05', UPDATED_DATE='2015-06-18 09:22:32', BUILD_KEY='BLA-RELEASE1-JOB1', BUILD_NUMBER=8, BUILD_STATE='Unknown', LIFE_CYCLE_STATE='InProgress', BUILD_DATE='2015-06-18 09:22:31.792', BUILD_CANCELLED_DATE=null, BUILD_COMPLETED_DATE='2015-06-18 09:52:02.483', DURATION=1770691, PROCESSING_DURATION=1770691, TIME_TO_FIX=null, TRIGGER_REASON='com.atlassian.bamboo.plugin.system.triggerReason:CodeChangedTriggerReason', DELTA_STATE=null, BUILD_AGENT_ID=199688199, STAGERESULT_ID=230943366, RESTART_COUNT=0, QUEUE_TIME='2015-06-18 09:22:04.52
------- TRX HAS BEEN WAITING 157 SEC FOR THIS LOCK TO BE GRANTED:
RECORD LOCKS space id 38 page no 30140 n bits 112 index `PRIMARY` of table `bamboong`.`BUILDRESULTSUMMARY` trx id 68603695 lock_mode X locks rec but not gap waiting
------------------
---TRANSACTION 68594818, ACTIVE 378 sec starting index read
mysql tables in use 2, locked 2
646590 lock struct(s), heap size 63993384, 3775190 row lock(s), undo log entries 117
MySQL thread id 127845, OS thread handle 0x7facc6bf8700, query id 956652201 localhost 127.0.0.1 bamboosrv preparing
delete from VARIABLE_SUBSTITUTION  where BUILDRESULTSUMMARY_ID in   (select BUILDRESULTSUMMARY_ID from BUILDRESULTSUMMARY where BUILDRESULTSUMMARY.BUILD_KEY = 'BLA-BLUBB10-SON')

इसने व्यवस्था को धीमा कर दिया और हमें बढ़ने के लिए मजबूर किया innodb_lock_wait_timeout

जब हम MySQL चलाते हैं, तो हम "डिलीट फ्रॉम ज्वाइन" का उपयोग करने के लिए डिलीट क्वेरी को फिर से लिखते हैं:

delete VARIABLE_SUBSTITUTION from VARIABLE_SUBSTITUTION join BUILDRESULTSUMMARY
   on VARIABLE_SUBSTITUTION.BUILDRESULTSUMMARY_ID = BUILDRESULTSUMMARY.BUILDRESULTSUMMARY_ID
   where BUILDRESULTSUMMARY.BUILD_KEY = "BAM-1";

यह पढ़ने में थोड़ा कम आसान है, दुर्भाग्य से कोई मानक एसक्यूएल (जहां तक ​​मुझे पता लगाने में सक्षम था), लेकिन बहुत तेज (0.02 सेकंड या तो) के रूप में यह सूचकांक का उपयोग करता है:

mysql> explain delete VARIABLE_SUBSTITUTION from VARIABLE_SUBSTITUTION join BUILDRESULTSUMMARY
    ->    on VARIABLE_SUBSTITUTION.BUILDRESULTSUMMARY_ID = BUILDRESULTSUMMARY.BUILDRESULTSUMMARY_ID
    ->    where BUILDRESULTSUMMARY.BUILD_KEY = "BAM-1";
| id | select_type | table                 | type | possible_keys                    | key                      | key_len | ref                                                    | rows | Extra                    |
+----+-------------+-----------------------+------+----------------------------------+--------------------------+---------+--------------------------------------------------------+------+--------------------------+
|  1 | SIMPLE      | BUILDRESULTSUMMARY    | ref  | PRIMARY,key_number_results_index | key_number_results_index | 768     | const                                                  |    1 | Using where; Using index |
|  1 | SIMPLE      | VARIABLE_SUBSTITUTION | ref  | var_subst_result_idx             | var_subst_result_idx     | 8       | bamboo_latest.BUILDRESULTSUMMARY.BUILDRESULTSUMMARY_ID |   26 | NULL                     |

अतिरिक्त जानकारी:

mysql> SHOW CREATE TABLE VARIABLE_SUBSTITUTION;
| Table                 | Create Table |
| VARIABLE_SUBSTITUTION | CREATE TABLE `VARIABLE_SUBSTITUTION` (
  `VARIABLE_SUBSTITUTION_ID` bigint(20) NOT NULL,
  `VARIABLE_KEY` varchar(255) COLLATE utf8_bin NOT NULL,
  `VARIABLE_VALUE` varchar(4000) COLLATE utf8_bin DEFAULT NULL,
  `VARIABLE_TYPE` varchar(255) COLLATE utf8_bin DEFAULT NULL,
  `BUILDRESULTSUMMARY_ID` bigint(20) NOT NULL,
  PRIMARY KEY (`VARIABLE_SUBSTITUTION_ID`),
  KEY `var_subst_result_idx` (`BUILDRESULTSUMMARY_ID`),
  KEY `var_subst_type_idx` (`VARIABLE_TYPE`),
  CONSTRAINT `FK684A7BE0A958B29F` FOREIGN KEY (`BUILDRESULTSUMMARY_ID`) REFERENCES `BUILDRESULTSUMMARY` (`BUILDRESULTSUMMARY_ID`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin |

mysql> SHOW CREATE TABLE BUILDRESULTSUMMARY;
| Table              | Create Table |
| BUILDRESULTSUMMARY | CREATE TABLE `BUILDRESULTSUMMARY` (
  `BUILDRESULTSUMMARY_ID` bigint(20) NOT NULL,
....
  `SKIPPED_TEST_COUNT` int(11) DEFAULT NULL,
  PRIMARY KEY (`BUILDRESULTSUMMARY_ID`),
  KEY `FK26506D3B9E6537B` (`CHAIN_RESULT`),
  KEY `FK26506D3BCCACF65` (`MERGERESULT_ID`),
  KEY `key_number_delta_state` (`DELTA_STATE`),
  KEY `brs_build_state_idx` (`BUILD_STATE`),
  KEY `brs_life_cycle_state_idx` (`LIFE_CYCLE_STATE`),
  KEY `brs_deletion_idx` (`MARKED_FOR_DELETION`),
  KEY `brs_stage_result_id_idx` (`STAGERESULT_ID`),
  KEY `key_number_results_index` (`BUILD_KEY`,`BUILD_NUMBER`),
  KEY `brs_agent_idx` (`BUILD_AGENT_ID`),
  KEY `rs_ctx_baseline_idx` (`VARIABLE_CONTEXT_BASELINE_ID`),
  KEY `brs_chain_result_summary_idx` (`CHAIN_RESULT`),
  KEY `brs_log_size_idx` (`LOG_SIZE`),
  CONSTRAINT `FK26506D3B9E6537B` FOREIGN KEY (`CHAIN_RESULT`) REFERENCES `BUILDRESULTSUMMARY` (`BUILDRESULTSUMMARY_ID`),
  CONSTRAINT `FK26506D3BCCACF65` FOREIGN KEY (`MERGERESULT_ID`) REFERENCES `MERGE_RESULT` (`MERGERESULT_ID`),
  CONSTRAINT `FK26506D3BCEDEEF5F` FOREIGN KEY (`STAGERESULT_ID`) REFERENCES `CHAIN_STAGE_RESULT` (`STAGERESULT_ID`),
  CONSTRAINT `FK26506D3BE3B5B062` FOREIGN KEY (`VARIABLE_CONTEXT_BASELINE_ID`) REFERENCES `VARIABLE_CONTEXT_BASELINE` (`VARIABLE_CONTEXT_BASELINE_ID`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin |

(कुछ सामान छोड़ा गया, यह काफी विस्तृत तालिका है)।

इसलिए मेरे पास इसके बारे में कुछ प्रश्न हैं:

  • क्‍वेरी ऑप्टिमाइज़र सबक्‍वेरी वर्जन को हटाने के लिए इंडेक्स का उपयोग करने में सक्षम नहीं है, जबकि यह जॉइन वर्जन का उपयोग करते समय है?
  • क्या कोई (आदर्श मानकों के अनुरूप) सूचकांक का उपयोग करने का तरीका है? या
  • वहाँ एक लिखने के लिए एक पोर्टेबल तरीका है delete from join? एप्लिकेशन PostgreSQL, MySQL, Oracle और Microsoft SQL सर्वर का समर्थन करता है, जिसका उपयोग jdbc और हाइबरनेट के माध्यम से किया जाता है।
  • VARIABLE_SUBSTITUTIONआवेषण को अवरुद्ध करने से क्यों हटाया जाता है BUILDRESULTSUMMARY, जिसका उपयोग केवल उपशीर्ष में किया जाता है?

Percona Server 5.6.24-72.2-1.jessie सम्मान 5.6.24-72.2-1.whezy (परीक्षण प्रणाली पर)।
0x89

हां, पूरा डेटाबेस मासूम का उपयोग करता है।
0x89

तो ऐसा लगता है कि आशावादी को बेहतर बनाने में 5.6 का ध्यान नहीं गया। आपको 5.7 के लिए इंतजार करना होगा (लेकिन यदि आप कर सकते हैं तो MariaDB की कोशिश करें। उनके अनुकूलक सुधार उनके 5.3 और 5.5 संस्करणों में वापस किए गए।)
ypercubeᵀᴹ

@ypercube AFAIK नो फोर्क में डिलीट सबकुछ को अनुकूलित करने के लिए एन्हांसमेंट है और न ही 5.7। डिलीट, सेलेक्ट स्टेटमेंट से अलग तरह से ऑप्टिमाइज़ होता है।
मॉर्गन टॉकर

जवाबों:


7
  • क्‍वेरी ऑप्टिमाइज़र सबक्‍वेरी वर्जन को हटाने के लिए इंडेक्स का उपयोग करने में सक्षम नहीं है, जबकि यह जॉइन वर्जन का उपयोग करते समय है?

क्योंकि आशावादी उस संबंध में थोड़ा गूंगा था / है। न केवल DELETEऔर UPDATEबल्कि SELECTबयानों के लिए भी, जैसे कुछ भी WHERE column IN (SELECT ...)पूरी तरह से अनुकूलित नहीं था। निष्पादन योजना में आमतौर पर बाहरी तालिका की प्रत्येक पंक्ति ( VARIABLE_SUBSTITUTIONइस मामले में) के लिए सबकुछ को शामिल करना शामिल था । यदि वह तालिका छोटी है, तो सब कुछ ठीक है। यदि यह बड़ा है, तो कोई उम्मीद नहीं है। यहां तक ​​कि पुराने संस्करणों में, एक उप-उपश्रेणी के INसाथ एक INउप- EXPLAINवर्ग भी युगों तक चलने के लिए बनाता है।

आप क्या कर सकते हैं - यदि आप इस क्वेरी को रखना चाहते हैं - उन नवीनतम संस्करणों का उपयोग करना है जिन्होंने कई अनुकूलन किए हैं और फिर से परीक्षण किया है। नवीनतम संस्करण का अर्थ है: MySQL 5.6 (और 5.7 जब यह बीटा से बाहर आता है) और मारियाबीडी 5.5 / 10.0

(अपडेट) आप पहले से ही 5.6 का उपयोग करते हैं जिसमें ऑप्टिमाइज़ेशन सुधार हैं, और यह एक प्रासंगिक है: सेमी-ज्वाइंट ट्रांसफ़ॉर्मेशन के साथ सबक्वेरीज़ को ऑप्टिमाइज़ करना
मैं सुझाव देता हूं कि मैं (BUILD_KEY)अकेले एक इंडेक्स जोड़ रहा हूं । एक समग्र है, लेकिन इस क्वेरी के लिए बहुत उपयोगी नहीं है।

  • क्या कोई (आदर्श मानकों के अनुरूप) सूचकांक का उपयोग करने का तरीका है?

मैं किसी के बारे में सोच नहीं सकता। मेरी राय में, मानक SQL का उपयोग करने की कोशिश करने में बहुत लायक नहीं है। बहुत सारे अंतर और छोटी-छोटी क़िस्में हैं जो प्रत्येक DBMS में हैं ( UPDATEऔर DELETEकथन ऐसे मतभेदों के अच्छे उदाहरण हैं) जब आप हर जगह काम करने वाली चीज़ का उपयोग करने का प्रयास करते हैं, तो परिणाम SQL का एक बहुत ही सीमित उपसमूह होता है।

  • वहाँ एक पोर्टेबल तरीका है में शामिल होने से हटा दें? एप्लिकेशन PostgreSQL, MySQL, Oracle और Microsoft SQL सर्वर का समर्थन करता है, जिसका उपयोग jdbc और हाइबरनेट के माध्यम से किया जाता है।

पिछले प्रश्न के रूप में एक ही जवाब।

  • BUARDRESULTSUMMARY में VARIABLE_SUBSTITUTION आवेषण को हटाने से क्यों हटा दिया जाता है, जो केवल उप-उपयोग में उपयोग किया जाता है?

100% निश्चित नहीं है, लेकिन मुझे लगता है कि इसे कई बार उपकुंजी चलाने के साथ करना पड़ता है और यह किस प्रकार के ताले मेज पर ले जा रहा है।


Innodb_status (लेनदेन को हटाने) से "3775190 पंक्ति लॉक (s) अत्यधिक विचारोत्तेजक है। लेकिन "mysql टेबल्स इन
यूज़

2

यहाँ आपके दो प्रश्नों के उत्तर दिए गए हैं

  • ऑप्टिमाइज़र इंडेक्स का उपयोग करने में सक्षम नहीं है क्योंकि जहां हर पंक्ति के लिए क्लॉज बदलता है। ऑप्टिमाइज़र पास करने के बाद डिलीट स्टेटमेंट कुछ इस तरह दिखाई देगा

    delete from VARIABLE_SUBSTITUTION where EXISTS (
    select BUILDRESULTSUMMARY_ID from BUILDRESULTSUMMARY
    where BUILDRESULTSUMMARY.BUILD_KEY = BUILDRESULTSUMMARY_ID AND BUILDRESULTSUMMARY.BUILD_KEY = "BAM-1");
    

लेकिन जब आप जॉइन करते हैं, तो सर्वर डिलीट करने के लिए सब्जेक्ट की गई पंक्तियों की पहचान करने में सक्षम होता है।

  • ट्रिक BUILDRESULTSUMMARY_IDक्वेरी के बजाय वेरिएबल को होल्ड करने के लिए और वेरिएबल का उपयोग करने के लिए है। ध्यान दें कि दोनों चर आरंभीकरण और हटाना क्वेरी एक सत्र के भीतर चलना चाहिए। कुछ इस तरह।

    SET @ids = (SELECT GROUP_CONCAT(BUILDRESULTSUMMARY_ID) 
            from BUILDRESULTSUMMARY where BUILDRESULTSUMMARY.BUILD_KEY = "BAM-1" ); 
    delete from VARIABLE_SUBSTITUTION where FIND_IN_SET(BUILDRESULTSUMMARY_ID,@ids) > 0;
    

    यदि क्वेरी बहुत अधिक आईडी लौटाती है और यह कोई मानक तरीका नहीं है, तो आपको इससे समस्या हो सकती है। यह सिर्फ एक वर्कअराउंड है।

    और मेरे पास आपके अन्य दो प्रश्नों का उत्तर नहीं है :)


ठीक है, आपने मेरी बात को याद किया। मुझे लगता है कि आप पर विचार नहीं किया दोनों VARIABLE_SUBSTITUTION और BUILDRESULTSUMMARY तो यह होना चाहिए BUILDRESULTSUMMARY_ID नाम है, एक स्तंभ है कि है: 'VARIABLE_SUBSTITUTION जहां मौजूद से हटाना (BUILDRESULTSUMMARY से BUILDRESULTSUMMARY_ID का चयन करें जहां BUILDRESULTSUMMARY.BUILDRESULTSUMMARY_ID = VARIABLE_SUBSTITUTION.BUILDRESULTSUMMARY_ID और BUILDRESULTSUMMARY.BUILD_KEY = "BAM -1 "); '। तब यह समझ में आता है, और दोनों प्रश्न समान हैं।
0x89

1
हाँ, सिर्फ बाहरी तालिका का संदर्भ याद कर रहा हूँ। लेकिन यह मुद्दा नहीं है। यह सिर्फ एक दृष्टांत है कि इसे ऑप्टिमाइज़र में कैसे माना जाएगा।
मसूद

मामूली अंतर के साथ कि ऑप्टिमाइज़र एक समान क्वेरी का उत्पादन करेगा।
0x89
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.