यौगिक कुंजी के पहले भाग के रूप में DATETIME के ​​साथ प्राथमिक कुंजी सूचकांक का उपयोग कभी नहीं किया जाता है


17

मुझे अपने PRIMARY KEY के पहले भाग के रूप में एक DATETIME (या यहां तक ​​कि एक तारीख) INDEXING की समस्या है।

मैं MySQL 5.5 का उपयोग करता हूं

यहाँ मेरी दो तालिकाएँ हैं:

-- This is my standard table with dateDim as a dateTime

CREATE TABLE `stats` (
 `dateDim` datetime NOT NULL,
 `accountDim` mediumint(8) unsigned NOT NULL,
 `execCodeDim` smallint(5) unsigned NOT NULL,
 `operationTypeDim` tinyint(3) unsigned NOT NULL,
 `junkDim` tinyint(3) unsigned NOT NULL,
 `ipCountryDim` smallint(5) unsigned NOT NULL,
 `count` int(10) unsigned NOT NULL,
 `amount` bigint(20) NOT NULL,
 PRIMARY KEY (`dateDim`,`accountDim`,`execCodeDim`,`operationTypeDim`,`junkDim`,`ipCountryDim`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8


-- Here is a copy with datDim as an integer

CREATE TABLE `stats_todays` (
`dateDim` int(11) unsigned NOT NULL,
 `accountDim` mediumint(8) unsigned NOT NULL,
 `execCodeDim` smallint(5) unsigned NOT NULL,
 `operationTypeDim` tinyint(3) unsigned NOT NULL,
 `junkDim` tinyint(3) unsigned NOT NULL,
 `ipCountryDim` smallint(5) unsigned NOT NULL,
 `count` int(10) unsigned NOT NULL,
 `amount` bigint(20) NOT NULL,
 PRIMARY KEY (`dateDim`,`accountDim`,`execCodeDim`,`operationTypeDim`,`junkDim`,`ipCountryDim`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8

मैं दोनों तालिका को समान डेटा के साथ भरता हूं (10 000 000 के पास)

परंतु:

  • आँकड़े तालिका डेटाइम के लिए DATETIME का उपयोग करती हैं
  • डेट_ के लिए आँकड़े_टोडेज़ TO_DAYS () के साथ un INTEGER का उपयोग करते हैं

मेरा सवाल यह है कि जब सूचकांक का पहला भाग एक डेटाइम है तो MySQL के पास प्राथमिक कुंजी क्यों नहीं है ??? यह बहुत ही अजीब है क्योंकि एक ही डेटा के साथ लेकिन एक INTEGER और TO_DAYS (डेटडिम) के साथ समेकित किया जाता है।

आंकड़े तालिका (और डेटाटाइम) के साथ उदाहरण:

SELECT * 
FROM `stats`  
WHERE 
   dateDim = '2014-04-03 00:00:00' 
   AND accountDim = 4
   AND execCodeDim = 9
   AND operationTypeDim = 1
   AND junkDim = 5
   AND ipCountryDim = 3

=> 1 result (4.5sec)

Explain:

id  select_type     table   type    possible_keys   key     key_len     ref     rows           Extra
1   SIMPLE          stats   ALL           NULL     NULL       NULL      NULL    8832329     Using where

अन्य तालिका आँकड़े_टोडे (INTEGER और TO_DAYS के साथ) पर समान अनुरोध ()

EXPLAIN SELECT * 
FROM `stats_todays`  
WHERE 
   dateDim = TO_DAYS('2014-04-03 00:00:00')
   AND accountDim = 4
   AND execCodeDim = 9
   AND operationTypeDim = 1
   AND junkDim = 5
   AND ipCountryDim = 3

=> Result 1 row (0.0003 sec) 

Explain:

id  select_type     table          type     possible_keys   key     key_len     ref                               rows  Extra
1   SIMPLE         stats_todays     const   PRIMARY     PRIMARY     13  const,const,const,const,const,const     1    

यदि आप पूरी पोस्ट पढ़ते हैं, तो आप समझते हैं कि एक कम कार्डिनैलिटी की समस्या नहीं है क्योंकि अनुरोध एक ही कार्डिनलिटी के साथ काम करता है जिसमें एक इंटेगर डेटिम फ़ील्ड है ...।

यहां कुछ उन्नत विवरण दिए गए हैं:

SELECT COUNT( DISTINCT dateDim )
FROM stats_todays
UNION ALL
SELECT COUNT( DISTINCT dateDim )
FROM stats;

Result:


COUNT(DISTINCT dateDim)
2192
2192

यहाँ INDEX विवरण दिया गया है:

SHOW INDEXES FROM `stats` 

Table   Non_unique  Key_name    Seq_in_index    Column_name     Collation   Cardinality     Sub_part    Packed  Null    Index_type  Comment     Index_comment
stats   0            PRIMARY          1         dateDim           A     6921           NULL                 NULL        BTREE        
stats   0            PRIMARY          2         accountDim        A     883232         NULL                 NULL        BTREE        
stats   0            PRIMARY          3         execCodeDim       A     8832329     NULL                NULL        BTREE        
stats   0            PRIMARY          4         operationTypeDim  A     8832329     NULL                NULL        BTREE        
stats   0            PRIMARY          5         junkDim           A     8832329     NULL                NULL        BTREE        
stats   0            PRIMARY          6         ipCountryDim      A     8832329     NULL                NULL        BTREE       

SHOW INDEXES FROM `stats_todays` 

Table   Non_unique  Key_name    Seq_in_index    Column_name     Collation   Cardinality     Sub_part    Packed  Null    Index_type  Comment     Index_comment
stats_todays    0   PRIMARY     1              dateDim              A        7518   NULL                   NULL         BTREE        
stats_todays    0   PRIMARY     2              accountDim           A        4022582    NULL                   NULL         BTREE        
stats_todays    0   PRIMARY     3              execCodeDim          A        8045164    NULL                   NULL         BTREE        
stats_todays    0   PRIMARY     4              operationTypeDim     A        8045164    NULL                   NULL         BTREE        
stats_todays    0   PRIMARY     5              junkDim              A        8045164    NULL                   NULL         BTREE        
stats_todays    0   PRIMARY     6              ipCountryDim         A        8045164    NULL                   NULL         BTREE        

डेट का चयन करें, COUNT (*) सांख्यिकी समूह से डेटलाइन के साथ रोलअप करें

  • बताता है कि 2192 अलग-अलग तिथियां हैं, और पुनरावृत्ति सुचारू है (लगभग 3000 - 4000 पंक्तियाँ तारीख तक)
  • तालिका में 8 831 990 पंक्तियाँ हैं
  • अन्य तालिका के लिए भी यही है
  • मैंने INDEX को भरने की कोशिश की (सभी PK स्तंभों द्वारा * की जगह) => कुछ भी नहीं बदला
  • मैंने बल की कोशिश की | इंडेक्स => कुछ भी नहीं बदला
  • डेटटाइम के बजाय दिनांक फ़ील्ड के साथ भी ऐसा ही है
  • प्राथमिक कुंजी के बजाय INDEX या UNIQUE के साथ भी ऐसा ही है

यह वाकई अजीब है। यदि आप dateइसके बजाय उपयोग करते हैं तो क्या ऐसा ही होता है datetime?
ypercube y

हाँ यह ठीक वैसा ही करता है

1
और अगर आप चलाएंगे WHERE dateDim = DATE('2014-04-03 00:00:00')?
ypercube y

1
पीके के एक रिकॉर्डर के साथ यह काम करता है। लेकिन तथ्यों में, मैं केवल डेटडिम और अकाउंटडिम के साथ अनुरोध करना चाहता हूं कि कहां क्लॉज है। मैं केस स्टडी के लिए सभी पीके फील्ड का इस्तेमाल करता हूं ...

1
तारीख कहां = तारीख ('2014-04-03 00:00:00') => कुछ भी नहीं बदला

जवाबों:


6

यह 5.5.x में एक बग है। यहाँ देखें

इससे पता चलता है कि आपकी क्वेरी होनी चाहिए

SELECT * 
FROM `stats`  
WHERE 
   dateDim = CAST('2014-04-03 00:00:00' as datetime)
   AND accountDim = 4
   AND execCodeDim = 9
   AND operationTypeDim = 1
   AND junkDim = 5
   AND ipCountryDim = 3

1

तालिका के अंतर संस्करण के बाद से

CREATE TABLE `stats_todays` ( 
`dateDim` int(11) unsigned NOT NULL, 
 `accountDim` mediumint(8) unsigned NOT NULL, 
 `execCodeDim` smallint(5) unsigned NOT NULL, 
 `operationTypeDim` tinyint(3) unsigned NOT NULL, 
 `junkDim` tinyint(3) unsigned NOT NULL, 
 `ipCountryDim` smallint(5) unsigned NOT NULL, 
 `count` int(10) unsigned NOT NULL, 
 `amount` bigint(20) NOT NULL, 
 PRIMARY KEY (`dateDim`,`accountDim`,`execCodeDim`,`operationTypeDim`,`junkDim`,`ipCountryDim`) 
) ENGINE=InnoDB DEFAULT CHARSET=utf8 

क्वेरी के संदर्भ में ठीक काम करता है, आपके पास डेटडिम में डेटाइम स्ट्रिंग का UNIX_TIMESTAMP () होना चाहिए । आपको क्वेरी इस तरह दिखाई देगी:

SELECT *        
FROM `stats`         
WHERE        
   dateDim = UNIX_TIMESTAMP('2014-04-03 00:00:00')
   AND accountDim = 4       
   AND execCodeDim = 9       
   AND operationTypeDim = 1       
   AND junkDim = 5       
   AND ipCountryDim = 3       
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.