व्यक्तिगत प्रश्न 10ms पर चलते हैं, UNION के साथ वे 290ms + (7.7M रिकॉर्ड MySQL DB) ले रहे हैं। कैसे अनुकूलित करें?


9

मेरे पास एक तालिका है जो शिक्षकों के लिए उपलब्ध नियुक्तियों को संग्रहीत करती है, दो प्रकार के सम्मिलन की अनुमति देती है:

  1. प्रति घंटा आधारित : प्रति शिक्षक प्रति दिन असीमित स्लॉट्स जोड़ने की पूर्ण स्वतंत्रता के साथ (जब तक स्लॉट ओवरलैप नहीं होते हैं): 15 / अप्रैल को एक शिक्षक के पास 10:00, 11:00, 12:00 और 16:00 बजे स्लॉट हो सकते हैं । एक व्यक्ति को एक विशिष्ट शिक्षक समय / स्लॉट चुनने के बाद परोसा जाता है।

  2. समय अवधि / सीमा : 15 / अप्रैल को एक और शिक्षक 10:00 से 12:00 और फिर 14:00 से 18:00 तक काम कर सकता है। आगमन के आदेश से एक व्यक्ति की सेवा की जाती है, इसलिए यदि कोई शिक्षक 10:00 बजे से 12:00 बजे तक काम करता है, तो इस अवधि में आने वाले सभी व्यक्ति आगमन के आदेश (स्थानीय कतार) में शामिल होंगे।

चूंकि मुझे एक खोज में सभी उपलब्ध शिक्षकों को वापस करना है, इसलिए मुझे सभी स्लॉट्स को उसी तालिका में सहेजने की आवश्यकता है जैसे कि आगमन रेंज। इस तरह मैं date_from ASC द्वारा ऑर्डर कर सकता हूं, खोज परिणामों पर पहले उपलब्ध स्लॉट्स दिखा रहा हूं।

वर्तमान तालिका संरचना

CREATE TABLE `teacher_slots` (
  `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
  `teacher_id` mediumint(8) unsigned NOT NULL,
  `city_id` smallint(5) unsigned NOT NULL,
  `subject_id` smallint(5) unsigned NOT NULL,
  `date_from` datetime NOT NULL DEFAULT '0000-00-00 00:00:00',
  `date_to` datetime NOT NULL DEFAULT '0000-00-00 00:00:00',
  `status` tinyint(4) NOT NULL DEFAULT '0',
  `order_of_arrival` tinyint(1) unsigned NOT NULL DEFAULT '0',
  PRIMARY KEY (`id`),
  KEY `by_hour_idx` (`teacher_id`,`order_of_arrival`,`status`,`city_id`,`subject_id`,`date_from`),
  KEY `order_arrival_idx` (`order_of_arrival`,`status`,`city_id`,`subject_id`,`date_from`,`date_to`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;

पूछताछ कीजिए

मुझे इसके द्वारा फ़िल्टर करने की आवश्यकता है: वास्तविक डेटाटाइम, city_id, subject_id और यदि कोई स्लॉट उपलब्ध है (स्थिति = 0)।

के लिए प्रति घंटा के आधार मैं हर शिक्षक के लिए पहली निकटतम उपलब्ध दिन के लिए सभी उपलब्ध स्लॉट्स दिखाने के लिए (किसी विशेष दिन के सभी समय स्लॉट दिखाने के लिए और एक ही शिक्षक के लिए और अधिक से अधिक एक दिन नहीं दिखा सकते हैं)। (मुझे मैटेडगॉड की मदद से क्वेरी मिली )।

के लिए आधारित रेंज (order_of_arrival = 1), मैं निकटतम उपलब्ध रेंज, प्रति शिक्षक सिर्फ एक समय दिखाने के लिए।

पहली क्वेरी लगभग ०.१० एमएस, दूसरी क्वेरी ०.० and एमएस और यूनिअन सभी में ३०० मी की औसत चलती है।

(
    SELECT id, teacher_slots.teacher_id, date_from, date_to, order_of_arrival
    FROM teacher_slots
    JOIN (
        SELECT DATE(MIN(date_from)) as closestDay, teacher_id
        FROM teacher_slots
        WHERE   date_from >= '2014-04-10 08:00:00' AND order_of_arrival = 0
                AND status = 0 AND city_id = 6015 AND subject_id = 1
        GROUP BY teacher_id
    ) a ON a.teacher_id = teacher_slots.teacher_id
    AND DATE(teacher_slots.date_from) = closestDay
    WHERE teacher_slots.date_from >= '2014-04-10 08:00:00'
        AND teacher_slots.order_of_arrival = 0
        AND teacher_slots.status = 0
        AND teacher_slots.city_id = 6015
        AND teacher_slots.subject_id = 1
)

UNION ALL

(
    SELECT id, teacher_id, date_from, date_to, order_of_arrival
    FROM teacher_slots
    WHERE order_of_arrival = 1 AND status = 0 AND city_id = 6015 AND subject_id = 1
        AND (
            (date_from <= '2014-04-10 08:00:00' AND  date_to >= '2014-04-10 08:00:00')
            OR (date_from >= '2014-04-10 08:00:00')
        )
    GROUP BY teacher_id
)

ORDER BY date_from ASC;

सवाल

क्या UNION का अनुकूलन करने का कोई तरीका है, इसलिए मुझे अधिकतम ~ 20ms या यहां तक ​​कि रिटर्न रेंज आधारित + प्रति घंटा की एक उचित प्रतिक्रिया प्राप्त हो सकती है जो कि केवल एक क्वेरी (एक IF, आदि के साथ) में आधारित है?

एसक्यूएल फिडेल: http://www.sqlfiddle.com/#/2/59420/1/0

संपादित करें:

मैंने एक फ़ील्ड "only_date_from" बनाकर कुछ वियोग की कोशिश की, जहाँ मैंने केवल तारीख जमा की, इसलिए मैं इसे बदल सकता था ...

DATE(MIN(date_from)) as closestDay / DATE(teacher_slots.date_from) = closestDay

... इसके लिए

MIN(only_date_from) as closestDay / teacher_slots.only_date_from = closestDay

यह पहले से ही मुझे 100ms बचा लिया! अभी भी औसतन 200 मी।

जवाबों:


1

सबसे पहले, मुझे लगता है कि आपकी मूल क्वेरी "सही" नहीं हो सकती है; अपनी SQLFiddle के संदर्भ में, यह मुझे ऐसा लगता है जैसे कि आपको पंक्तियों को ID= के साथ लौटाया जाना चाहिए 2, 3और 4(पंक्ति के साथ ID= 1आप इस आधे से प्राप्त कर रहे हैं ), क्योंकि आपका मौजूदा तर्क ऐसा प्रतीत होता है जैसे आप इन अन्य पंक्तियों के लिए अभिप्रेत हैं शामिल होने के लिए, क्योंकि वे स्पष्ट रूप OR (date_from >= '2014-04-10 08:00:00')से आपके दूसरे WHEREखंड के हिस्से को पूरा करते हैं ।

GROUP BY teacher_idअपने के अपने दूसरे भाग में खंड UNIONआप उन पंक्तियों को कम करने के लिए हो रही है। ऐसा इसलिए है क्योंकि आप वास्तव में अपनी चयनित सूची में किसी भी कॉलम को एकत्र नहीं कर रहे हैं, और इस मामले में GROUP BYव्यवहार को परिभाषित करना मुश्किल होगा।

इसके अलावा, जब मैं आपके खराब प्रदर्शन की व्याख्या नहीं कर सकता UNION, तो मैं आपके लिए इसे आपके प्रश्न से हटाकर एकमुश्त काम कर सकता हूं:

एक ही तालिका से पंक्तियों को प्राप्त करने के लिए तर्क के दो अलग (और भागों में, दोहराते हुए) सेटों का उपयोग करने के बजाय, मैंने आपके तर्क को एक तर्क में एक साथ आपके तर्क ORएड में अंतर के साथ समेकित किया है - यदि कोई पंक्ति एक या दूसरे से मिलती है आपके मूल WHEREखंडों में, यह शामिल है। यह संभव है क्योंकि मैंने आपके द्वारा प्रतिस्थापित किया गया है एक (INNER) JOINके closestDateसाथ खोजने के लिए उपयोग कर रहे थे LEFT JOIN

इसका LEFT JOINमतलब है कि हम अब यह भी भेद करने में सक्षम हैं कि तर्क के किस सेट को एक पंक्ति में लागू किया जाना चाहिए; यदि जॉइन काम करता है (निकटतम IS IS NULL) तो हम आपके तर्क को पहले हाफ से लागू करते हैं, लेकिन यदि जॉइन विफल हो जाता है (निकटतम NULL) तो हम आपके दूसरे हाफ से तर्क लागू करते हैं।

तो यह उन सभी पंक्तियों को वापस कर देगा जो आपकी क्वेरी (फ़िडल में) लौटी थी, और यह उन अतिरिक्त को भी उठा रही है।

  SELECT
    *

  FROM 
    teacher_slots ts

    LEFT JOIN 
    (
      SELECT 
        teacher_id,
        DATE(MIN(date_from)) as closestDay

      FROM 
        teacher_slots

      WHERE   
        date_from >= '2014-04-10 08:00:00' 
        AND order_of_arrival = 0
        AND status = 0 
        AND city_id = 6015 
        AND subject_id = 1

      GROUP BY 
        teacher_id

    ) a
    ON a.teacher_id = ts.teacher_id
    AND a.closestDay = DATE(ts.date_from)

  WHERE 
    /* conditions that were common to both halves of the union */
    ts.status = 0
    AND ts.city_id = 6015
    AND ts.subject_id = 1

    AND
    (
      (
        /* conditions that were from above the union 
           (ie when we joined to get closest future date) */
        a.teacher_id IS NOT NULL
        AND ts.date_from >= '2014-04-10 08:00:00'
        AND ts.order_of_arrival = 0
      ) 
      OR
      (
        /* conditions that were below the union 
          (ie when we didn't join) */
        a.teacher_id IS NULL       
        AND ts.order_of_arrival = 1 
        AND 
        (
          (
            date_from <= '2014-04-10 08:00:00' 
            AND  
            date_to >= '2014-04-10 08:00:00'
          )

          /* rows that met this condition were being discarded 
             as a result of 'difficult to define' GROUP BY behaviour. */
          OR date_from >= '2014-04-10 08:00:00' 
        )
      )
    )

  ORDER BY 
   ts.date_from ASC;

इसके अलावा, आप अपनी क्वेरी "को साफ़ रखने" कर सकते हैं आगे, ताकि आप अपने "में प्लग" की जरूरत नहीं है status, city_idऔर subject_idमानकों को एक बार से अधिक।

ऐसा करने के लिए, aउन स्तंभों का चयन करने के लिए उपश्रेणी को भी बदलें और उन स्तंभों पर भी समूह बनाएं। फिर, JOINके ONखंड उनके लिए उन स्तंभों को मैप करने की आवश्यकता होगी ts.xxxसमकक्ष।

मुझे नहीं लगता कि यह प्रदर्शन को नकारात्मक रूप से प्रभावित करेगा, लेकिन एक बड़े डेटासेट पर परीक्षण के बिना सुनिश्चित नहीं किया जा सकता है।

तो आपका जुड़ाव अधिक दिखाई देगा:

LEFT JOIN 
(
  SELECT 
    teacher_id,
    status,
    city_id,
    subject_id,
    DATE(MIN(date_from)) as closestDay

  FROM 
    teacher_slots

  WHERE   
    date_from >= '2014-04-10 08:00:00' 
    AND order_of_arrival = 0
  /* These no longer required here...
    AND status = 0 
    AND city_id = 6015 
    AND subject_id = 1
  */

  GROUP BY 
    teacher_id,
    status,
    city_id,
    subject_id

) a
ON a.teacher_id = ts.teacher_id
AND a.status = ts.status 
AND a.city_id = ts.city_id 
AND a.subject_id = ts.city_id
AND a.closestDay = DATE(ts.date_from)

2

इस प्रश्न को आज़माएं:

(
select * from (SELECT id, teacher_slots.teacher_id, date_from, date_to,  order_of_arrival
FROM teacher_slots  WHERE teacher_slots.date_from >= '2014-04-10 08:00:00'
    AND teacher_slots.order_of_arrival = 0
    AND teacher_slots.status = 0
    AND teacher_slots.city_id = 6015
    AND teacher_slots.subject_id = 1) 
 teacher_slots
JOIN (
    SELECT DATE(MIN(date_from)) as closestDay, teacher_id
    FROM teacher_slots
    WHERE   date_from >= '2014-04-10 08:00:00' AND order_of_arrival = 0
            AND status = 0 AND city_id = 6015 AND subject_id = 1
    GROUP BY teacher_id
) a ON a.teacher_id = teacher_slots.teacher_id
AND DATE(teacher_slots.date_from) = closestDay

)

UNION ALL

(
SELECT id, teacher_id, date_from, date_to, order_of_arrival
FROM teacher_slots
WHERE order_of_arrival = 1 AND status = 0 AND city_id = 6015 AND subject_id = 1
    AND (
        (date_from <= '2014-04-10 08:00:00' AND  date_to >= '2014-04-10 08:00:00')
        OR (date_from >= '2014-04-10 08:00:00')
    )
GROUP BY teacher_id
)

ORDER BY date_from ASC;
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.