[MySQL]join duurt te lang - Softwareontwikkeling

dinsdag 28 maart 2006 14:37

Acties:

Verwijderd

Topicstarter

Hallo,

Mijn situatie is als volgt:

2 tabellen (user_settings en detailed_record, de eerste ongeveer 100.000 records de tweede ongeveer 900.000)

user_settings
-----------------
record_id (PK)
anomaly_id

detailed_record
-------------------
record_id (PK)
anomaly_id
car_id
first_activitation_date
nb_occurence

Ik wil nu uit detailed_record alle records hebben waarvan anomaly_id aanwezig is in user_settings.
Dit doe ik als volgt:

code:

select car_id, anomaly_id, first_activation_date, nb_occurence 
from detailed_record a 
inner join user_settings b 
on (a.anomaly_id = b.anomaly_id) 
where (a.first_activation_date >= '2005-12-4') and 
(a.first_activation_date <= '2005-12-30')

Dit geeft als resultaat: 457425 rijen in een kleine 1000 seconden.

ik heb het ook zo geprobeerd:

code:

select car_id, anomaly_id, first_activation_date, nb_occurence, 
from detailed_record a 
where ((a.first_activation_date >= '2005-12-4') and 
(a.first_activation_date <= '2005-12-30')) and 
a.anomaly_id in 
(select anomaly_id from usersettings)

Ik verwachte hetzelfde aantal rijen, maar ik krijg: 99014 rijen
in 300 seconden.

Ik heb het ook nog op een derde manier geprobeerd:

code:

select car_id, anomaly_id, first_activation_date, nb_occurence 
from detailed_record a 
where exists 
(select anomaly_id from user_settings b where ( 
(a.anomaly_id = b.anomaly_id) and (a.first_activation_date 
>= '2005-12-4') and (a.first_activation_date <= 
'2005-12-30')) 
)

Die geeft hetzelfde resultaat als tweede manier maar werkt wel trager.

Welke methode is nu juist?? (want het resultaat van de join en de andere methoden verschillen). En ook, hoe kan ik het rapper doen werken? Ik zit immers nog maar met een test databank, het aantal records neemt maandelijks toe.

Bedankt,

Bram

dinsdag 28 maart 2006 14:40

Acties:

whoami

Hoe je het rapper doet werken ? Door goede indexen te leggen.

https://fgheysels.github.io/

dinsdag 28 maart 2006 14:40

Acties:

x-force

Je hebt anomaly_id niet als key/index staan. Als je deze toevoegd zal dit zeker helpen. Verder heb ik weinig ervaring met het optimaliseren van queries.

[ Voor 3% gewijzigd door x-force op 28-03-2006 14:41 ]

VangenopBetaalwater.nl Het platform om ervaringen over betaalwater in Frankrijk te delen met andere karpervissers zodat iedereen kan vangen op betaalwater!

dinsdag 28 maart 2006 14:43

Acties:

Verwijderd

Topicstarter

ik kan eventueel anomaly_id van de tabel user_settings indexeren, maar aan de andere tabel kan ik niks wijzigen (niet toegelaten).
En enig idee wrm het resultaat van de queries niet overeenkomt?

[ Voor 20% gewijzigd door Verwijderd op 28-03-2006 14:43 ]

dinsdag 28 maart 2006 15:04

Acties:

whoami

Aangezien je op activation-date filtert, is het ook handig om daar een index op te leggen.

(Je moet wel de kost van indexen afwegen natuurlijk, selects gaan sneller, maar inserts/updates gaan trager. Ik weet ook niet precies hoe MySQL omgaat met indexen; kan MySQL nu al méér dan één index gebruiken op één tabel binnen eenzelfde query ? ).

Ivm je verschil in rijen: wat gebeurt er als je je filter expressie niet in de where opneemt, maar bij de join-conditie zet ?

https://fgheysels.github.io/

dinsdag 28 maart 2006 15:20

Acties:

JKVA

Design-by-buzzword fanatic

whoami schreef op dinsdag 28 maart 2006 @ 15:04:

Ivm je verschil in rijen: wat gebeurt er als je je filter expressie niet in de where opneemt, maar bij de join-conditie zet ?

Dan moet je ook je index weer aanpassen eigenlijk, dat die meerdere rijen indexeert. Anders heb je er nog niks an.

Het is trouwens een inner join, dus waarschijnlijk maakt het geen verschil. Weet je zeker dat de data in de database ok is?

[ Voor 49% gewijzigd door JKVA op 28-03-2006 15:23 ]

Fat Pizza's pizza, they are big and they are cheezy

dinsdag 28 maart 2006 15:28

Acties:

whoami

JKVA schreef op dinsdag 28 maart 2006 @ 15:20:
[...]

Dan moet je ook je index weer aanpassen eigenlijk, dat die meerdere rijen indexeert. Anders heb je er nog niks an.

https://fgheysels.github.io/

dinsdag 28 maart 2006 15:37

Acties:

Verwijderd

Topicstarter

als ik de selectie in de on-clausule plaats dan krijg ik nog meer records terug ...

Indexeren helpt slechts weinig, enkele tientallen seconden op 300 sec.
En ja indexeren op meerdere kolommen gaat.

dinsdag 28 maart 2006 15:43

Acties:

mjax

Verwijderd schreef op dinsdag 28 maart 2006 @ 15:37:
als ik de selectie in de on-clausule plaats dan krijg ik nog meer records terug ...

Indexeren helpt slechts weinig, enkele tientallen seconden op 300 sec.
En ja indexeren op meerdere kolommen gaat.

Kun je een EXPLAIN van de query hier posten? Dan kunnen we zien hoe de optimizer de query wil uitvoeren en met welke indexen.

dinsdag 28 maart 2006 15:43

Acties:

whoami

Ik vind het behoorlijk vreemd dat je een verschil krijgt in het aantal rijen dat je terugkrijgt.... IMHO zou dat toch hetzelfde moeten zijn...

Wellicht moet je ook eerst eens even je statistics updaten, vooraleer die nieuwe indexen echt effect hebben. Ik vraag me ook af wat het gevolg is van het plaatsen van quotes rond die datum. Ik denk dat MySQL ook je de inhoud van je datumveld eerst naar een varchar/char zal casten, wat ook vertragend werkt en waardoor er wellicht geen indexen gebruikt worden, maar dat ben ik niet zeker.
Bekijk anders eens het execution plan van die query ?

https://fgheysels.github.io/

dinsdag 28 maart 2006 16:00

Acties:

Verwijderd

Topicstarter

id	select_type	table	type	possible_keys	key	key_len	ref	Extra
1	PRIMARY	a	ALL					Using where; Using filesort
2	DEPENDENT SUBQUERY	b	index

dit is den explain van de querie die gebruik maakt van de where anomaly_id in ( ... subquery... ) (die geeft namelijk het beste resultaat)

[ Voor 99% gewijzigd door Verwijderd op 28-03-2006 16:06 ]

dinsdag 28 maart 2006 19:11

Acties:

JKVA

Design-by-buzzword fanatic

whoami schreef op dinsdag 28 maart 2006 @ 15:28:
[...]

Eh

Ik merk nu pas dat ik iets doms gezegd heb.

Ik bedoel natuurlijk geen rijen, maar kolommen.

Fat Pizza's pizza, they are big and they are cheezy

dinsdag 28 maart 2006 19:13

Acties:

JKVA

Design-by-buzzword fanatic

Als je ergens "using filesort" ziet, is het mis, dan wordt er geen index gebruikt. Met tabel b lijkt me niks mis.

Fat Pizza's pizza, they are big and they are cheezy

woensdag 29 maart 2006 11:36

Acties:

zeroxcool

JKVA schreef op dinsdag 28 maart 2006 @ 19:13:
Als je ergens "using filesort" ziet, is het mis, dan wordt er geen index gebruikt. Met tabel b lijkt me niks mis.

Filesorting an sich is niet erg. Dat doet MySQL volgens mij bij iedere sortering. Als je een filesort over 'maar' 100 records doet is dat niet erg.

Kijk vooral naar type, als die op ALL staat dan is het mis. En uiteraard naar het aantal rows.

zeroxcool.net - curity.eu

woensdag 29 maart 2006 18:22

Acties:

Verwijderd

Topicstarter

mja
probleem is dat ik aan tabel a niets mag wijzigen...

donderdag 30 maart 2006 13:51

Acties:

DexterDee

I doubt, therefore I might be

Indien de MySQL server een versie 5 of hoger is, kun je overwegen om een view te maken. Je maakt dan een soort virtuele table op basis van je query die je dan 'als ware het' een gewone table razendsnel kunt benaderen. Precies waarvoor database views bedoeld zijn

Klik hier om mij een DM te sturen • 3245 WP op ZW

donderdag 30 maart 2006 13:52

Acties:

P_de_B

Zijn dat indexed views? Anders is het in feite niets meer dan een opgeslagen query en zal de snelheid niet omhoog gaan door het gebruik van de view.

Oops! Google Chrome could not find www.rijks%20museum.nl

Pagina: 1

Reageer