Op aanraden van een Admin hier geplaatst
Hey jongens,
Ik ben een tijdje aan het kijken wat de beste manier is om voetbaluitslagen van de Eredivisie en straks het WK op te halen. Ben al een tijd op zoek geweest naar services die XML data leveren van de Eredivisie en/of het WK. Deze services zijn er, niet zo veel, en geven tevens niet de output die ik zoek, en zijn tevens betaald (In zoverre dat het te veel geld is voor een localhost project wat nooit echt het levenslicht zal zien).
Nu heb ik 2 opties:
1. Service vinden die wél data geeft (Uitslagen), die netjes opslaan in een database, en dmv een cronjob elk uur updaten.
2. Data gaan 'minen' van een derde partij (Contact opgezocht met KNVB; deze zegt dat de uitslagen zelf niet auteursrechtelijk beschermd zijn, minen mag als dit niet in strijd is met AV van de website en er geen andere data opgeslagen wordt).
Het data minen is op zich een optie, alleen dan ben je eindeloos aan het splitten en regexen, en vaak zijn de sites die deze data tentoonspreiden dermate brak dat splitten gegarandeerd problemen gaat geven.
Nu heb ik van een Tweaker een python script gekregen, alleen is een linux script en ik develop onder Windows. Ook die geeft niet alle output die gewenst is (Zoals bijvoorbeeld wedstrijdweek, maar dat is wel iets op te vangen door met vooraf ingevoerde records te gaan werken die geupdate worden). Deze geeft ook rauwe output welke doorzocht moet worden en gesplit. Niet handig.
Iemand anders tip/tricks of iemand die hier ook tegenaan gelopen is?
[ Voor 3% gewijzigd door Woy op 07-12-2013 10:38 ]