Beste Tweakers,
Ik ben bezig met het maken van een website maar omdat ik niet heel handig ben met PHP heb ik een kennis ingeschakeld om een PHP-script voor mij te maken. Het doel is om wekelijks bepaalde gegevens van een website te scrapen. Ik probeer zo duidelijk mogelijk te zijn maar ik ben geen expert dus hopelijk ben ik niet te vaag oid.
Het gehele script is wat lang maar het probleemgebied zit hier:
curl_setopt_array($curl, array(
CURLOPT_SSL_VERIFYPEER => false,
CURLOPT_RETURNTRANSFER => 1,
CURLOPT_URL => 'https://www.google.com',
CURLOPT_USERAGENT => 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36',
CURLOPT_HTTPHEADER => array(
'accept-encoding: sdch, br',
'accept-language: en-US,en;q=0.8',
'upgrade-insecure-requests: 1',
'accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
'cache-control: max-age=0',
'authority: www.google.com',
'cookie: DEZE COOKIE WERKT NIET AUTOMATISCH',
'referer: https://www.google.com'
)
(het is niet echt www.google.com maar dit is voor het bericht ingevuld). Ik probeer dus m.b.v. een latere str_get_html via de Simple HTML DOM de HTML code te verkrijgen.
De variabel "cookie" bij CURLOPT_HTTPHEADER is het probleem. Ik kan via Google Chrome>F12 in console via document.cookie de juiste cookie krijgen, maar het idee van de script is dat hij op een andere server draaait en geheel automatisch deze script (via een cronjob oid) uitvoert.
Hoe kan ik deze cookie variabel geautomatiseerd verkrijgen in de script? Handmatig werkt dus wel maar dat is niet echt de bedoeling. Ik hop dat jullie hier iets van kunnen maken.
Vriendelijke groeten,
Icewind
Ik ben bezig met het maken van een website maar omdat ik niet heel handig ben met PHP heb ik een kennis ingeschakeld om een PHP-script voor mij te maken. Het doel is om wekelijks bepaalde gegevens van een website te scrapen. Ik probeer zo duidelijk mogelijk te zijn maar ik ben geen expert dus hopelijk ben ik niet te vaag oid.
Het gehele script is wat lang maar het probleemgebied zit hier:
curl_setopt_array($curl, array(
CURLOPT_SSL_VERIFYPEER => false,
CURLOPT_RETURNTRANSFER => 1,
CURLOPT_URL => 'https://www.google.com',
CURLOPT_USERAGENT => 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36',
CURLOPT_HTTPHEADER => array(
'accept-encoding: sdch, br',
'accept-language: en-US,en;q=0.8',
'upgrade-insecure-requests: 1',
'accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
'cache-control: max-age=0',
'authority: www.google.com',
'cookie: DEZE COOKIE WERKT NIET AUTOMATISCH',
'referer: https://www.google.com'
)
(het is niet echt www.google.com maar dit is voor het bericht ingevuld). Ik probeer dus m.b.v. een latere str_get_html via de Simple HTML DOM de HTML code te verkrijgen.
De variabel "cookie" bij CURLOPT_HTTPHEADER is het probleem. Ik kan via Google Chrome>F12 in console via document.cookie de juiste cookie krijgen, maar het idee van de script is dat hij op een andere server draaait en geheel automatisch deze script (via een cronjob oid) uitvoert.
Hoe kan ik deze cookie variabel geautomatiseerd verkrijgen in de script? Handmatig werkt dus wel maar dat is niet echt de bedoeling. Ik hop dat jullie hier iets van kunnen maken.
Vriendelijke groeten,
Icewind
[ Voor 8% gewijzigd door Icewind op 17-09-2016 13:06 ]