[PHP] Zoekresultaten via Google ophalen

Pagina: 1
Acties:

Onderwerpen


Acties:
  • 0 Henk 'm!

  • _eXistenZ_
  • Registratie: Februari 2004
  • Laatst online: 19-09 01:03
Ik ben op het moment even aan het onderzoeken op welke manieren ik zoekresultaten zou kunnen ophalen bij Google, en deze weergeven op mijn eigen site. Dit uiteraard met logootje van Google ofzo erbij, ik ben niet van plan om mezelf voor te doen als zoekmachine ofzo.

Er bestaat een Google AJAX API waarmee dit zou kunnen, echter doe ik dit liever serversided, om bijvoorbeeld bepaalde keywords m.b.t. de site waarop je zoekt te kunnen flaggen, of ratings aan searches te geven o.i.d. Daarom wil ik dit het liefst in PHP doen.

Wie weet of er een mogelijkheid bestaat om dit te legaal doen? Er zijn wel een aantal classes beschikbaar die zich bijvoorbeeld voordoen als de Google Searchbar, maar ik zoek een legale manier of API van Google die dit ondersteund. Wie kent dit of heeft dit wel eens gebruikt? Voor Yahoo bijvoorbeeld bestaat deze: http://developer.yahoo.com/search/

Ik heb zelf al rondgekeken maar dan strand je dus bij de imho minder legale classes die zich cloaken of via proxy of whatnot werken om resultaten te snatchen... Ik zoek dus een legale manier.

There is no replacement for displacement!


Acties:
  • 0 Henk 'm!

  • André
  • Registratie: Maart 2002
  • Laatst online: 12-09 14:32

André

Analytics dude

Een ding kan ik je wel vertellen: het is niet legaal:
http://www.google.com/accounts/TOS, 5.5

En ik kan het zo snel niet terug vinden, maar ergens anders staat ook dat scraping niet is togestaan.

Acties:
  • 0 Henk 'm!

  • Hielko
  • Registratie: Januari 2000
  • Laatst online: 12:48
Je kan gewoon de Google Ajax Api gebruiken lijkt me. De server van Google kan echt niet zien of de request die je doet afkomstig is van javascript of php.

Acties:
  • 0 Henk 'm!

  • Sebazzz
  • Registratie: September 2006
  • Laatst online: 14:51

Sebazzz

3dp

Hielko schreef op vrijdag 27 juni 2008 @ 19:59:
Je kan gewoon de Google Ajax Api gebruiken lijkt me. De server van Google kan echt niet zien of de request die je doet afkomstig is van javascript of php.
User agent. PHP zegt by default dat het PHP 5.x blablabla is.

[Te koop: 3D printers] [Website] Agile tools: [Return: retrospectives] [Pokertime: planning poker]


Acties:
  • 0 Henk 'm!

  • orf
  • Registratie: Augustus 2005
  • Laatst online: 15:31

orf

User agent. PHP zegt by default dat het PHP 5.x blablabla is.
Dat kun je natuurlijk makkelijk aanpassen. Het probleem is meer dat er wellicht te veel queries van één IP komen.

Google heeft nog de SOAP API in gebruik, maar geeft daarvoor al geruime tijd geen keys meer uit. Als je een oude key hebt kun je daarvan gebruik maken. Dat werkt serverside en je krijgt je data gewoon als Array terug.

Acties:
  • 0 Henk 'm!

  • Cartman!
  • Registratie: April 2000
  • Niet online
Sebazzz schreef op vrijdag 27 juni 2008 @ 20:03:
[...]

User agent. PHP zegt by default dat het PHP 5.x blablabla is.
PHP:
1
2
ini_set('expose_php', 'Off');
header('User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.6) Gecko/20070725 Firefox/2.0.0.6');


dat is geen excuus dus :)

edit: user-agent kun je ook zetten met ini set, check deze pagina maar eens :
http://nl3.php.net/manual/en/ini.php#ini.list

[ Voor 14% gewijzigd door Cartman! op 27-06-2008 20:40 ]


Acties:
  • 0 Henk 'm!

  • Joolee
  • Registratie: Juni 2005
  • Niet online
Bij teveel "vreemde" requests van één ip krijg je dit soort gezeik. Kan ik mij wel iets bij voorstellen overigens.
Pagina: 1