[PHP] Zoeken in documenten zonder db

Pagina: 1
Acties:
  • 88 views sinds 30-01-2008

  • DaTiezl
  • Registratie: Januari 2004
  • Laatst online: 29-04 22:05
Ik heb een vraagje. Ik ben bezig met een stageopdracht waarbij ik binnen een intranet een optie moet maken voor het zoeken in documenten (word/pdf) op keywords. Nu vroeg ik me af of er het mogelijk is om in php een dergelijke functionalitiet te maken zonder een database, dat dus middels een phpscript alle documenten worden uitgelezen, doorgezocht worden op een inputstring en deze vervolgens retourneren. Zijn hier eigenlijk al premade scripts oid van?

Het idee is dus net zoiets als Googles desktop maar dan server-sided.

[ Voor 8% gewijzigd door DaTiezl op 11-03-2005 11:10 ]

Yesterday's home runs don't win today's games. - Babe Ruth


  • Freemann
  • Registratie: Januari 2002
  • Niet online

Freemann

CO2 Warmtepomp + VentilatieWTW

Als er al premade scripts zouden zijn, zou je die niet eens gaan proberen te zoeken?

Verder lijkt het me stug dat zo iets mogelijk is met PHP. Andersom is wel mogelijk mogelijk om van strings een PDF te maken.

Ik zou zeggen ga eens verder zoeken dan je vraag hier neer te knallen.

https://www.taltion.nl, https://www.trekhaakkoffer-huren.nl, https://www.fietsendrager-huren.nl, https://www.fietskar-huren.nl


  • HawVer
  • Registratie: Februari 2002
  • Laatst online: 06-05 18:56
Wel ik ben blij dat ik die opdracht niet heb. Maar misschien kun je wat met dit idee. http://www.wrensoft.com/zoom/

http://hawvie.deviantart.com/


  • DaTiezl
  • Registratie: Januari 2004
  • Laatst online: 29-04 22:05
Freemann schreef op vrijdag 11 maart 2005 @ 11:10:
Als er al premade scripts zouden zijn, zou je die niet eens gaan proberen te zoeken?

Verder lijkt het me stug dat zo iets mogelijk is met PHP. Andersom is wel mogelijk mogelijk om van strings een PDF te maken.

Ik zou zeggen ga eens verder zoeken dan je vraag hier neer te knallen.
Natuurlijk heb ik wel gezocht...maar niets bruikbaars/gratis gevonden...

Yesterday's home runs don't win today's games. - Babe Ruth


  • Standeman
  • Registratie: November 2000
  • Laatst online: 09:05

Standeman

Prutser 1e klasse

Wat je wilt is dus een index engine in PHP voor zowel word als PDF document. Je kan kijken naar Lucene. Dit is wel een Apache Jakarta (java) project, maar kan je wel op iedeeen brengen of misschien kan je het integreren met PHP. Het werkt overigens wel als een sneltrein :9

De grootste uitdaging die je hebt is het uitlezen / indexeren van de word / pdf documenten. Je zal denk op zoek moeten gaan naar manieren om ze om te zetten in platte text of iets dergelijks.

suc6 iig

[ Voor 5% gewijzigd door Standeman op 11-03-2005 11:27 ]

The ships hung in the sky in much the same way that bricks don’t.


  • Minos111
  • Registratie: Augustus 2002
  • Laatst online: 05-03-2012
In word-documenten is in principe gewoon tekst te filteren, want de tekst wordt als niet binair opgeslagen. Je kunt hier dus bijvoorbeeld gewoon een unix zoekcommando voor gebruiken en de dataset opvangen. Bij PDF is dit een ander verhaal, want pdf is volledig binair. Je hebt zoals onder andere hier te lezen is wel plugins voor php die speciaal gemaakt zijn voor dit soort pdf functionaliteiten.

  • Thijsmans
  • Registratie: Juli 2001
  • Laatst online: 21:37

Thijsmans

⭐⭐⭐⭐⭐ (5/5)

Voer een bash-commando uit, en lees de results uit mbv php :)

* Thijsmans wijst naar http://www.ss64.com/bash/grep.html en http://nl3.php.net/exec

Privacy-adepten vinden op AVGtekst.nl de Nederlandse AVG-tekst voorzien van uitspraken en besluiten.


  • Pelle
  • Registratie: Januari 2001
  • Laatst online: 07:09

Pelle

🚴‍♂️

Wat snap je precies niet aan de passage "Ook de zogenaamde script requests zijn hier niet welkom" uit [rml][ W&G FAQ] W&G Policy & Beleid[/rml] ?
Pagina: 1

Dit topic is gesloten.