Toon posts:

Grote hoeveelheid files indexeren op interne webpagina?

Pagina: 1
Acties:

Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
De situatie is als volgt:

In het bedrijf hier hebben we een webservertje draaien (een oude linux bak met apache2) waar een wiki pagina op gehost wordt, enkel voor intern gebruik. Op deze pagina staan heel wat gegevens ivm onze klanten enzo.

Nu hebben we hier ook, verspreid op verschillende servers ettelijke documenten staan (vooral doc's en pdf's) met nuttige informatie (over onze klanten, over onze eigen ontwikkelde software, ... ) . Het gaat om honderden files.

Nu zou ik graag, als het kan, op die wiki pagina een extra pagina maken waarop al die doc's en pdf's geindexeerd worden. Op deze manier kan er via de wiki pagina gesearched worden naar bepaalde documenten. De documenten hebben allemaal een filename die beschrijft wat er in het document terug te vinden is, dus in de documenten zelf hoeft er niet gezocht te worden. Ook zou het handig zijn dat er gelinked wordt naar elke file, zodat je met 1 klik de file kan downloaden/openen.

De eenvoudige oplossing is natuurlijk naar elke file zelf een hyperlink maken ( a la file:///server\bla.doc ). Dit zou echter een enorm omslachtig werkje zijn, dus vroeg ik me af of er een manier is om dit te automatiseren op een of andere manier. Het hoeft niet dynamisch te gebeuren, eens het leeuwendeel van de files toegevoegd is kunnen nieuwe documenten eventueel manueel toegevoegd worden.

Iemand een idee?

Acties:
  • 0 Henk 'm!

  • Mike2k
  • Registratie: Mei 2002
  • Laatst online: 11-10 19:59

Mike2k

Zone grote vuurbal jonge! BAM!

You definitely rate about a 9.0 on my weird-shit-o-meter
Chuck Norris doesn't dial the wrong number. You answer the wrong phone.


Acties:
  • 0 Henk 'm!

  • chem
  • Registratie: Oktober 2000
  • Laatst online: 14:55

chem

Reist de wereld rond

Ik zou toch kijken naar iets als xapian of een andere indexer om ook de *inhoud* te kunnen zoeken :)

Klaar voor een nieuwe uitdaging.


Acties:
  • 0 Henk 'm!

  • Mike2k
  • Registratie: Mei 2002
  • Laatst online: 11-10 19:59

Mike2k

Zone grote vuurbal jonge! BAM!

chem schreef op vrijdag 14 augustus 2009 @ 13:12:
[...]

Ik zou toch kijken naar iets als xapian of een andere indexer om ook de *inhoud* te kunnen zoeken :)
En dan te TS:
De documenten hebben allemaal een filename die beschrijft wat er in het document terug te vinden is, dus in de documenten zelf hoeft er niet gezocht te worden.
;)

You definitely rate about a 9.0 on my weird-shit-o-meter
Chuck Norris doesn't dial the wrong number. You answer the wrong phone.


Acties:
  • 0 Henk 'm!

  • chem
  • Registratie: Oktober 2000
  • Laatst online: 14:55

chem

Reist de wereld rond

Ach het is zo weinig moeite dat ik het toch zou doen :P

Klaar voor een nieuwe uitdaging.


Acties:
  • 0 Henk 'm!

  • rhodium
  • Registratie: Augustus 2003
  • Laatst online: 05:43
je kan heel simpel een tree maken je folder en files met "tree /home/" en deze output opslaan in een docje. Hierop kan je volgens flink wat scripts op loslaten om het allemaal weer netjes op je wiki te toveren.

Acties:
  • 0 Henk 'm!

  • Mike2k
  • Registratie: Mei 2002
  • Laatst online: 11-10 19:59

Mike2k

Zone grote vuurbal jonge! BAM!

rhodium schreef op vrijdag 14 augustus 2009 @ 14:12:
je kan heel simpel een tree maken je folder en files met "tree /home/" en deze output opslaan in een docje. Hierop kan je volgens flink wat scripts op loslaten om het allemaal weer netjes op je wiki te toveren.
Dat zou ik dan weer niet doen aangezien de bestandsnamen geindexeerd moeten worden. Ik ga gemakshalve dan ook maar vnauit dat je er op moet kunnen zoeken...dan kan je beter de bestandsnamen in een db zetten....

Is volgens mij een stuk sneller....

You definitely rate about a 9.0 on my weird-shit-o-meter
Chuck Norris doesn't dial the wrong number. You answer the wrong phone.


Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Een collega van me kwam met een hint hoe dit mogelijks makkelijker kon opgelost worden, ik heb even gezocht en getest, en deze methode werkt feilloos.

De te indexeren bestanden staan allemaal op een windows 2003 server. Deze heeft een ingebouwde indexeerfunctie, die via wat asp werk te benaderen valt.

De volgende twee links leggen precies uit hoe je de indexeerservice van windows 2003 gebruikt, en hoe je een htm en asp pagina bouwt om te zoeken in deze door windows geïndexeerde bestanden:

Indexing
Zoeken

Uiteindelijk heb ik de html code die de asp pagina aanroept geplakt in een wiki pagina, en het systeem werkt prima!
Pagina: 1