Opzoeken van woorden die in meerdere bestand worden gebruikt

Pagina: 1
Acties:

Acties:
  • 0 Henk 'm!

  • Benjamin-
  • Registratie: April 2008
  • Laatst online: 18-07 13:39

Benjamin-

CrazyGunner#2385

Topicstarter
Ik ben opzoek naar een programma die uit meerdere bestanden dezelfde worden kan halen. Bedoeling is dat ik een aantal bestanden aanlever, en dat het programma opzoek gaat naar alle woorden die in alledrie de bestanden zitten.

Ik heb hier naar gezocht, maar ik krijg steeds allerlei zoek methodes voor woorden enz, maar niets wat dit kan.

Nikon D7000 + grip, Sigma 70-200 f2.8, Nikon 18-200mm VR, Nikon 35mm f1.8, Nikon SB-900


Acties:
  • 0 Henk 'm!

  • F_J_K
  • Registratie: Juni 2001
  • Niet online

F_J_K

Moderator CSA/PB

Front verplichte underscores

Klinkt als maatwerk.

Wat voor bestanden? Kan je zelf scripten? (Zo niet en je wilt het ook niet eerst leren, dan zou ik eerder zoeken naar iemand die je het voor je ontwikkelt dan een standaardprogramma).

Stap1: maak een lijst van alle woorden. (Iets als http://stackoverflow.com/...-used-in-ms-word-document of een dienst als http://design215.com/toolbox/wordlist.php)

Stap2: vind de overlap tussen file1 en 2, daarna tussen dat resultaat en file3. Iets als http://stackoverflow.com/...rds-lines-in-another-file kan als inspiratie werken.

(De voorbeelden heb ik overigens gewoon via Google gezocht, zijn niet 1-op-1 toepasbaar).

'Multiple exclamation marks,' he went on, shaking his head, 'are a sure sign of a diseased mind' (Terry Pratchett, Eric)


Acties:
  • 0 Henk 'm!

  • Lawwie
  • Registratie: Maart 2010
  • Laatst online: 09-07 08:40

Lawwie

Het beste bier, brouw je zelf!

Met notepad++ kan je zoeken in verschillende bestanden tegelijk.

Acties:
  • 0 Henk 'm!

  • Benjamin-
  • Registratie: April 2008
  • Laatst online: 18-07 13:39

Benjamin-

CrazyGunner#2385

Topicstarter
Gewone tekst bestanden. Scripten kan ik niet. Tevens lijkt het me dat dit al moet bestaan, er zullen toch wel meer mensen zijn die willen weten welke woorden in meerdere bestanden voorkomen.

Notepad++ geinstalleerd, maar kan (nog) niet die functie vinden. Het zoeken in meerdere bestanden is zover ik kan zien alleen gericht.

Nikon D7000 + grip, Sigma 70-200 f2.8, Nikon 18-200mm VR, Nikon 35mm f1.8, Nikon SB-900


Acties:
  • 0 Henk 'm!

  • Killah_Priest
  • Registratie: Augustus 2001
  • Laatst online: 22:24
In Powershell heb ik ooit een script gemaakt wat dit doet (je geeft een zoekopdracht + searchpad op, eventueel switch voor recursive search en je krijgt daarna na lang wachten de output).
Volgens mij kan de ingebouwde search in Windows dit ook, helemaal bij tekstbestanden.

(De reden voor mij om hier een script voor te maken was zodat ik weer een automatische handeling kon koppelen aan de resultaten)

Edit : ik heb de vraag volgens mij verkeerd begrepen.
De TS wilt volgens mij meerdere bestanden vergelijken op inhoud en daarvan de dubbele woorden hebben.
Hoe wil je het doen met woorden zoals lidwoorden?

[ Voor 20% gewijzigd door Killah_Priest op 20-04-2015 15:17 ]


Acties:
  • 0 Henk 'm!

  • F_J_K
  • Registratie: Juni 2001
  • Niet online

F_J_K

Moderator CSA/PB

Front verplichte underscores

Benjamin- schreef op zondag 19 april 2015 @ 15:24:
Gewone tekst bestanden. Scripten kan ik niet.
Als het tekstbestanden zijn dan is het in ieder geval redelijk makkelijk scripten. Er zijn voor iedere deelstap wel voorbeelden en commandline tools te vinden. Maar inderdaad moet je dan wel voldoende leren om het aan elkaar te knopen (bijv. FOR loops om een grep commando heen).
Zou ik toch adviseren te doen.
Tevens lijkt het me dat dit al moet bestaan, er zullen toch wel meer mensen zijn die willen weten welke woorden in meerdere bestanden voorkomen.
Ik ben benieuwd. Zelfs als het er is verwacht ik dat er best wat configuratie of scripten binnen dat tool nodig is :)

-
Notepad++ kan zoeken, maar dat is maar een deel van de vraag.

[ Voor 4% gewijzigd door F_J_K op 20-04-2015 15:25 ]

'Multiple exclamation marks,' he went on, shaking his head, 'are a sure sign of a diseased mind' (Terry Pratchett, Eric)


Acties:
  • 0 Henk 'm!

  • WeHoDo
  • Registratie: Augustus 2014
  • Laatst online: 18-06 20:11

PSN: plexforce (ps4)


Acties:
  • 0 Henk 'm!

  • Killah_Priest
  • Registratie: Augustus 2001
  • Laatst online: 22:24
Net getest in Powershell (om je op weg te helpen) :
code:
1
2
3
$a = Get-Content .\test1.txt -Delimiter " "
$b = Get-Content .\test2.txt -Delimiter " "
Compare-Object $a $b -IncludeEqual -ExcludeDifferent


Alleen al met deze paar regels code kun je de woorden welke overeenkomen in 2 bestanden met elkaar vergelijken. Spatie is hier de delimiter. Dmv een replace actie op beide inputs kun je ook nog speciale tekens eruit filteren (regular expressions ftw om dit makkelijk voor elkaar te krijgen).

Een middagje investeren in een simpel Powershell scriptje zou dus ook een oplossing kunnen zijn.
Pagina: 1