Check alle échte Black Friday-deals Ook zo moe van nepaanbiedingen? Wij laten alleen échte deals zien

Afwijkende pagina's filteren uit 2 bestanden

Pagina: 1
Acties:

  • SinergyX
  • Registratie: November 2001
  • Laatst online: 20:51

SinergyX

____(>^^(>0o)>____

Topicstarter
Ik zit hier met 2 documenten die kort na elkaar zijn gemaakt, de een met 200 pagina's, de ander ruim 450.

Probleem is nu dat er in het 2de document aantal pagina's zijn toegevoegd, maar ik wil dus die 250 toegevoegde pagina's in een apart document krijgen. Nu kan ik dat allemaal wel met de hand gaan doen, maar dacht tot even op zoek naar iets wat mij kon helpen.

Binnen Word heb ik wel opties tot vergelijken, maar richt zich enkel op zinnen/woorden, maar niet op gehele pagina's. Nu ik ook de optie heb om alles in PDF te zetten, was ik al beetje creatief geweest met enkele mergers (PDFMerge, MergeXF en DSPDF), maar of kunnen helemaal niet filteren, of kijken enkel naar absolute paginanummering (dus vanaf eerste pagina die is toegevoegd gaat het mis).

Acrobat XI heeft enkel de optie om gedetaileerd aan te geven wat verschillen zijn tussen de 2 documenten, maar omdat elke pagina zo'n 200 tekens heeft en verschillende paragraven, wordt die lijst enorm.

Iemand een idee voor dit probleem? (anders wordt het maar met de hand).

Nog 1 keertje.. het is SinergyX, niet SynergyX
Im as excited to be here as a 42 gnome warlock who rolled on a green pair of cloth boots but was given a epic staff of uber awsome noob pwning by accident.


  • RemcoDelft
  • Registratie: April 2002
  • Laatst online: 03-05 10:30
Gaat het alleen om tekst?
Dan kom je met "diff" (standaard GNU-commando) vast een heel eind.

Klein voorbeeldje:
testfile1: cat file1
a
b
c
d
e
f
g
h
testfile2: cat file2
b
e
h
toevoegingen: diff file? | grep ^\<
< a
< c
< d
< f
< g

[ Voor 47% gewijzigd door RemcoDelft op 24-01-2014 12:11 ]


  • SinergyX
  • Registratie: November 2001
  • Laatst online: 20:51

SinergyX

____(>^^(>0o)>____

Topicstarter
Het zijn initieel word documenten met volledig opmaak, ik had aantal vergelijkers gevonden die enkel op basis van tekst en/of ascii konden werken, maar je bent daarna volledige layout (tabs, lettertype etc) kwijt.

Nog 1 keertje.. het is SinergyX, niet SynergyX
Im as excited to be here as a 42 gnome warlock who rolled on a green pair of cloth boots but was given a epic staff of uber awsome noob pwning by accident.


  • Lustucru
  • Registratie: Januari 2004
  • Niet online

Lustucru

26 03 2016

Pagina's zijn een onhandige entiteit binnen Word. De paginering komt tot stand door steeds met de printerdriver te communiceren...

Afhankelijk van hoe het document is opgebouwd en hoe de paginering tot stand komt zou je met een relatief simpel VBA-loopje door alle paragrafen, of secties, of springend van pagebreak tot pagebreak door het grote document kunnen lopen en alles wat hij niet terug vindt in het kleinere document kunnen kopieren naar een nieuw document.

De oever waar we niet zijn noemen wij de overkant / Die wordt dan deze kant zodra we daar zijn aangeland