Toon posts:

PDF file size verkleinen

Pagina: 1
Acties:

  • eelco19781978
  • Registratie: Maart 2009
  • Laatst online: 19-10-2022
Goedemorgen,

Bij ons op kantoor hebben we jaarlijks meer dan 1M pdf's aan facturen. De gemiddelde grootte van de bestanden is rond de 700kb per stuk. Dit zorgt er voor dat we nogal veel storage nodig hebben.
Mijn collega's zijn druk bezig om tijdens het maken van de PDF al te zorgen dat de bestanden niet te groot worden, maar ik wil ook de bestaande bestanden gaan verkleinen.

Hiervoor zoeken we dus een betrouwbare tool(betaald geen probleem) ,die meerdere PDF's tegelijk, kan verkleinen.

Graag jullie suggesties / ervaringen met zulke tools.

  • Room42
  • Registratie: September 2001
  • Niet online
Wat voor content zit er in de PDF's? Als het tekst is, zal er niet veel meer te comprimeren zijn. Zijn het afbeeldingen, dan zul je de kwaliteit van de afbeeldingen moeten verlagen om winst te behalen (aka JPEG-compressie).

Wat had je zelf al gevonden? Bijvoorbeeld door te zoeken bij google naar 'pdf verkleinen'?

[Voor 22% gewijzigd door Room42 op 19-11-2018 10:26]

Blokkeert alle ads en trackers met:
- uBlock Origin
- uMatrix
- en Pi-Hole voor de rest van het netwerk.


  • Breezz
  • Registratie: Juni 2011
  • Laatst online: 20:17
Je kan ze misschien allemaal zwart-wit maken ?

  • Papapa
  • Registratie: September 2017
  • Laatst online: 06-02 12:22
Bij ons op het bedrijf gebruiken we Bluebeam Revu, daar zit diverse batchopties op en ook eentje voor Batch --> Reduce File size.
Hierbij heb je ook nog diverse opties voor het verkleinen van dpi en bit depth van images, droppen van fonts, etc.

  • DJMaze
  • Registratie: Juni 2002
  • Niet online
eelco19781978 schreef op maandag 19 november 2018 @ 10:22:
De gemiddelde grootte van de bestanden is rond de 700kb per stuk.
Ik zit hier op 30KiB voor 1 pagina (incl. afbeeldingen en een QR betaalcode) en 35KiB voor 4 pagina's.

Het is afhankelijk van de software die je gebruikt hoe groot ze worden, en of je de fonts/lettertypes embed in de PDF.

Zelfs deze HTML pagina omgezet naar PDF is maar 444KiB:
https:// mhxsolutions .nl/hosting/e-mail-account-instellen.pdf

Je zou je dus echt af moeten vragen welke idiote software je gebruikt die zulke absurd grote PDF's genereert.
Want ook alle facturen die ik ontvang komen niet boven de 100KiB uit.

[Voor 30% gewijzigd door DJMaze op 19-11-2018 15:35]

Maak je niet druk, dat doet de compressor maar


  • akimosan
  • Registratie: Augustus 2003
  • Niet online
Het verschilt natuurlijk altijd ook enorm van de ene leverancier tot de andere.

Welke PDF generator wordt gebruikt, welke afdruk kwaliteit wordt gebruikt, of het een ingescande factuur betreft (en hoe die dan weer wordt ingescand)
Je hebt er wellicht niet altijd grip op. Als het dus ook gaat om facturen die naar je toekomen.
Als het enkel gaat om de facturen die je genereert dan kun je kijken naar je PDF engine of pakket wat je gebruikt en daarover met je leverancier in gesprek.

Als het enkel gaat om een gemiddelde grootte per PDF (700KB gemiddeld) is wat veel maar misschien betreft het meerdere pagina's of, nou ja, zie boven...

Wat je ook gaat verzinnen in een aanpak waarbij mensen (en soms zelfs een server / applicatie die ook stroom/licenties/whatever kost) , dan is een opslag prijs per GB soms nog goedkoper, zeker als je gebruik kunt maken van backup / archiverings software. Daarmee kun je andere opslag vraagstukken soms ook beantwoorden terwijl je nu enkel kijkt naar opslag/conversie van die PDF bestanden. Morgen zijn het foto's die je ontvangt en die je wilt comprimeren (good luck met die gecomprimeerde JPG's). Moet je daar weer wat voor verzinnen.

700KB * 1 miljoen is 700GB, dat lijkt een hoop. Maar nu even heel simpel gesteld: een portable USB harddrive van 1TB is nu 50 tientjes.
Koop er 2. Ben je 100 euro kwijt.
Zet een hele jaargang aan facturen erop.(begin met de oudste)
Maak een kopie op schijf 2.
Houd 1 disk op kantoor, bewaar er 1 in een offsite archief (ok, kost ook geld maar heb je als bedrijf toch vaak nodig)

Maar eigenlijk ben je voor 100 euro per jaar qua opslag onder de pannen. Dat is kwa bedrijfskosten miniem in verhouding tot overige inspanningen.

En er zijn heel veel argumenten te bedenken waarom je het niet zo zou moeten doen maar mijn punt is om soms relatief lage opslagkosten versus manuren/software/applicatie even in perspectief te plaatsen. 700GB per jaar is tegenwoordig redelijke peanuts en zou het moeten zijn voor een bedrijf waar men 1M facturen per jaar verwerkt ;)

  • ufear
  • Registratie: December 2002
  • Laatst online: 05-02 04:02
Kwestie van ze even door Ghostscript heenhalen en even met de parameters spelen =)

  • Room42
  • Registratie: September 2001
  • Niet online
akimosan schreef op maandag 19 november 2018 @ 22:07:
[...] Maar nu even heel simpel gesteld: een portable USB harddrive van 1TB is nu 50 tientjes.
Koop er 2. Ben je 100 euro kwijt.
[...]
Maar eigenlijk ben je voor 100 euro per jaar qua opslag onder de pannen. Dat is kwa bedrijfskosten miniem in verhouding tot overige inspanningen. [...]
edit:
Gelukkig! Zie de opmerking van @akimosan hieronder vvv (y) :)

En het is een belachelijk amateuristisch voorstel :o Dit kun je echt niet serieus menen, op enterprise (of zelfs small business) niveau met USB-schijfjes aankomen voor opslag van bedrijfskritische administratie. _O-
Zelfs een degelijke thuis-NAS zou ik voor een small business al discutabel vinden, maar met een goede off-site backup nog enigzins bespreekbaar als er écht geen budget is.

Maar nee, minimaal degelijke redundante storage is wel echt een vereiste en dan ben je er niet met 100 euro per jaar ;)

PS: Dit is niet bedoeld als aanval op jou persoonlijk maar wel even op wat je hier voorstelde O+

[Voor 12% gewijzigd door Room42 op 19-11-2018 23:23]

Blokkeert alle ads en trackers met:
- uBlock Origin
- uMatrix
- en Pi-Hole voor de rest van het netwerk.


  • akimosan
  • Registratie: Augustus 2003
  • Niet online
Het was ook niet helemaal serieus bedoeld, ik zei immers al:

".. er zijn heel veel argumenten te bedenken waarom je het niet zo zou moeten doen" maar mijn punt is om soms relatief lage opslagkosten versus manuren/software/applicatie even in perspectief te plaatsen. 700GB per jaar is tegenwoordig redelijke peanuts en zou het moeten zijn voor een bedrijf waar men 1M facturen per jaar verwerkt.

Bij bedrijfskritische administratie is het missschien ook niet zo handig om elke factuur nog even door een tooltje heen te draaien dan hopen dat de output altijd is wat je wilt. Je gaat die immers niet met de hand controleren. Natuurlijk moet je redundante storage en degelijke backup/recovery strategie hebben. Maar ik wilde het stukje effort versus een prijs per GB in de meest basale vorm even noemen.

Mocht iemand het al te serieus hebben genomen: nee, in een bedrijfsomgeving ga je niet met USB media aan de slag voor je data opslag/archivering. Slecht plan :(

  • Jaaap
  • Registratie: Februari 2000
  • Niet online
700GB kost inderdaad geen fluit.
Ik zou er geen moeite in steken, 1 uur er aan besteden is waarschijnlijk duurder dan 1 jaar op S3 opslaan.

[Voor 8% gewijzigd door Jaaap op 19-11-2018 23:08]

Dat betekent
Het gebeurt
Dit verandert
Wat bepaalt


  • TomsDiner
  • Registratie: November 2014
  • Laatst online: 16-07-2022
Ik zou iig het programma dat gebruikt wordt voor de periodieke PDF's even onder de loep nemen. Zevenhonderd KB kan wel, maar is gewoon niet nodig. Als ik google op "PDF shrinker offline batch" kom ik er wel een stel tegen, en die zou je even aan een inspectie moeten onderwerpen...

En 700 GB kost geen fluit. Mee eens. Tot je eens een backup terug moet zetten na een probleem, en er achterkomt dat je met je server met RAID 5 tot 40 GB per uur kunt terugzetten.... Of uit een leuke incrementele backup moet laten peuteren....

Honderd GB is gewoon veel handzamer, nog liever 50 GB. Zo zal een preview weergave in de windows verkenner ook sneller getoond worden (Map met honderden PDF's), en werkt zoeken sneller.

  • Josk79
  • Registratie: September 2013
  • Laatst online: 00:00
Wellicht neemt het logo of een andere afbeelding veel ruimte in. Hopelijk is dit bij de bron aan te pakken.

Ik had een boekhoudpakket die ook grote images embedde in de pdfs. Ik heb er toen voor gekozen geen logo in te voegen in het boekhoudpakket en heb dit met een command line tool van PDFtk opgelost.

  • eelco19781978
  • Registratie: Maart 2009
  • Laatst online: 19-10-2022
Bedankt voor alle reacties en tips.

  • F_J_K
  • Registratie: Juni 2001
  • Niet online

F_J_K

Moderator CSA/PB

Front verplichte underscores

offtopic:
Ik denk dat de mensen die meedachten, zich aanbevolen houden voor tzt een update wat / hoe het resultaat is geworden :Y)

'Multiple exclamation marks,' he went on, shaking his head, 'are a sure sign of a diseased mind' (Terry Pratchett, Eric)


  • jeroen3
  • Registratie: Mei 2010
  • Laatst online: 21:44
TomsDiner schreef op maandag 19 november 2018 @ 23:31:
En 700 GB kost geen fluit. Mee eens. Tot je eens een backup terug moet zetten na een probleem, en er achterkomt dat je met je server met RAID 5 tot 40 GB per uur kunt terugzetten.... Of uit een leuke incrementele backup moet laten peuteren....
Nu zijn oude facturen over het algemeen niet bestanden die je jaren later nog steeds elke dag nodig hebt...

  • TomsDiner
  • Registratie: November 2014
  • Laatst online: 16-07-2022
jeroen3 schreef op dinsdag 20 november 2018 @ 11:41:
[...]

Nu zijn oude facturen over het algemeen niet bestanden die je jaren later nog steeds elke dag nodig hebt...
Nee, je hebt gelijk. Die kunnen gewoon weg. Je gaat toch geen facturen bewaren :?

Wat probeer je eigenlijk te zeggen? Dus niet back-uppen omdat ze te groot zijn?

  • F_J_K
  • Registratie: Juni 2001
  • Niet online

F_J_K

Moderator CSA/PB

Front verplichte underscores

Er zal wellicht geen zware tijdsdruk liggen op recoveren. Maar goed. Dat was de vraag niet vd TS. Ik ben benieuwd welk tool het effectief en efficiënt verkleint op deze schaal. (Edit: 52 weken, 5 dagen per week, 8 per minuut, foutloos).

[Voor 42% gewijzigd door F_J_K op 20-11-2018 23:18]

'Multiple exclamation marks,' he went on, shaking his head, 'are a sure sign of a diseased mind' (Terry Pratchett, Eric)


  • The Eagle
  • Registratie: Januari 2002
  • Laatst online: 21:49

The Eagle

I wear my sunglasses at night

jeroen3 schreef op dinsdag 20 november 2018 @ 11:41:
[...]

Nu zijn oude facturen over het algemeen niet bestanden die je jaren later nog steeds elke dag nodig hebt...
Jij niet, maar de belastingdienst wel. Iets met wettelijke bewaartermijnen van je administratie.
En vwb factuurverwerking: ik kan je bij deze melden dat het verwerken van een simple, inkomende factuur soms wel 25 euro PER FACTUR kan kosten aan personeel en IT kosten. Red je het met 6 euro per factur doe je het heel goed. Maar dat terzijde.

Ontopic: Ik ga er even vanuit dat je die bestanden op disk opslaat. Feitelijk ben je dan op zoek naar relatief goedkope LOB opslag. Opsla waar je het naartoe kunt pompen om daarna te kunnen vergeten en alleen terug te halen indien nodig.
Weet niet of je al cloud spul hebt staan, maar zowel Azure als AWS bieden een dergelijke service aan. Van AWS kun jij zelfs een virtuele storage VM krijgen die verbindt met AWS storage voor dit soort doeleinden. Hang je in je netwerk, configgen en klaar. En alles wat je er op dumpt komt bij hen te staan, encrypted, gebackupped en safe. Kwestie van goed inrichten. Recent spul on site houden en ouder spul lekker in de cloud laten. Stukken goedkoper voor dergelijke doeleinden dan wat voor onsite storage dan ook :)

Ben je aan het verkleinen omdat die bestanden in een DB opgeslagen worden die uit zijn klauwen groeit: zie bovenstaande en denk aan archivering op disk. Alleen je meest recente spullen laat je onsite staan.

Oh ja, en kijk ven met welk programma en instellingen je de PDF genereert. Daar wat setings in tweaken wil ook nog wel eens helpen.

Al is het nieuws nog zo slecht, het wordt leuker als je het op zijn Brabants zegt :)


  • Turdie
  • Registratie: Maart 2006
  • Laatst online: 30-01 22:29
Centraal op een fileshare opslaan met deduplicatie?

  • Room42
  • Registratie: September 2001
  • Niet online
shadowman12 schreef op woensdag 21 november 2018 @ 00:04:
Centraal op een fileshare opslaan met deduplicatie?
Wat is je vraag? :? :P

Anyway, hoe groot is de kans op dubbele data met allemaal gecomprimeerde PDF's van (andere) facturen? Ik vrees dat daar niet heel erg veel winst te behalen valt.

Blokkeert alle ads en trackers met:
- uBlock Origin
- uMatrix
- en Pi-Hole voor de rest van het netwerk.


  • The Eagle
  • Registratie: Januari 2002
  • Laatst online: 21:49

The Eagle

I wear my sunglasses at night

Die kans acht ik idd ook klein ja. En als die kans wel groot is moet je je boekhouders eens op het matje roepen :P

@Room42 was je vroeg op, kon je niet slapen of ben je gewoon een mafketel om op die tijd te posten :?

Al is het nieuws nog zo slecht, het wordt leuker als je het op zijn Brabants zegt :)


  • Turdie
  • Registratie: Maart 2006
  • Laatst online: 30-01 22:29
Room42 schreef op woensdag 21 november 2018 @ 04:52:
[...]

Wat is je vraag? :? :P

Anyway, hoe groot is de kans op dubbele data met allemaal gecomprimeerde PDF's van (andere) facturen? Ik vrees dat daar niet heel erg veel winst te behalen valt.
Het was ook meer een voorstel dat wellicht een optie is om te overwegen voor de TS, over het algemeen zijn documenten goede kandidaten voor deduplicatie
Pagina: 1


Tweakers maakt gebruik van cookies

Tweakers plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Tweakers relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Sluiten

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie. Meer details

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Tweakers contextuele advertenties te tonen op basis van pagina's die je hebt bezocht. Meer details

    Tweakers genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Tweakers gevolgd worden. Indien je bent ingelogd, wordt deze identifier gekoppeld aan je account. Indien je niet bent ingelogd, wordt deze identifier gekoppeld aan je sessie die maximaal 4 maanden actief blijft. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden. Meer details

    janee