Cookies op Tweakers

Tweakers is onderdeel van DPG Media en maakt gebruik van cookies, JavaScript en vergelijkbare technologie om je onder andere een optimale gebruikerservaring te bieden. Ook kan Tweakers hierdoor het gedrag van bezoekers vastleggen en analyseren. Door gebruik te maken van deze website, of door op 'Cookies accepteren' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt? Bekijk dan ons cookiebeleid.

Meer informatie
Toon posts:

PDF file size verkleinen

Pagina: 1
Acties:

  • eelco19781978
  • Registratie: maart 2009
  • Laatst online: 08-06 12:32
Goedemorgen,

Bij ons op kantoor hebben we jaarlijks meer dan 1M pdf's aan facturen. De gemiddelde grootte van de bestanden is rond de 700kb per stuk. Dit zorgt er voor dat we nogal veel storage nodig hebben.
Mijn collega's zijn druk bezig om tijdens het maken van de PDF al te zorgen dat de bestanden niet te groot worden, maar ik wil ook de bestaande bestanden gaan verkleinen.

Hiervoor zoeken we dus een betrouwbare tool(betaald geen probleem) ,die meerdere PDF's tegelijk, kan verkleinen.

Graag jullie suggesties / ervaringen met zulke tools.

  • u34186
  • Registratie: september 2001
  • Niet online
Wat voor content zit er in de PDF's? Als het tekst is, zal er niet veel meer te comprimeren zijn. Zijn het afbeeldingen, dan zul je de kwaliteit van de afbeeldingen moeten verlagen om winst te behalen (aka JPEG-compressie).

Wat had je zelf al gevonden? Bijvoorbeeld door te zoeken bij google naar 'pdf verkleinen'?

[Voor 22% gewijzigd door u34186 op 19-11-2018 10:26]

Block ads en trackers: uBlock Origin, uMatrix, Pi-Hole
YouTube: SponsorBlock en YoutubeVanced


  • Breezz
  • Registratie: juni 2011
  • Laatst online: 10:50
Je kan ze misschien allemaal zwart-wit maken ?

  • Papapa
  • Registratie: september 2017
  • Laatst online: 19-06 22:44
Bij ons op het bedrijf gebruiken we Bluebeam Revu, daar zit diverse batchopties op en ook eentje voor Batch --> Reduce File size.
Hierbij heb je ook nog diverse opties voor het verkleinen van dpi en bit depth van images, droppen van fonts, etc.

  • DJMaze
  • Registratie: juni 2002
  • Niet online
eelco19781978 schreef op maandag 19 november 2018 @ 10:22:
De gemiddelde grootte van de bestanden is rond de 700kb per stuk.
Ik zit hier op 30KiB voor 1 pagina (incl. afbeeldingen en een QR betaalcode) en 35KiB voor 4 pagina's.

Het is afhankelijk van de software die je gebruikt hoe groot ze worden, en of je de fonts/lettertypes embed in de PDF.

Zelfs deze HTML pagina omgezet naar PDF is maar 444KiB:
https:// mhxsolutions .nl/hosting/e-mail-account-instellen.pdf

Je zou je dus echt af moeten vragen welke idiote software je gebruikt die zulke absurd grote PDF's genereert.
Want ook alle facturen die ik ontvang komen niet boven de 100KiB uit.

[Voor 30% gewijzigd door DJMaze op 19-11-2018 15:35]

Maak je niet druk, dat doet de compressor maar


  • akimosan
  • Registratie: augustus 2003
  • Niet online
Het verschilt natuurlijk altijd ook enorm van de ene leverancier tot de andere.

Welke PDF generator wordt gebruikt, welke afdruk kwaliteit wordt gebruikt, of het een ingescande factuur betreft (en hoe die dan weer wordt ingescand)
Je hebt er wellicht niet altijd grip op. Als het dus ook gaat om facturen die naar je toekomen.
Als het enkel gaat om de facturen die je genereert dan kun je kijken naar je PDF engine of pakket wat je gebruikt en daarover met je leverancier in gesprek.

Als het enkel gaat om een gemiddelde grootte per PDF (700KB gemiddeld) is wat veel maar misschien betreft het meerdere pagina's of, nou ja, zie boven...

Wat je ook gaat verzinnen in een aanpak waarbij mensen (en soms zelfs een server / applicatie die ook stroom/licenties/whatever kost) , dan is een opslag prijs per GB soms nog goedkoper, zeker als je gebruik kunt maken van backup / archiverings software. Daarmee kun je andere opslag vraagstukken soms ook beantwoorden terwijl je nu enkel kijkt naar opslag/conversie van die PDF bestanden. Morgen zijn het foto's die je ontvangt en die je wilt comprimeren (good luck met die gecomprimeerde JPG's). Moet je daar weer wat voor verzinnen.

700KB * 1 miljoen is 700GB, dat lijkt een hoop. Maar nu even heel simpel gesteld: een portable USB harddrive van 1TB is nu 50 tientjes.
Koop er 2. Ben je 100 euro kwijt.
Zet een hele jaargang aan facturen erop.(begin met de oudste)
Maak een kopie op schijf 2.
Houd 1 disk op kantoor, bewaar er 1 in een offsite archief (ok, kost ook geld maar heb je als bedrijf toch vaak nodig)

Maar eigenlijk ben je voor 100 euro per jaar qua opslag onder de pannen. Dat is kwa bedrijfskosten miniem in verhouding tot overige inspanningen.

En er zijn heel veel argumenten te bedenken waarom je het niet zo zou moeten doen maar mijn punt is om soms relatief lage opslagkosten versus manuren/software/applicatie even in perspectief te plaatsen. 700GB per jaar is tegenwoordig redelijke peanuts en zou het moeten zijn voor een bedrijf waar men 1M facturen per jaar verwerkt ;)

  • ufear
  • Registratie: december 2002
  • Laatst online: 19-06 13:38
Kwestie van ze even door Ghostscript heenhalen en even met de parameters spelen =)

  • u34186
  • Registratie: september 2001
  • Niet online
akimosan schreef op maandag 19 november 2018 @ 22:07:
[...] Maar nu even heel simpel gesteld: een portable USB harddrive van 1TB is nu 50 tientjes.
Koop er 2. Ben je 100 euro kwijt.
[...]
Maar eigenlijk ben je voor 100 euro per jaar qua opslag onder de pannen. Dat is kwa bedrijfskosten miniem in verhouding tot overige inspanningen. [...]
edit:
Gelukkig! Zie de opmerking van @akimosan hieronder vvv (y) :)

En het is een belachelijk amateuristisch voorstel :o Dit kun je echt niet serieus menen, op enterprise (of zelfs small business) niveau met USB-schijfjes aankomen voor opslag van bedrijfskritische administratie. _O-
Zelfs een degelijke thuis-NAS zou ik voor een small business al discutabel vinden, maar met een goede off-site backup nog enigzins bespreekbaar als er écht geen budget is.

Maar nee, minimaal degelijke redundante storage is wel echt een vereiste en dan ben je er niet met 100 euro per jaar ;)

PS: Dit is niet bedoeld als aanval op jou persoonlijk maar wel even op wat je hier voorstelde O+

[Voor 12% gewijzigd door u34186 op 19-11-2018 23:23]

Block ads en trackers: uBlock Origin, uMatrix, Pi-Hole
YouTube: SponsorBlock en YoutubeVanced


  • akimosan
  • Registratie: augustus 2003
  • Niet online
Het was ook niet helemaal serieus bedoeld, ik zei immers al:

".. er zijn heel veel argumenten te bedenken waarom je het niet zo zou moeten doen" maar mijn punt is om soms relatief lage opslagkosten versus manuren/software/applicatie even in perspectief te plaatsen. 700GB per jaar is tegenwoordig redelijke peanuts en zou het moeten zijn voor een bedrijf waar men 1M facturen per jaar verwerkt.

Bij bedrijfskritische administratie is het missschien ook niet zo handig om elke factuur nog even door een tooltje heen te draaien dan hopen dat de output altijd is wat je wilt. Je gaat die immers niet met de hand controleren. Natuurlijk moet je redundante storage en degelijke backup/recovery strategie hebben. Maar ik wilde het stukje effort versus een prijs per GB in de meest basale vorm even noemen.

Mocht iemand het al te serieus hebben genomen: nee, in een bedrijfsomgeving ga je niet met USB media aan de slag voor je data opslag/archivering. Slecht plan :(

  • Jaaap
  • Registratie: februari 2000
  • Niet online
700GB kost inderdaad geen fluit.
Ik zou er geen moeite in steken, 1 uur er aan besteden is waarschijnlijk duurder dan 1 jaar op S3 opslaan.

[Voor 8% gewijzigd door Jaaap op 19-11-2018 23:08]

Zure regen: vnl. zwaveldioxide (en stikstofoxiden en ammoniak), 89% minder sinds 1980: FIXED
Gat in ozonlaag: vnl. drijfgassen (CFK's), gat dicht in 2060: FIXED
Broeikaseffect: vnl. CO₂ (en methaan en lachgas), afbouw uitstoot begonnen


  • TomsDiner
  • Registratie: november 2014
  • Laatst online: 19-06 23:48
Ik zou iig het programma dat gebruikt wordt voor de periodieke PDF's even onder de loep nemen. Zevenhonderd KB kan wel, maar is gewoon niet nodig. Als ik google op "PDF shrinker offline batch" kom ik er wel een stel tegen, en die zou je even aan een inspectie moeten onderwerpen...

En 700 GB kost geen fluit. Mee eens. Tot je eens een backup terug moet zetten na een probleem, en er achterkomt dat je met je server met RAID 5 tot 40 GB per uur kunt terugzetten.... Of uit een leuke incrementele backup moet laten peuteren....

Honderd GB is gewoon veel handzamer, nog liever 50 GB. Zo zal een preview weergave in de windows verkenner ook sneller getoond worden (Map met honderden PDF's), en werkt zoeken sneller.

  • Josk79
  • Registratie: september 2013
  • Laatst online: 18-06 18:46
Wellicht neemt het logo of een andere afbeelding veel ruimte in. Hopelijk is dit bij de bron aan te pakken.

Ik had een boekhoudpakket die ook grote images embedde in de pdfs. Ik heb er toen voor gekozen geen logo in te voegen in het boekhoudpakket en heb dit met een command line tool van PDFtk opgelost.

  • eelco19781978
  • Registratie: maart 2009
  • Laatst online: 08-06 12:32
Bedankt voor alle reacties en tips.

  • F_J_K
  • Registratie: juni 2001
  • Niet online

F_J_K

Moderator CSA/PB

Front verplichte underscores

offtopic:
Ik denk dat de mensen die meedachten, zich aanbevolen houden voor tzt een update wat / hoe het resultaat is geworden :Y)

'Multiple exclamation marks,' he went on, shaking his head, 'are a sure sign of a diseased mind' (Terry Pratchett, Eric)


  • jeroen3
  • Registratie: mei 2010
  • Laatst online: 19-06 22:17
TomsDiner schreef op maandag 19 november 2018 @ 23:31:
En 700 GB kost geen fluit. Mee eens. Tot je eens een backup terug moet zetten na een probleem, en er achterkomt dat je met je server met RAID 5 tot 40 GB per uur kunt terugzetten.... Of uit een leuke incrementele backup moet laten peuteren....
Nu zijn oude facturen over het algemeen niet bestanden die je jaren later nog steeds elke dag nodig hebt...

  • TomsDiner
  • Registratie: november 2014
  • Laatst online: 19-06 23:48
jeroen3 schreef op dinsdag 20 november 2018 @ 11:41:
[...]

Nu zijn oude facturen over het algemeen niet bestanden die je jaren later nog steeds elke dag nodig hebt...
Nee, je hebt gelijk. Die kunnen gewoon weg. Je gaat toch geen facturen bewaren :?

Wat probeer je eigenlijk te zeggen? Dus niet back-uppen omdat ze te groot zijn?

  • F_J_K
  • Registratie: juni 2001
  • Niet online

F_J_K

Moderator CSA/PB

Front verplichte underscores

Er zal wellicht geen zware tijdsdruk liggen op recoveren. Maar goed. Dat was de vraag niet vd TS. Ik ben benieuwd welk tool het effectief en efficiënt verkleint op deze schaal. (Edit: 52 weken, 5 dagen per week, 8 per minuut, foutloos).

[Voor 42% gewijzigd door F_J_K op 20-11-2018 23:18]

'Multiple exclamation marks,' he went on, shaking his head, 'are a sure sign of a diseased mind' (Terry Pratchett, Eric)


  • The Eagle
  • Registratie: januari 2002
  • Laatst online: 13:05

The Eagle

I wear my sunglasses at night

jeroen3 schreef op dinsdag 20 november 2018 @ 11:41:
[...]

Nu zijn oude facturen over het algemeen niet bestanden die je jaren later nog steeds elke dag nodig hebt...
Jij niet, maar de belastingdienst wel. Iets met wettelijke bewaartermijnen van je administratie.
En vwb factuurverwerking: ik kan je bij deze melden dat het verwerken van een simple, inkomende factuur soms wel 25 euro PER FACTUR kan kosten aan personeel en IT kosten. Red je het met 6 euro per factur doe je het heel goed. Maar dat terzijde.

Ontopic: Ik ga er even vanuit dat je die bestanden op disk opslaat. Feitelijk ben je dan op zoek naar relatief goedkope LOB opslag. Opsla waar je het naartoe kunt pompen om daarna te kunnen vergeten en alleen terug te halen indien nodig.
Weet niet of je al cloud spul hebt staan, maar zowel Azure als AWS bieden een dergelijke service aan. Van AWS kun jij zelfs een virtuele storage VM krijgen die verbindt met AWS storage voor dit soort doeleinden. Hang je in je netwerk, configgen en klaar. En alles wat je er op dumpt komt bij hen te staan, encrypted, gebackupped en safe. Kwestie van goed inrichten. Recent spul on site houden en ouder spul lekker in de cloud laten. Stukken goedkoper voor dergelijke doeleinden dan wat voor onsite storage dan ook :)

Ben je aan het verkleinen omdat die bestanden in een DB opgeslagen worden die uit zijn klauwen groeit: zie bovenstaande en denk aan archivering op disk. Alleen je meest recente spullen laat je onsite staan.

Oh ja, en kijk ven met welk programma en instellingen je de PDF genereert. Daar wat setings in tweaken wil ook nog wel eens helpen.

Al is het nieuws nog zo slecht, het wordt leuker als je het op zijn Brabants zegt :)


  • Turdie
  • Registratie: maart 2006
  • Laatst online: 12:06
Centraal op een fileshare opslaan met deduplicatie?

  • u34186
  • Registratie: september 2001
  • Niet online
shadowman12 schreef op woensdag 21 november 2018 @ 00:04:
Centraal op een fileshare opslaan met deduplicatie?
Wat is je vraag? :? :P

Anyway, hoe groot is de kans op dubbele data met allemaal gecomprimeerde PDF's van (andere) facturen? Ik vrees dat daar niet heel erg veel winst te behalen valt.

Block ads en trackers: uBlock Origin, uMatrix, Pi-Hole
YouTube: SponsorBlock en YoutubeVanced


  • The Eagle
  • Registratie: januari 2002
  • Laatst online: 13:05

The Eagle

I wear my sunglasses at night

Die kans acht ik idd ook klein ja. En als die kans wel groot is moet je je boekhouders eens op het matje roepen :P

@Evanescent was je vroeg op, kon je niet slapen of ben je gewoon een mafketel om op die tijd te posten :?

Al is het nieuws nog zo slecht, het wordt leuker als je het op zijn Brabants zegt :)


  • Turdie
  • Registratie: maart 2006
  • Laatst online: 12:06
Evanescent schreef op woensdag 21 november 2018 @ 04:52:
[...]

Wat is je vraag? :? :P

Anyway, hoe groot is de kans op dubbele data met allemaal gecomprimeerde PDF's van (andere) facturen? Ik vrees dat daar niet heel erg veel winst te behalen valt.
Het was ook meer een voorstel dat wellicht een optie is om te overwegen voor de TS, over het algemeen zijn documenten goede kandidaten voor deduplicatie
Pagina: 1


Apple iPad Pro (2021) 11" Wi-Fi, 8GB ram Microsoft Xbox Series X LG CX Google Pixel 5a 5G Sony XH90 / XH92 Samsung Galaxy S21 5G Sony PlayStation 5 Nintendo Switch Lite

Tweakers vormt samen met Hardware Info, AutoTrack, Gaspedaal.nl, Nationale Vacaturebank, Intermediair en Independer DPG Online Services B.V.
Alle rechten voorbehouden © 1998 - 2021 Hosting door True