Tekst uit PDF copy&paste -> blokjes...

Pagina: 1
Acties:
  • 339 views sinds 30-01-2008
  • Reageer

Acties:
  • 0 Henk 'm!

  • JHMvP
  • Registratie: December 2002
  • Laatst online: 02-11-2024

JHMvP

Veritas logica est

Topicstarter
Ik heb hier een joekel van een PDF-bestand dat bestaat uit afbeeldingen en tekst. Het document is in het Nederlands, niet beveiligd en de tekst is échte tekst (dus niet omgezet naar vector of afbeelding).

Het probleem is echter dat wanneer ik de tekst uit het document middels "T" selecteer, copy en paste naar OpenOffice, Kladblok of WordPad er alleen maar open blokjes verschijnen. Ook de zoekfunctie binnen de PDF werkt dus niet.

Wat is de oorzaak hiervan, hoe lost ik het op en hoe kan ik dit in het vervolg voorkomen?

AS/400, Linux, Novell, Windows, DOS, OS/2...luck has nothing to do with it.
*** Ignorance and nonchalance will lead us happily into slavery of evil ***


Acties:
  • 0 Henk 'm!

  • Witte
  • Registratie: Februari 2000
  • Laatst online: 01-04 17:01
google eens op pdf2txt

Houdoe


Acties:
  • 0 Henk 'm!

  • Motrax
  • Registratie: Februari 2004
  • Niet online

Motrax

Profileert

Van *.pdf naar *.txt omzetten

Meest simpele: volledige acrobat gebruiken.
Legaal thuis kan je beter pdf2txt gebruiken.
En anders mijn oplossing Omniformat, ook legaal :)

☻/
/▌
/ \ Analyseert | Modelleert | Valideert | Solliciteert | Generaliseert | Procrastineert | Epibreert |


Acties:
  • 0 Henk 'm!

  • MAX3400
  • Registratie: Mei 2003
  • Laatst online: 16-06 13:21

MAX3400

XBL: OctagonQontrol

Wel dezelfde karakterset geinstalleerd staan?

Mijn advertenties!!! | Mijn antwoorden zijn vaak niet snowflake-proof


Acties:
  • 0 Henk 'm!

  • Savantas
  • Registratie: December 2002
  • Laatst online: 19-06 16:26
Het kan dat alle tekst in een vreemd lettertype staat. We hebben ooit op het werk een boek in India op laten maken om op cdrom te verkopen, maar ook daar kwam dit probleem tevoorschijn. Dit bleek aan een vreemde karakterindeling van het origineel te liggen...

@Max3400: juistem!

[ Voor 18% gewijzigd door Savantas op 11-10-2006 14:50 ]

Ik denk niet zwart-wit, ik denk diapositief! ( ͡° ͜ʖ ͡°)


Acties:
  • 0 Henk 'm!

  • JHMvP
  • Registratie: December 2002
  • Laatst online: 02-11-2024

JHMvP

Veritas logica est

Topicstarter
Voor de duidelijkheid; ik wil niet exporteren naar TXT-bestanden en al helemaal niet OCR'ren. Ik wil een PDF-document waarin ik gewoon tekst kan sleuren&pleuren naar een tekstverwerker en waarin ik op tekst kan zoeken. Dit kan nu niet en ook PDF2TXT zal daar geen verandering in brengen.

Ehhhh....karakterset? Kan ik die wijzigen zonder aan de gebruikte lettertypes in het te komen?

[ Voor 9% gewijzigd door JHMvP op 11-10-2006 15:38 ]

AS/400, Linux, Novell, Windows, DOS, OS/2...luck has nothing to do with it.
*** Ignorance and nonchalance will lead us happily into slavery of evil ***


Acties:
  • 0 Henk 'm!

  • MAX3400
  • Registratie: Mei 2003
  • Laatst online: 16-06 13:21

MAX3400

XBL: OctagonQontrol

PDF openen, CTRL+D, tabblad fonts.
En dan kijken of de gebruikte fonts ook op jouw PC bestaan als TTF.

Zo niet; font kopen/downloaden en installeren. Daarna kan je wel copy/pasten.

Mijn advertenties!!! | Mijn antwoorden zijn vaak niet snowflake-proof


Acties:
  • 0 Henk 'm!

  • JHMvP
  • Registratie: December 2002
  • Laatst online: 02-11-2024

JHMvP

Veritas logica est

Topicstarter
U is werkelijk geniaal! _/-\o_
Als ik kijk bij het lijstje fonts dan staat daar inderdaad een hele waslijst met fonts die ik niet geïnstalleerd heb op de PC (PDF is van origine op een MAC gemaakt). Bij alle fonts staat wel "(Ingesloten subset)" dus dan vraag ik mij af of en hoe ik die fonts er ook weer uit kan halen?

Enneh....betekent dit dan ook dat mensen die ik deze PDF stuur, óók de ingesloten fonts moeten kopen om tekst te kunnen kopieren&plakken of te kunnen zoeken in de PDF? Duur geintje!

[ Voor 28% gewijzigd door JHMvP op 11-10-2006 15:57 ]

AS/400, Linux, Novell, Windows, DOS, OS/2...luck has nothing to do with it.
*** Ignorance and nonchalance will lead us happily into slavery of evil ***


Acties:
  • 0 Henk 'm!

  • MaikelG
  • Registratie: Januari 2001
  • Laatst online: 21-08-2024

MaikelG

^^

en als je nou ipv standaard "plakken" de optie "plakken speciaal" gebruikt, dan plakken zonder opmaak?

^^ 4 mega pixels - BF1 / Discord: bierrrrrtje


Acties:
  • 0 Henk 'm!

  • JHMvP
  • Registratie: December 2002
  • Laatst online: 02-11-2024

JHMvP

Veritas logica est

Topicstarter
Geen verschil...

AS/400, Linux, Novell, Windows, DOS, OS/2...luck has nothing to do with it.
*** Ignorance and nonchalance will lead us happily into slavery of evil ***

Pagina: 1