Check alle échte Black Friday-deals Ook zo moe van nepaanbiedingen? Wij laten alleen échte deals zien
Toon posts:

PDF omzetten naar Word

Pagina: 1
Acties:
  • 965 views

Verwijderd

Topicstarter
Hallo allemaal,

Ik heb een pdf file voor mijn studie die ik graag wil omzetten naar words. Als ik het kopier/plak krijg ik allemaal rare tekens. Nu heb ik op internet verschillende gratis programma's gevonden die pdf kunnen omzetten naar words. Maar dan komt er één groot words document uit, met dezelfde rare tekens/getallen. En wordt er aangegeven: speciale codering ofzoiets.

Ik denk dat het iets te maken heeft met een bepaalde beveiliging.

Heeft iemand een oplossing om het toch te kunnen omzetten? Bepaald programma?

Alvast bedankt voor het meedenken!

Met vr. gr.

Matthew

  • gambieter
  • Registratie: Oktober 2006
  • Niet online

gambieter

Just me & my cat

Dan zul je toch wat meer specifieke informatie moeten geven, en eventueel een linkje naar de pdf-file. Want wat je nu her geeft is erg vaag.

Al contact opgenomen met de makers van de pdf? Als het een commerciele beveiliging is, dan heb je pech.

I had a decent lunch, and I'm feeling quite amiable. That's why you're still alive.


  • begintmeta
  • Registratie: November 2001
  • Niet online

begintmeta

Moderator General Chat
't is als ik het zo lees in ieder geval een 'tekstueel' PDF-document, dus wat dat betreft zou er wel tekst uit te halen moeten zijn (in tegensteling tot grafische PDFs(zonder OCR dan)). Verder: welke taal/tekenset gebruikt het PDFje, studeer je chinees of iets dergelijks?

Wat heb je al geprobeerd? Ik gebruik zelf soms pdftotext uit poppler, maar je kunt eventueel ook Adobes webservice proberen. Het zou ook een gecodeerde pdf kunnen zijn oid, maar daar zou je omheen moeten kunnen komen.

[ Voor 13% gewijzigd door begintmeta op 05-02-2010 01:03 ]


Verwijderd

Topicstarter
Bedankt voor de snelle reacties.

Ik heb het idd misschien niet echt duidelijk omschreven.

Het gaat om het volgende PDF bestandje:

http://www.huiselijkgewel...erd%20geweld%20nazorg.pdf

Maar ik studeer SPH, geen buitenlandse talen ofzo.. ;)

  • begintmeta
  • Registratie: November 2001
  • Niet online

begintmeta

Moderator General Chat
De webservice husselt de tekst wel enigszins door elkaar (helaas is het omzetten van pdfs naar tekst niet heel simpel), maar geen gekke tekens te zien. Misschien doet pdftotext het nog wat beter.

Verwijderd

Topicstarter
Hoe werkt Poppler precies? Ik heb het nu gedownload, maar heb niet echt een installatiebestandje ofzo..

[ Voor 3% gewijzigd door Verwijderd op 05-02-2010 01:17 ]


  • begintmeta
  • Registratie: November 2001
  • Niet online

begintmeta

Moderator General Chat
Hmm, je gebruikt vermoedelijk windows, dat compliceert de boel wat. Je kunt kijken wat pdftotext uit xpdf ervan maakt ftp://ftp.foolabs.com/pub/xpdf/xpdf-3.02pl4-win32.zip

Verwijderd

Topicstarter
Bedankt voor het snelle reageren nogmaals!

Ik heb gebruik idd het ouderwetse windows vista.

Ik heb de link van jou gedownload, uitgepakt. Als ik nu op pdftotext.exe druk, zie ik een zwart scherm die dan weer direct wegvalt. Klopt dat?

  • --Niels--
  • Registratie: September 2004
  • Laatst online: 25-11 23:22
Het lettertype wat gebruikt wordt in dit pdf'je heeft een andere codering dan de normale lettertypen die wij gebruiken (Dat geeft Adobe Acrobat aan als je het lettertype probeert te veranderen).
Dit soort beveiliging zie je wel vaker. Ze hebben dus een lettertype gemaakt met een onbekende/beveiligde codering. Hierdoor kun je het niet naar een ander programma kopiëren aangezien dan een A bijv. een : wordt en een : een $.

De enigste manier om dit te omzeilen is door de blz's van het pdf'je als plaatjes op te slaan (liefts png van 300 dpi) en ze dan weer te laten ocr'en door een programma.

  • begintmeta
  • Registratie: November 2001
  • Niet online

begintmeta

Moderator General Chat
IMHO deed de webservice het anders ook best aardig (heel vluchtig bekeken ;)).

Maar OCRen met een goed programma is ook een hele goede oplossing, en uiteindelijk het betrouwbaarst. ABBYY maakt een speciaal OCR-programmatje daarvoor geloof ik, en ook andere programmas kunne direct met pdfs overweg meen ik.
Verwijderd schreef op vrijdag 05 februari 2010 @ 01:31:
B...
Ik heb de link van jou gedownload, uitgepakt. Als ik nu op pdftotext.exe druk, zie ik een zwart scherm die dan weer direct wegvalt. Klopt dat?
Ja, maar wat je (het ahndigst) moet doen is een command prompt opstarten ('dos-scherm', cmd.exe opstarten) en van daaruit met pdftotext.exe werken, het is namelijk een CLI-programma.
crack_en_hack schreef op vrijdag 05 februari 2010 @ 01:49:
Is er geen tool om die beveiliging eraf te slopen...?
sowieso een OCR-pogramma

[ Voor 78% gewijzigd door begintmeta op 05-02-2010 01:54 ]


  • crack_en_hack
  • Registratie: Juli 2006
  • Laatst online: 21-09 23:20
Is er geen tool om die beveiliging eraf te slopen...?

Ik ben vrijgezel omdat mijn schoonouders geen kinderen konden krijgen!, Ook heb ik zovaak ergens schijt aan dat ik stront tekort kom!


  • gambieter
  • Registratie: Oktober 2006
  • Niet online

gambieter

Just me & my cat

crack_en_hack schreef op vrijdag 05 februari 2010 @ 01:49:
Is er geen tool om die beveiliging eraf te slopen...?
Dat zal hier niet de bedoeling zijn, want blijkbaar willen de producenten van het document niet dat het zomaar gekopieerd wordt (en terecht). De TS kan het beste eerst contact opnemen met de makers van het document en vragen of de tekst gereproduceerd mag worden.

@TS: waarom wil je de tekst in Word hebben? Er zit copyright op, dus mag niet zomaar ergens gebruikt worden. Voor de studie is de pdf toch voldoende? :)

[ Voor 3% gewijzigd door gambieter op 05-02-2010 01:57 ]

I had a decent lunch, and I'm feeling quite amiable. That's why you're still alive.


  • begintmeta
  • Registratie: November 2001
  • Niet online

begintmeta

Moderator General Chat
Een goede vraag, wel offtopic. Gambieter ruikt plagiaat... >:)

Op zich staan de makers van het PDFje wel alle ver/bewerkingen toe, dus in ieder geval hebben ze geen zeer sterke intentie reproductie tegen te gaan (dan is publicatie van een PDF zonder de standaard beveiligingsmechanismen (encryptie, verbod printen/kopieren/veranderen) in ieder geval onverstandig, of eigenlijk publicatie per se is dan natuurlijk onverstandig (zeker op het internet)). Ook is het maken van kopieen voor eigen studie in principe toegestaan volgens de auteurswet.

  • gambieter
  • Registratie: Oktober 2006
  • Niet online

gambieter

Just me & my cat

begintmeta schreef op vrijdag 05 februari 2010 @ 02:24:
Een goede vraag, wel offtopic. Gambieter ruikt plagiaat... >:)
Nou, niet off-topic hoor ;) .
Op zich staan de makers van het PDFje wel alle ver/bewerkingen toe, dus in ieder geval hebben ze geen zeer sterke intentie reproductie tegen te gaan (dan is publicatie van een PDF zonder de standaard beveiligingsmechanismen (encryptie, verbod printen/kopieren/veranderen) in ieder geval onverstandig, of eigenlijk publicatie per se is dan natuurlijk onverstandig (zeker op het internet)). Ook is het maken van kopieen voor eigen studie in principe toegestaan volgens de auteurswet.
Dat de auteurs niet maximale beveiliging toepassen, mag niet worden gezien als instemming met kopieren of editen. Daar zal nog steeds toestemming voor moeten worden gevraagd. Het extraheren van de tekst is niet hetzelfde als het maken van een kopie voor studie, want die studie kan gedaan worden met het pdf-bestand.

I had a decent lunch, and I'm feeling quite amiable. That's why you're still alive.


  • JiBo
  • Registratie: September 2005
  • Laatst online: 23-11 09:57
Ik krijg hem vrij goed naar Word gezet met ABBY pdf transformer. Wij krijgen als systeembeheer regelmatig de vraag of we een pdf naar word kunnen zetten, en deze tool is tot nu toe degene die ons het vaakst helpt!

zie hier een voorbeeld:
http://sharebee.com/b7d76b28

  • begintmeta
  • Registratie: November 2001
  • Niet online

begintmeta

Moderator General Chat
Vind ik wel :>
Dat de auteurs niet maximale beveiliging toepassen, mag niet worden gezien als instemming met kopieren of editen. Daar zal nog steeds toestemming voor moeten worden gevraagd.
Nou ja, andersom kende je er wel waarde aan toe. ;)
Het extraheren van de tekst is niet hetzelfde als het maken van een kopie voor studie, want die studie kan gedaan worden met het pdf-bestand.
Dat weet je niet, misschien heeft de TS geen mogelijkheid PDF-bestanden te gebruiken (bijvoorbeeld omdat hij blind is en de software daar niet goed mee overweg kan, of niet de beschikking heeft over Acrobat reader (onwaarschijnlijk in dit geval :P)) In welke vorm een kopei voor eigen gebruik wordt gemaakt is wat dat betreft sowieso niet relevant.

Wat JiBo heeft gedaan mag natuurlijk niet })

  • JiBo
  • Registratie: September 2005
  • Laatst online: 23-11 09:57
begintmeta schreef op vrijdag 05 februari 2010 @ 10:53:
Wat JiBo heeft gedaan mag natuurlijk niet })
Leg eens uit? Ik heb een Tool gebruikt waarbij ik alleen heb aangegeven Converteer naar Word. Geen vinkjes, geen hacks, totaal niets. Dus wat is er gedaan wat niet mag?

  • Icekiller2k6
  • Registratie: Februari 2005
  • Laatst online: 14:22
Zolang er een bron vermelding is/copyright bewaard blijft is er niets aan de hand.

MT Venus E 5KW (V151) P1 HomeWizard | Hackerspace Brixel te Hasselt (BE) - http://www.brixel.be | 9800X3D, 96GB DDR5 6000MHZ, NVIDIA GEFORCE 4090, ASRock X670E Steel Legend, Seasonic GX1000


  • ewoud75
  • Registratie: December 2009
  • Laatst online: 13-11 15:59
Ook eens gedacht aan OpenOffice? Deze heeft ook de mogelijk om eea aan te passen DOC naar PDF en volgens mij ook visa versa...

  • begintmeta
  • Registratie: November 2001
  • Niet online

begintmeta

Moderator General Chat
JiBo schreef op vrijdag 05 februari 2010 @ 10:56:
...

Leg eens uit? Ik heb een Tool gebruikt waarbij ik alleen heb aangegeven Converteer naar Word. Geen vinkjes, geen hacks, totaal niets. Dus wat is er gedaan wat niet mag?
Ik dacht dat die link verwees naar een kopie van het bestand dat de TS wilde hebben, volgens mij mag je alleen kopieen voor eigen gebruik maken (of een kopie voor iemands eigen gebruik maken op diens verzoek). Als de TS je een mail had gestuurd of een PM en jij stuurde hem daarop het bestand toe was er niets aan de hand geweest.

Overigens ben ik toch ook wel benieuwd waarom je per se een doc-bestand wil hebben mlzmlzmlz

[ Voor 6% gewijzigd door begintmeta op 05-02-2010 11:18 ]


  • JiBo
  • Registratie: September 2005
  • Laatst online: 23-11 09:57
Ik snap nog steeds niet waarom de Word versie van een bestand wat publiekelijk op het internet staat en niet beveiligd is een handeling zou zijn wat niet mag?

  • begintmeta
  • Registratie: November 2001
  • Niet online

begintmeta

Moderator General Chat
Snap ik ook niet (iig met de toevoeging 'als het bestand daar met toestemming van de rechthebbende is geplaatst') maar 't is zo (IANAL) :P

[ Voor 53% gewijzigd door begintmeta op 05-02-2010 11:28 ]


  • JiBo
  • Registratie: September 2005
  • Laatst online: 23-11 09:57
Ik weet het ook niet, maar volgens mij is het probleem opgelost TS heeft zijn pdf in word.

  • begintmeta
  • Registratie: November 2001
  • Niet online

begintmeta

Moderator General Chat
Dat is zo, ABBYY maakt goede (OCR) software inderdaad, ook mijn favoriet (ook niet duur IMHO (al heb ik het niet zelf hoeven betalen ;)))
Icekiller2k6 schreef op vrijdag 05 februari 2010 @ 10:58:
Zolang er een bron vermelding is/copyright bewaard blijft is er niets aan de hand.
Valt vaak tegen. Maar sowieso is er meestal niets aan de hand...

[ Voor 49% gewijzigd door begintmeta op 05-02-2010 11:46 ]


  • F_J_K
  • Registratie: Juni 2001
  • Niet online

F_J_K

Moderator CSA/PB

Front verplichte underscores

Uitzendinggemist staat ook publiekelijk op het internet maar dat betekent niet dat er geen auteursrecht op zit. Art.15b van de Ateurswet noemt natuurlijk dat het (edit: =openbare publicaties van overheidsinstellingen) in principe wel mag worden gepubliceerd, maar het gaat hier om een bewerking en dat mag niet. IANAL maar kan wel lezen ;)

Anyway. mlzmlzmlz: welkom op GoT! Ondertussen moge het duidelijk zijn dat er best opties zijn (OCR etc, maar in alle gevallen moet je wel de handleiding etc lezen en niet alleen kopen/downloaden & klikken. Zie ook andere topics over het omzetten van pdf naar Words). Maar omdat het erg in het grijze gebied terecht komt ga ik dit topic sluiten.

Makkelijkste optie is overtypen van het kleine stukje dat je wilt citeren, of :er staan contactgegevens op de site van huiselijkgeweld.nl. Volgens de metadata is monique.koppen een vd auteurs. Haar contactgegevens zijn te vinden op het web.

[ Voor 3% gewijzigd door F_J_K op 05-02-2010 11:56 ]

'Multiple exclamation marks,' he went on, shaking his head, 'are a sure sign of a diseased mind' (Terry Pratchett, Eric)

Pagina: 1

Dit topic is gesloten.