Word-document inlezen en wegschrijven naar een database.

Pagina: 1
Acties:
  • 295 views sinds 30-01-2008
  • Reageer

  • googhum
  • Registratie: April 2003
  • Laatst online: 17-05-2022
Hoe los ik dit op:

1.) De bedoeling is een directory in te lezen met Word-documenten (vaste opmaak).
2.) En deze weg te schrijven naar aparte tabellen in een accessdatabase.

(het is dus een programma dat "oude"bestanden importeerd naar access)

- In welke taal is dit "makkelijk" te doen?
- Is het mogelijk afbeeldingen te lezen?
- Of makkelijker om via VB te doen binnen access?
- Of zal ik twee apps maken 1: converteren word-opmaak -> text
2: exporteren naar access

Alvast bedankt!

Verwijderd

File binair inlezen en wegschrijven in een "blob" veld ??

offtopic:
Ik snap nog altijd het nut niet om dit soort bestanden in een DB op te slaan,
een verwijzing naar het fysieke pad in een DB zou voldoende moeten zijn.

Makkelijker voor backup's, versie beheer, ODMA etc. etc.

[ Voor 70% gewijzigd door Verwijderd op 08-09-2004 23:02 ]


  • The Flow
  • Registratie: Mei 2004
  • Laatst online: 19-04-2024

The Flow

I am the greatest

zou ook mijn antwoord wezen....

God is in de war, hij denkt dat hij The Flow is...


  • googhum
  • Registratie: April 2003
  • Laatst online: 17-05-2022
Verwijderd schreef op 08 september 2004 @ 23:00:
File binair inlezen en wegschrijven in een "blob" veld ??

offtopic:
Ik snap nog altijd het nut niet om dit soort bestanden in een DB op te slaan,
een verwijzing naar het fysieke pad in een DB zou voldoende moeten zijn.

Makkelijker voor backup's, versie beheer, ODMA etc. etc.
Ik wil dus een gedeelte van het word bestand inlezen, en deze wegschrijven naar verschillende velden in een DB. Gaat hier om een import van oude toetsvragen naar een applicatie die gebruik maakt van een DB.

Voorbeeld:

Vragen10-09-04.doc:
Vraag 1.) Tralalalalala
a.
b.
c.
d.
Vraag 2.) ...
[afbeelding]
enz.

Antwoorden10-09-04.doc
1. A
2. B

Verwijderd

googhum schreef op 08 september 2004 @ 23:08:
[...]


Ik wil dus een gedeelte van het word bestand inlezen, en deze wegschrijven naar verschillende velden in een DB. Gaat hier om een import van oude toetsvragen naar een applicatie die gebruik maakt van een DB.

Voorbeeld:

Vragen10-09-04.doc:
Vraag 1.) Tralalalalala
a.
b.
c.
d.
Vraag 2.) ...
[afbeelding]
enz.

Antwoorden10-09-04.doc
1. A
2. B
ah, oeh, da's wat anders :)

Tsja, zal je toch via vb script in word die vragen moeten extraheren,
iets van
-Top of document
-Zoek naar "Vraag"
-Select tot einde regel
-schrijf selectie naar text bestand (of direct je db in)
-Zoek volgende "Vraag"
-etc. etc.

het tekst bestand wat je dan krijgt kan je dan importeren in je DB.

  • googhum
  • Registratie: April 2003
  • Laatst online: 17-05-2022
Dat is dus wat ik probeer te voorkomen. Het moet net iets meer geautomatiseerd gaan / kunnen. Het is namelijk een directory vol met deze bestanden.

Misschien concreter:
met welke programmeertaal / script taal kan ik het best overweg met office apps.

  • Delphi32
  • Registratie: Juli 2001
  • Laatst online: 19:25

Delphi32

Heading for the gates of Eden

Elke taal die het gebruik van COM ondersteunt. De enige (gangbare) manier om tegen die word documenten aan te praten is via de COM interfaces; of je dat nou via VBA, VB, Access (oh nee, da's ook weer VBA), Delphi, C# of een andere COM-enabled tool doet maakt niet uit. Wat jij lekker vindt werken :)

Verwijderd

googhum schreef op 08 september 2004 @ 23:21:
Dat is dus wat ik probeer te voorkomen. Het moet net iets meer geautomatiseerd gaan / kunnen. Het is namelijk een directory vol met deze bestanden.

Misschien concreter:
met welke programmeertaal / script taal kan ik het best overweg met office apps.
je kan toch via vbscript ook die directory uitlezen en de bestanden 1 voor 1 openen, en dan de zoek/export (zoals boven veschreven) uitvoeren ?

  • 12_0_13
  • Registratie: April 2004
  • Laatst online: 12-02 13:19
Het kan wel, want zo werk het CMS WebHare onder andere ook.

Het NADEEL is dat je het (binaire)formaat van de de word documenten moet kennen zodat je ze kan parsen enzo. Het is niet makkelijk, laat ik je dat alvast meegeven.

Maar als je toch een vast formaat hebt, kan je dan niet beter via Excel / Access een mooie CSV file op laten leveren?? Of een mooie TextArea in een of naders progseltje maken waar je gewoon plain text invult, dat weer makeklijk te parsen is? Of een XML structuur, of, of, of :) Gebruik je creativiteit :)

  • Creepy
  • Registratie: Juni 2001
  • Laatst online: 23:06

Creepy

Tactical Espionage Splatterer

12_0_13 schreef op 09 september 2004 @ 12:39:
Het kan wel, want zo werk het CMS WebHare onder andere ook.

Het NADEEL is dat je het (binaire)formaat van de de word documenten moet kennen zodat je ze kan parsen enzo. Het is niet makkelijk, laat ik je dat alvast meegeven.
Met behulp van de Office Automation Objects kan je met COM (zie Delphi32) prima een Word document openen en compleet parsen ZONDER het binaire formaat van het Word document te kennen.
Maar als je toch een vast formaat hebt, kan je dan niet beter via Excel / Access een mooie CSV file op laten leveren?? Of een mooie TextArea in een of naders progseltje maken waar je gewoon plain text invult, dat weer makeklijk te parsen is? Of een XML structuur, of, of, of :) Gebruik je creativiteit :)
Aangezien hij al een hoop wordt documenten heeft...... ;)

"I had a problem, I solved it with regular expressions. Now I have two problems". That's shows a lack of appreciation for regular expressions: "I know have _star_ problems" --Kevlin Henney


  • curry684
  • Registratie: Juni 2000
  • Laatst online: 12-05 22:23

curry684

left part of the evil twins

Verwijderd schreef op 08 september 2004 @ 23:00:
File binair inlezen en wegschrijven in een "blob" veld ??

offtopic:
Ik snap nog altijd het nut niet om dit soort bestanden in een DB op te slaan,
een verwijzing naar het fysieke pad in een DB zou voldoende moeten zijn.[/quote]

Makkelijker voor backup's, versie beheer, ODMA etc. etc.
En vervolgens restore je je database naar een nieuwe bak met een ander filesystem?

D'r is geen enkel probleem in dit soort dingen in blobs weg te schrijven in een DB. SQL Server 2000 heeft er zelfs speciale faciliteiten voor waarmee je 'image', 'text' en 'ntext' velden in een andere filegroup kunt storen dan de rest van de table, waarmee je bijvoorbeeld de I/O load netjes kunt balancen tussen meerdere RAID-sets, en waardoor je andere (lichtere) backuppolicies kunt gebruiken indien de blobs minder frequent worden gewijzigd dan de rest van de tabel (denk aan viewcounters e.d.).

Professionele website nodig?


Verwijderd

curry684 schreef op 09 september 2004 @ 13:00:
[...]
En vervolgens restore je je database naar een nieuwe bak met een ander filesystem?
ik zou ze sowieso niet zomaar bij elkaar zetten, als het goed is staat je db op een db server, en je files op een fileserver (op fileserver achtig iets).

En over het algemeen verander je niet zo vaak van filesystem lijkt me.

[ Voor 10% gewijzigd door Verwijderd op 09-09-2004 13:11 ]


  • curry684
  • Registratie: Juni 2000
  • Laatst online: 12-05 22:23

curry684

left part of the evil twins

Verwijderd schreef op 09 september 2004 @ 13:10:
[...]

ik zou ze sowieso niet zomaar bij elkaar zetten, als het goed is staat je db op een db server, en je files op een fileserver (op fileserver achtig iets).

En over het algemeen verander je niet zo vaak van filesystem lijkt me.
Maar als het gebeurt ben je wel de sjaak :) En heb je in de tussentijd voor niets afgezien van de wondermooie wereld van transactional integrity en consistency die de blob in je database wel had gehad :Y)

Professionele website nodig?


Verwijderd

curry684 schreef op 09 september 2004 @ 13:17:
[...]
Maar als het gebeurt ben je wel de sjaak :) En heb je in de tussentijd voor niets afgezien van de wondermooie wereld van transactional integrity en consistency die de blob in je database wel had gehad :Y)
Eh hoe koppel je dan een jukebox ??

  • curry684
  • Registratie: Juni 2000
  • Laatst online: 12-05 22:23

curry684

left part of the evil twins

Verwijderd schreef op 09 september 2004 @ 13:31:
[...]

Eh hoe koppel je dan een jukebox ??
Geen idee hoe je het precies bedoelt, maar ik presenteer de 'blob' niet als de end-all oplossing voor al je problemen :) Jij stelde enkel dat files buiten de DB houden een superieure oplossing was, en dat vecht ik hard aan. Dat in sommige gevallen (zeker in het geval van gigabytes aan niet-veranderende files zoals een MP3-collectie) een filename in principe afdoende is beaam ik zeker :)

Professionele website nodig?

Pagina: 1