Check alle échte Black Friday-deals Ook zo moe van nepaanbiedingen? Wij laten alleen échte deals zien

import data excel of access

Pagina: 1
Acties:

  • sprankel
  • Registratie: December 2006
  • Laatst online: 25-11 15:46
Ik zoek dringend een oplossing om data te importeren naar excel access maar wel correct. Ik zal beginnen met uit te leggen waar de data van komt.

1) Ik heb een hele hoop papieren met daarop een heleboel informatie waar ik maar een deel van nodig hebben.

2) Ik gebruik een automatische scanner om die papieren in te scannen en stuur die data in pdf door naar mijn pc.

3) ABBYY FineReader 9 zet al die pdf om in werkbare documenten. Deze kunnen respectievelijk naar excel, word, txt, html, enzovoort gezet worden.

4) in deze stap zou ik dus die documenten in een database willen in excel of access

Eerste probleem is dat de lay-out niet altijd hetzelfde is, tot hier toe heb ik 4 verschilende lay-outs

Tweede probleem is dat ik enkel bepaalde data nodig heb maar welke data hangt af van welke lay out

In principe is het mogelijk te bepalen met welke lay out de pc te maken heeft door te gaan kijken welke values er zijn, in die zin dat er andere dingen staan afhankelijk van de lay out. bijvoorbeeld in lay-out nr 2 staat er "boomtype :" welke niet voorkomen in de andere lay out's

derde probleem is dat er pagina's gescand worden waar andere dingen opstaan (bijlagen bij de papieren die ik nodig heb), deze moeten automatisch genegeerd worden.

Wat ik feitelijk zou willen is dat er gezocht word naar bijvoorbeeld boomtype en dat de data die naast boomtype staat weggeschreven word naar een database in acces of excel

Iemand een idee hoe dit best aan te pakken?

  • Lustucru
  • Registratie: Januari 2004
  • Niet online

Lustucru

26 03 2016

Kun je coderen, is je OCR betrouwbaar en ligt de layout verder eenduidig vast? Schrijf een routine die de output parsed en gestandaardiseerd wegschrijft.
Zo niet? bel randstad en huur een datatypiste.

Anders gezegd, wat wil je nu van ons?

De oever waar we niet zijn noemen wij de overkant / Die wordt dan deze kant zodra we daar zijn aangeland


  • remco_k
  • Registratie: April 2002
  • Laatst online: 08:28

remco_k

een cassettebandje was genoeg

^^ met hem.

Wat TS wil is niet zo standaard te verkrijgen.
Kan niet anders dan ingewikkeld scripten in Excel of Access (geen idee of dat laatste kan).
En kom je al gauw in de buurt van het nivo van een software developer.
Dus die kan je, naast de optie voor wat tiepmiepen, ook overwegen in te huren.
Ik kost minder dan €200,- per uur maar meer dan €100,- per uur (excl. ergernis kosten)... Weet je dat vast. :+

[ Voor 6% gewijzigd door remco_k op 04-07-2008 23:32 ]

Alles kan stuk.


  • aZuL2001
  • Registratie: September 2002
  • Laatst online: 12-10 22:55
offtopic:
Dan wil ik niet weten wat een developer per uur kost :+

Abort, Retry, Quake ???


  • remco_k
  • Registratie: April 2002
  • Laatst online: 08:28

remco_k

een cassettebandje was genoeg

aZuL2001 schreef op vrijdag 04 juli 2008 @ 23:34:
offtopic:
Dan wil ik niet weten wat een developer per uur kost :+
offtopic:
Kijk 's in m'n profiel dan.
remco_k (profiel)
Beroep: Software Engineer ;)
Of die prijzen kloppen? Geen idee. Komt denk ik wel in de buurt. Ik ken de prijzen niet die mijn werkgever doorrekent. (wat misschien maar goed is ook... :+ )


Hoe dan ook, welke software dan ook.
Succes van dit projectje valt of staat met de kwaliteit van de OCR.
Als die al matig is, dan kan je doen met de data wat je wilt, maar als er al garbage in komt, komt dat er ook uit. Dus voordat je heel ingewikkelde routes uitstippeld, stel eerst even vast hoe betrouwbaar en goed de OCR werkt. Gaat de OCR niet goed, dan gaat de rest 100% zeker weten nooit goed.

[ Voor 69% gewijzigd door remco_k op 04-07-2008 23:43 ]

Alles kan stuk.


  • sprankel
  • Registratie: December 2006
  • Laatst online: 25-11 15:46
de ocr is enorm goed, ik heb hem nog getraind, de gegevens staan in hetzelfde letterype. Beter nog, als we alles manueel gaan inputten gaan er veel meer fouten inkomen dan dat we met ocr werken.

programeren oke, maar hoe dan? vanuit excel, vanuit acces, vanuit c#, vanuit vb.net? en welk bestand is dan het gemakelijkst om in te lezen? (txt is niet echt een optie omdat de gegevens dan niet correct gerangschikt worden. Of is eer een ocr die onmiddelijk het form kan inlezen en opslagen in een database?

[ Voor 46% gewijzigd door sprankel op 05-07-2008 14:33 ]


  • Lustucru
  • Registratie: Januari 2004
  • Niet online

Lustucru

26 03 2016

Taal maakt geen barst uit. Als de output in Excel goed is, lijkt voor mij dan een stukje VBA met output naar Access 1e keus, simpelweg omdat ik dat taaltje kan dromen. Een ander is op een ander platform sneller klaar.
Inlezen idem dito: in elke taal is er wel een io klasse te vinden en voor sommige bestandsoorten zijn er OLeDB / ODBC drivers te vinden die het leven nog makkelijker maken. Hoe kunnen wij weten wat in jouw geval, met jouw bestanden de beste oplossing is? Laat er gewoon iemand naar kijken met verstand van zaken. :)

[ Voor 114% gewijzigd door Lustucru op 05-07-2008 14:44 ]

De oever waar we niet zijn noemen wij de overkant / Die wordt dan deze kant zodra we daar zijn aangeland


  • sprankel
  • Registratie: December 2006
  • Laatst online: 25-11 15:46
Lustucru schreef op zaterdag 05 juli 2008 @ 14:36:
Taal maakt geen barst uit. Als de output in Excel goed is, lijkt voor mij dan een stukje VBA met output naar Access 1e keus, simpelweg omdat ik dat taaltje kan dromen. Een ander is op een ander platform sneller klaar.
dat is het hem niet, ik heb niet echt een taal waar ik thuis hoor, ik programeer zowel vba, c# als vb.net. Nu was ik eerst van plan alles te laten lezen, en te zoeken naar bijvoorbeeld boomstam en indien gevonden lees wat erna komt en schrijf het weg. Maar ik was nog maar bezig aan het word doc en ik kreeg type mismatch bij het lezen van het doc. (was in c#)

maar het is mss idd gemakelijker van als output van ocr excell te nemen

[ Voor 5% gewijzigd door sprankel op 05-07-2008 14:44 ]


  • remco_k
  • Registratie: April 2002
  • Laatst online: 08:28

remco_k

een cassettebandje was genoeg

sprankel schreef op zaterdag 05 juli 2008 @ 14:43:
[...]
maar het is mss idd gemakelijker van als output van ocr excell te nemen
Waar je dan met wat VBA ofzo door de cellen heen kan itereren op zoek naar herkenbare punten zodat je weet over welk type form je het hebt, dan de data volgens dat type verwerken naar een database ofzoiets...
Ik zou het zelf in C++ gaan maken, in een mooie losse applicatie en schrijven naar een MySQL of Sybase database. Maargoed, er zijn wat dat betreft talloze wegen die naar Rome leiden.

Alles kan stuk.


  • sprankel
  • Registratie: December 2006
  • Laatst online: 25-11 15:46
remco_k schreef op zaterdag 05 juli 2008 @ 20:53:
[...]

Waar je dan met wat VBA ofzo door de cellen heen kan itereren op zoek naar herkenbare punten zodat je weet over welk type form je het hebt, dan de data volgens dat type verwerken naar een database ofzoiets...
Ik zou het zelf in C++ gaan maken, in een mooie losse applicatie en schrijven naar een MySQL of Sybase database. Maargoed, er zijn wat dat betreft talloze wegen die naar Rome leiden.
ik haat c++, ben gewoon van met .net en plots moest ik een examen in c++ gaan afleggen. Ik was er wel door maar toch vond ik de taal niet zo aangenaam (kwestie van gewoonte denk ik)

  • remco_k
  • Registratie: April 2002
  • Laatst online: 08:28

remco_k

een cassettebandje was genoeg

sprankel schreef op zondag 06 juli 2008 @ 00:04:
[...]
ik haat c++, ben gewoon van met .net en plots moest ik een examen in c++ gaan afleggen. Ik was er wel door maar toch vond ik de taal niet zo aangenaam (kwestie van gewoonte denk ik)
offtopic:
Ik ken c# niet zo goed, wellicht is c# niet zo streng als C++, maar dat is juist wat ik lekker vind aan C++.

Maargoed, in C# kan je hetzelfde maken als C++.

Alles kan stuk.


  • sprankel
  • Registratie: December 2006
  • Laatst online: 25-11 15:46
project is vandaag afgevoerd, het was wel mogelijk maar er waren teveel complicaties die teveel tijd gingen vragen in vergelijking met manuele input. in ieder geval bedankt voor de raad en van mij mag hier een slotje op :)
Pagina: 1