Goedemiddag,
Ik doe samen met twee medestudenten een opdracht bij een echte opdrachtgever voor extra studiepunten. We moeten hiervoor een systeem ontwikkelen waar makkelijk bepaalde data is op te vragen.
We lopen echter tegen een probleem op: Er zijn bepaalde bronnen die we moeten gebruiken als input. Deze komen in de vorm van .xls of .csv bestanden. Het probleem hierbij is echter dat we niet weten hoe we zo'n bestand moeten scheiden om hem goed te kunnen importeren in een (mysql) database.
De xls sheets hebben namelijk weinig tot geen opmaak, en er zitten random witregels tussen. Dit is iets wat wij niet kunnen veranderen, aangezien dit via een externe partij gaat ( het gaat hier om staalproductie over de hele wereld ).
De probleemstelling is dus als volgt:
- Hoe importeren we (automatisch! ) de nieuwe statistieken van de staalproductie a.d.h.v. een .xls file ( het gaat hier om 2 bronnen, waarvan één hele crappy opmaak heeft. )
Ik hoop dat het verhaal een beetje duidelijk is. We zitten zelf net in de opstart-fase, dus voor ons is het ook een beetje zoeken naar wat een goede oplossing kan zijn.
Ik doe samen met twee medestudenten een opdracht bij een echte opdrachtgever voor extra studiepunten. We moeten hiervoor een systeem ontwikkelen waar makkelijk bepaalde data is op te vragen.
We lopen echter tegen een probleem op: Er zijn bepaalde bronnen die we moeten gebruiken als input. Deze komen in de vorm van .xls of .csv bestanden. Het probleem hierbij is echter dat we niet weten hoe we zo'n bestand moeten scheiden om hem goed te kunnen importeren in een (mysql) database.
De xls sheets hebben namelijk weinig tot geen opmaak, en er zitten random witregels tussen. Dit is iets wat wij niet kunnen veranderen, aangezien dit via een externe partij gaat ( het gaat hier om staalproductie over de hele wereld ).
De probleemstelling is dus als volgt:
- Hoe importeren we (automatisch! ) de nieuwe statistieken van de staalproductie a.d.h.v. een .xls file ( het gaat hier om 2 bronnen, waarvan één hele crappy opmaak heeft. )
Ik hoop dat het verhaal een beetje duidelijk is. We zitten zelf net in de opstart-fase, dus voor ons is het ook een beetje zoeken naar wat een goede oplossing kan zijn.