Recent heb ik een xml-bestand en een zip met daarin een bestandsstructuur met daarin een aantal bestanden aangeleverd gekregen. Deze xml is op basis van de geexporteerde gegevens uit een MS SQL database, waarbij de binaries in eerder genoemde 'willekeurige' bestandsstructuur zijn opgeslagen.
Het is de bedoeling dat ik met die xml-file, waarin het een en ander staat beschreven over de bestanden in die zip, een nieuwe bestandsstructuur maak.
De XML ziet er als volgt uit:
Het betreft een platte structuur waarbij er vele van bovenstaande blokken op dezelfde hoogte staan.
Belangrijkste kenmerken zijn (wat mij betreft) 'document_naam', 'URI' en 'tree_path' - deze laatste geeft de mapnaam aan, en dat kan meerdere mappen diep zijn. Daarnaast zou het mooi zijn als 'created' en 'modified' ook kunnen worden meegenomen, maar dat is niet noodzakelijk.
Mijn vragen: heeft iemand een goed idee om de gewenste bestandsstructuur (tree_path) aan te maken o.b.v. de xml? Het liefst krijg ik een verwijzing naar een goede tool om dit eenvoudig voor elkaar te krijgen.
Ik ben bekend met en beschik over Linux en Windows.
PS: het uiteindelijke doel is om dit in Alfresco te importeren, dus als daar een goede tool voor bestaat die alles in één keer doet, dan ben ik daar ook erg blij mee.
Het is de bedoeling dat ik met die xml-file, waarin het een en ander staat beschreven over de bestanden in die zip, een nieuwe bestandsstructuur maak.
De XML ziet er als volgt uit:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
| <document> <document_naam>Versie II - RenD-uitgaven private sector.doc</document_naam> <pk_document_id>3489</pk_document_id> <gepubliceerd>1</gepubliceerd> <document_actief>1</document_actief> <URI>W:\websites\dms\CheckedIn\00\00\00\51431C7B-AC23-4C9C-AB00-D69738B8077A.doc</URI> <file_created/> <file_modified/> <created>2008-01-07T15:53:56+01:00</created> <modified>2008-01-07T15:53:56+01:00</modified> <eigenaar_persoon_id>1559218</eigenaar_persoon_id> <eigenaar_persoon_formal_naam>De heer ABC</eigenaar_persoon_formal_naam> <doc_ident_id>3489_5304_58946</doc_ident_id> <tabelnaam>tbl_werkgroep</tabelnaam> <PK_tabel_ID>4617</PK_tabel_ID> <context_naam>Beleidscommissie Innovatie & Kennis</context_naam> <html_label>Vergadering 14 maart 2008</html_label> <tree_path>/Vergadering 14 maart 2008</tree_path> <identifier>VergaderingenBijWerkgroep</identifier> <PK_tree_node_locator_id>5304</PK_tree_node_locator_id> <PK_tree_node_id>58946</PK_tree_node_id> </document> |
Het betreft een platte structuur waarbij er vele van bovenstaande blokken op dezelfde hoogte staan.
Belangrijkste kenmerken zijn (wat mij betreft) 'document_naam', 'URI' en 'tree_path' - deze laatste geeft de mapnaam aan, en dat kan meerdere mappen diep zijn. Daarnaast zou het mooi zijn als 'created' en 'modified' ook kunnen worden meegenomen, maar dat is niet noodzakelijk.
Mijn vragen: heeft iemand een goed idee om de gewenste bestandsstructuur (tree_path) aan te maken o.b.v. de xml? Het liefst krijg ik een verwijzing naar een goede tool om dit eenvoudig voor elkaar te krijgen.
Ik ben bekend met en beschik over Linux en Windows.
PS: het uiteindelijke doel is om dit in Alfresco te importeren, dus als daar een goede tool voor bestaat die alles in één keer doet, dan ben ik daar ook erg blij mee.