Ik ben na een lange tijd weer eens met Java aan de gang gegaan en heb wat ideeen. Maar mijn kennis reikt op het moment niet ver genoeg om deze ook echt uit te voeren. Voor de ideeen die ik heb moet ik eigenlijk verschillende document kunnen uitlezen op inhoud. Het gaat hierbij om MS Word documenten en HTML pagina's.
De Word documenten wil ik eigenlijk doorlezen en daaruit de tekst, plaatjes en simpele opmaakprofielen halen.
HTML documenten wil ik naar een DOM model parsen zodat ik de inhoud en attributen van verschillende tags kan uitlezen.
Ik kom hier echter maar niet verder mee. Weet iemand hier hoe ik deze dingen kan aanpakken? Het liefst schrijf ik dingen zelf tov bestaande klassen. Maar als er nix anders is dan moet ik het daar maar mee doen!
De Word documenten wil ik eigenlijk doorlezen en daaruit de tekst, plaatjes en simpele opmaakprofielen halen.
HTML documenten wil ik naar een DOM model parsen zodat ik de inhoud en attributen van verschillende tags kan uitlezen.
Ik kom hier echter maar niet verder mee. Weet iemand hier hoe ik deze dingen kan aanpakken? Het liefst schrijf ik dingen zelf tov bestaande klassen. Maar als er nix anders is dan moet ik het daar maar mee doen!
Verlanglijstje: Switch 2, PS5 Pro Most wanted: Switch 2