Hallo,
Ik ben bezig om in java een tool te maken om HTML-pagina's uit te lezen en te verwerken.
Dat lukt allemaal prima behalve dat ik nu tegen een encoding probleem aanloop.
Althans dat denk ik uit zoekresultaten uit google etc.
Ik lees nu de pagina in in een StringBuffer en delen verwerk ik in mijn tool.
Nu loop ik bijv. tegen de volgende String aan in mijn verwerking:
I'm Scared, dit krijg ik binnen als: I'm Scared
Ik heb dit proberen op te lossen met URLDecoder.decode ( "UTF-8") .
Ook bij het inlezen heb ik dit probleem op proberen te lossen.
Nog steeds geen goed resultaat gekregen en ik blijf dus I'm Scared in mijn app binnen krijgen.
Ik weet het op dit moment ff helemaal niet meer hoe dit nu op te lossen.
Kan iemand mij een zet in de juiste richting geven?
Ik ben bezig om in java een tool te maken om HTML-pagina's uit te lezen en te verwerken.
Dat lukt allemaal prima behalve dat ik nu tegen een encoding probleem aanloop.
Althans dat denk ik uit zoekresultaten uit google etc.
Ik lees nu de pagina in in een StringBuffer en delen verwerk ik in mijn tool.
Nu loop ik bijv. tegen de volgende String aan in mijn verwerking:
I'm Scared, dit krijg ik binnen als: I'm Scared
Ik heb dit proberen op te lossen met URLDecoder.decode ( "UTF-8") .
Ook bij het inlezen heb ik dit probleem op proberen te lossen.
Nog steeds geen goed resultaat gekregen en ik blijf dus I'm Scared in mijn app binnen krijgen.
Ik weet het op dit moment ff helemaal niet meer hoe dit nu op te lossen.
Kan iemand mij een zet in de juiste richting geven?