Ik heb een programma geschreven dat oa uit een remote file (HTTP, ik gebruik java.net.URL) alle links filtert. Dit lukt me wel, op 1 ding na:
Als de base url een directory is die niet eindigt op een /, dan zit de child URL een directory te laag als hij relatief is.
Voorbeeld: base URL = http://www.domein.nl/bla, daarin zit een link naar doc.html, dan maakt hij hiervan http://www.domein.nl/doc.html en niet http://www.domein.nl/bla/doc.html.
Ik gebruik gewoon een constructor voor het creeren van de child URL:
Weet iemand of hier iets tegen te doen is? De base URL zelf ophalen en kijken naar de response code (moved) werkt niet altijd, want een file kan ook redirected zijn. Of moet ik dit gewoon maar accepteren, en documenteren dat de resultaten incorrect kunnen zijn als er geen / achter paden staat?
Als de base url een directory is die niet eindigt op een /, dan zit de child URL een directory te laag als hij relatief is.
Voorbeeld: base URL = http://www.domein.nl/bla, daarin zit een link naar doc.html, dan maakt hij hiervan http://www.domein.nl/doc.html en niet http://www.domein.nl/bla/doc.html.
Ik gebruik gewoon een constructor voor het creeren van de child URL:
Java:
1
| URL child = new URL(base, linkje); |
Weet iemand of hier iets tegen te doen is? De base URL zelf ophalen en kijken naar de response code (moved) werkt niet altijd, want een file kan ook redirected zijn. Of moet ik dit gewoon maar accepteren, en documenteren dat de resultaten incorrect kunnen zijn als er geen / achter paden staat?
More than meets the eye
There is no I in TEAM... but there is ME
system specs