Ik wil op basis van een willekeurige webshop URL een aantal dingen ophalen. Zoals prijs van het artikel, afbeelding etc, de basale dingen. Dit op basis van een URL die de gebruiker invoert, ik ga dus expliciteit geen web scraping doen of servers lastig vallen.
De link kan van meerdere webshops zijn, maar zal voor deze toepassing vrijwel zeker altijd Nederlandse webshop URLs zijn. Buitenlandse webshop URLs zullen zeldzaam zijn, dus daar wil ik me niet op richten.
Nu ligt het aan de webshop op wat voor manier deze metadata beschikbaar is gesteld. Als het al beschikbaar is gesteld. Maar het kan dus zijn dat de webshop in kwestie Open Graph gebruikt, Schema.org of oEmbed.
Mijn vragen:
1. Kan ik met deze drie standaarden het gros van de webshops afdekken? (los van de webshops die hier niks aan gedaan hebben)
Of zijn er nog meer standaarden? Of zou ik oEmbed niet moeten doen, maar me alleen moeten richten op OpenGraph en Schema.org?
Ik heb namelijk geen idee wat het "marktaandeel" is van deze standaarden, onder de Nederlandse webshops.
2. Zijn er wellicht libraries/scripts die deze standaarden aflopen?
Uiteraard heb ik al wat losse (PHP) scriptjes gevonden die wat parsen. Vermoedelijk ga ik gewoon deze losse parser scriptjes draaien op de URL, en kijken welke succesvol met iets terugkomt. Maar wellicht heeft iemand een betere suggestie.
De link kan van meerdere webshops zijn, maar zal voor deze toepassing vrijwel zeker altijd Nederlandse webshop URLs zijn. Buitenlandse webshop URLs zullen zeldzaam zijn, dus daar wil ik me niet op richten.
Nu ligt het aan de webshop op wat voor manier deze metadata beschikbaar is gesteld. Als het al beschikbaar is gesteld. Maar het kan dus zijn dat de webshop in kwestie Open Graph gebruikt, Schema.org of oEmbed.
Mijn vragen:
1. Kan ik met deze drie standaarden het gros van de webshops afdekken? (los van de webshops die hier niks aan gedaan hebben)
Of zijn er nog meer standaarden? Of zou ik oEmbed niet moeten doen, maar me alleen moeten richten op OpenGraph en Schema.org?
Ik heb namelijk geen idee wat het "marktaandeel" is van deze standaarden, onder de Nederlandse webshops.
2. Zijn er wellicht libraries/scripts die deze standaarden aflopen?
Uiteraard heb ik al wat losse (PHP) scriptjes gevonden die wat parsen. Vermoedelijk ga ik gewoon deze losse parser scriptjes draaien op de URL, en kijken welke succesvol met iets terugkomt. Maar wellicht heeft iemand een betere suggestie.
Ampera-e (60kWh) -> (66kWh)