Beste Tweakers,
Ik wil een systeem maken dat er informatie van internet gehaald wordt. Als ik het goed begrijp heet dit webscraping. Deze informatie (die elke keer hetzelfde zal zijn, maar een ander subject) wil ik geautomatiseerd in een database opslaan die geautomatiseerd structureert. Vervolgens wil ik dat hier analyses op toegepast worden. De uitkomst van een analyse moet vergeleken worden met de uitkomst van een ander gegevens (van het internet). Als deze lager is dan dat gegeven, dan moet de naam van dit subject op een aparte lijst komen te staan.
Oftewel, ik moet:
1) Data van internet in een database krijgen
2) Geautomatiseerd analyseren
3) Rangschikken
Aangezien ik geloof dat hier aardig wat slimme koppen zitten, wil ik graag weten op welke manier jullie dit zullen doen. Is hiervoor bepaalde programmeerkennis nodig, of is er al bestaande software op de markt die dit kan?
Ik hoor het graag van jullie!
Edit: de pagina's (1000en) waarvan ik de informatie wil inladen zijn bekend en kennen een vaste structuur.
Ik wil een systeem maken dat er informatie van internet gehaald wordt. Als ik het goed begrijp heet dit webscraping. Deze informatie (die elke keer hetzelfde zal zijn, maar een ander subject) wil ik geautomatiseerd in een database opslaan die geautomatiseerd structureert. Vervolgens wil ik dat hier analyses op toegepast worden. De uitkomst van een analyse moet vergeleken worden met de uitkomst van een ander gegevens (van het internet). Als deze lager is dan dat gegeven, dan moet de naam van dit subject op een aparte lijst komen te staan.
Oftewel, ik moet:
1) Data van internet in een database krijgen
2) Geautomatiseerd analyseren
3) Rangschikken
Aangezien ik geloof dat hier aardig wat slimme koppen zitten, wil ik graag weten op welke manier jullie dit zullen doen. Is hiervoor bepaalde programmeerkennis nodig, of is er al bestaande software op de markt die dit kan?
Ik hoor het graag van jullie!
Edit: de pagina's (1000en) waarvan ik de informatie wil inladen zijn bekend en kennen een vaste structuur.
[ Voor 5% gewijzigd door Verwijderd op 10-02-2018 10:21 ]