Dag allen,
Vooropgesteld: ik denk dat mijn vraag hier het beste past, maar mocht ik verkeerd zitten hoor ik het graag!
Ik zit met een omvangrijk project waarbinnen ik songteksten over een lange periode wil analyseren (14400 in totaal). Nu heb ik een Excel bestand met daarin een kolom met alle artiesten en een kolom met alle titels. Op zich schuw ik een repetitief klusje niet, maar 14400 songteksten zoeken, knippen en plakken gaat mij wat ver.
Ik zoek dus een code om deze uit een online archief te extraheren. Nu ben ik een redelijk noob op dit gebied, en heb al aardig wat gegoogeld, maar kom er niet uit.
Ik wil de site http://lyrics.wikia.com/wiki/Lyrics_Wiki gebruiken, die heeft betrouwbare teksten. Nu heb ik al een stukje gevonden over API (hier en hier), maar alle goede bedoelingen ten spijt snap ik er geen fluit van.
Wel ben ik er achter gekomen dat de site de songteksten als volgt indexeert: http://lyrics.wikia.com/wiki/The_Beatles:Hey_Jude. In mijn Excel file staan alle nummers en artiesten met spaties en hoofdletters (maar die vervangen tot lage streepjes lukt me nog wel gok ik zo). Tevens staat de songtekst op de site altijd in hetzelfde grijze kader op dezelfde plek.
Is er dus een manier dat ik een scriptje kan laten runnen dat de songteksten voor mij uit de wiki plukt en allemaal onder elkaar in een word bestand plempt oid? Hoe kom ik hierbij?
Hopelijk is het een enigszins duidelijk verhaal (is het niet enkel duidelijk dat ik er geen snars van begrijp).
Alvast enorm bedankt!!
Vooropgesteld: ik denk dat mijn vraag hier het beste past, maar mocht ik verkeerd zitten hoor ik het graag!
Ik zit met een omvangrijk project waarbinnen ik songteksten over een lange periode wil analyseren (14400 in totaal). Nu heb ik een Excel bestand met daarin een kolom met alle artiesten en een kolom met alle titels. Op zich schuw ik een repetitief klusje niet, maar 14400 songteksten zoeken, knippen en plakken gaat mij wat ver.
Ik zoek dus een code om deze uit een online archief te extraheren. Nu ben ik een redelijk noob op dit gebied, en heb al aardig wat gegoogeld, maar kom er niet uit.
Ik wil de site http://lyrics.wikia.com/wiki/Lyrics_Wiki gebruiken, die heeft betrouwbare teksten. Nu heb ik al een stukje gevonden over API (hier en hier), maar alle goede bedoelingen ten spijt snap ik er geen fluit van.
Wel ben ik er achter gekomen dat de site de songteksten als volgt indexeert: http://lyrics.wikia.com/wiki/The_Beatles:Hey_Jude. In mijn Excel file staan alle nummers en artiesten met spaties en hoofdletters (maar die vervangen tot lage streepjes lukt me nog wel gok ik zo). Tevens staat de songtekst op de site altijd in hetzelfde grijze kader op dezelfde plek.
Is er dus een manier dat ik een scriptje kan laten runnen dat de songteksten voor mij uit de wiki plukt en allemaal onder elkaar in een word bestand plempt oid? Hoe kom ik hierbij?
Hopelijk is het een enigszins duidelijk verhaal (is het niet enkel duidelijk dat ik er geen snars van begrijp).
Alvast enorm bedankt!!