[GeenIdee] Code om songteksten te indexen

Pagina: 1
Acties:
  • 430 views

Vraag


Acties:
  • 0 Henk 'm!

  • EnToen
  • Registratie: December 2014
  • Laatst online: 21-05 22:26
Dag allen,

Vooropgesteld: ik denk dat mijn vraag hier het beste past, maar mocht ik verkeerd zitten hoor ik het graag!

Ik zit met een omvangrijk project waarbinnen ik songteksten over een lange periode wil analyseren (14400 in totaal). Nu heb ik een Excel bestand met daarin een kolom met alle artiesten en een kolom met alle titels. Op zich schuw ik een repetitief klusje niet, maar 14400 songteksten zoeken, knippen en plakken gaat mij wat ver.

Ik zoek dus een code om deze uit een online archief te extraheren. Nu ben ik een redelijk noob op dit gebied, en heb al aardig wat gegoogeld, maar kom er niet uit.

Ik wil de site http://lyrics.wikia.com/wiki/Lyrics_Wiki gebruiken, die heeft betrouwbare teksten. Nu heb ik al een stukje gevonden over API (hier en hier), maar alle goede bedoelingen ten spijt snap ik er geen fluit van.

Wel ben ik er achter gekomen dat de site de songteksten als volgt indexeert: http://lyrics.wikia.com/wiki/The_Beatles:Hey_Jude. In mijn Excel file staan alle nummers en artiesten met spaties en hoofdletters (maar die vervangen tot lage streepjes lukt me nog wel gok ik zo). Tevens staat de songtekst op de site altijd in hetzelfde grijze kader op dezelfde plek.

Is er dus een manier dat ik een scriptje kan laten runnen dat de songteksten voor mij uit de wiki plukt en allemaal onder elkaar in een word bestand plempt oid? Hoe kom ik hierbij?

Hopelijk is het een enigszins duidelijk verhaal (is het niet enkel duidelijk dat ik er geen snars van begrijp).

Alvast enorm bedankt!!

Alle reacties


Acties:
  • 0 Henk 'm!

  • patrick.k
  • Registratie: September 2010
  • Niet online
Ja, zo een script is waarschijnlijk wel mogelijk. Zeker als er een API is. Ik denk echter niet dat er iemand hier zo een script voor jou gaat schrijven. We helpen je graag met een specifiek probleem, maar als je geen code laat zien van wat je tot nu toe al hebt geprobeerd wordt dat lastig.

Acties:
  • 0 Henk 'm!

  • Koenvh
  • Registratie: December 2011
  • Laatst online: 11-10 00:28

Koenvh

Hier tekenen: ______

Is het mogelijk? Waarschijnlijk wel, maar zonder enige ervaring is 't wel gelijk een grote uitdaging. Mocht je tijd hebben kun je zelf aan de slag gaan, maar anders kun je het beste iemand lief aankijken/huren om het voor je te doen.

🠕 This side up


Acties:
  • 0 Henk 'm!

  • EnToen
  • Registratie: December 2014
  • Laatst online: 21-05 22:26
Dank voor jullie reacties Patrick en Koen. Ik ben niet onwelwillend zelf met mijn voeten in de klei te gaan, maar heb inderdaad geen enkele ervaring en echt verzuipen in de tijd doe ik ook weer niet.

Wat betalen hiervoor vind ik niet erg. Als ik iemand inhuur, naar welke / wat voor coder moet ik dan zoeken? (een API scripter, is dat een entiteit? Of een ander script?)

Nogmaals dank!

Acties:
  • 0 Henk 'm!

  • Creepy
  • Registratie: Juni 2001
  • Laatst online: 11-10 14:13

Creepy

Tactical Espionage Splatterer

PRG draait om het zelf programmeren, niet om anderen het voor je te laten doen. Wil je iemand inhuren kijk dan eens in het topic Devschuurder werven? Gebruik Vraag & Aanbod!. Ik kan dan op dit moment ook niet anders dan je topic sluiten.

"I had a problem, I solved it with regular expressions. Now I have two problems". That's shows a lack of appreciation for regular expressions: "I know have _star_ problems" --Kevlin Henney


Dit topic is gesloten.