Mijn vraag
ik ben bezig met een project, en daarbij wil ik van websites data halen.
Relevante software en hardware die ik gebruik
linux x86_64 ubuntu(voor uitsluiten van problemen, ook op ubuntu werkt het niet), arch(main dev machine) en gentoo
ik heb geprobeert:
duckduckgo'en op dit probleem
hier valt helaas niks over te vinden, en ik wil niet 10 keer dezelfde code hebben, vooral omdat de gebruiker de optie krijgt om zelf websites toe te voegen via interactief, maar dat heb ik weggelaten, omdat er dan te veel probleempunten zijn.
ik ben bezig met een project, en daarbij wil ik van websites data halen.
Relevante software en hardware die ik gebruik
linux x86_64 ubuntu(voor uitsluiten van problemen, ook op ubuntu werkt het niet), arch(main dev machine) en gentoo
ik heb geprobeert:
duckduckgo'en op dit probleem
hier valt helaas niks over te vinden, en ik wil niet 10 keer dezelfde code hebben, vooral omdat de gebruiker de optie krijgt om zelf websites toe te voegen via interactief, maar dat heb ik weggelaten, omdat er dan te veel probleempunten zijn.
Ruby:
1
2
3
4
5
6
7
8
9
10
11
| poem1 = Nokogiri::HTML(open('https://www.loc.gov/poetry/180/001.html')) poem2 = Nokogiri::HTML(open('https://www.loc.gov/poetry/180/002.html')) poem3 = Nokogiri::HTML(open('https://www.loc.gov/poetry/180/003.html')) def pastePoem poem1.css('div#tab1').each do |el| el.to_s File.open('poems.json', 'w') do |f| f.puts el.text end end |