[C#] Web Parsing met Regex.Matches Tabel

Pagina: 1
Acties:

Onderwerpen


  • PrePay
  • Registratie: Januari 2009
  • Laatst online: 07-09 00:34
Ik ben bezig met een applicatie die roosterwijzigingen van mijn school website afhaalt,

dit zijn 2 regels van de site:

HTML:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
        <tr class="oneven" style="height: 10px;"> 
        <td>1A&nbsp;</td> 
        <td>3&nbsp;</td> 
        <td>mw West&nbsp;</td> 
        <td>D02&nbsp;</td> 
        <td>en&nbsp;</td> 
        <td>1e naar 3e uur&nbsp;</td> 
    </tr>       
        <tr class="even" style="height: 10px;"> 
        <td>1A&nbsp;</td> 
        <td>4&nbsp;</td> 
        <td>hr Vrijdaghs&nbsp;</td> 
        <td>B66&nbsp;</td> 
        <td>dz&nbsp;</td> 
        <td>opvang dz&nbsp;</td> 
    </tr>


Ik heb ze geprobeerd met deze regex op te halen maar zonder resultaat:

C#:
1
2
3
4
5
6
7
8
            MatchCollection datacol = Regex.Matches(data, @"<tr[^>]*>\s*" +
@"[^>]*<td>\s*(?<klas>\d+)\s*</td>\s*" +
@"[^>]*<td>\s*(?<uur>\d+)\s*</td>\s*" +
@"[^>]*<td>\s*(?<docent>\d+)\s*</td>\s*" +
@"[^>]*<td>\s*(?<lokaal>\d+)\s*</td>\s*" +
@"[^>]*<td>\s*(?<vak>\d+)\s*</td>\s*" +
@"[^>]*<td>\s*(?<opmerking>\d+)\s*</td>\s*" +
@"[^>]*</tr>\s*");


Heeft iemand tips / opmerkingen?

  • pedorus
  • Registratie: Januari 2008
  • Niet online
Gebruik liever iets als Html Agility Pack. Html parse je bij voorkeur niet met regexp.

Volgens mij snap je niet wat die [^>]* (onzin?) en \d+ (je bedoelt [^<]*?) nu doen. :p

Vitamine D tekorten in Nederland | Dodelijk coronaforum gesloten


Acties:
  • 0 Henk 'm!

  • Hydra
  • Registratie: September 2000
  • Laatst online: 21-08 17:09
offtopic:
Kijk, dat is de reden dat ik Programming blijf volgen, top-tip dat!

https://niels.nu