[alg] kan je bron code automisch verwerken in je database?

Pagina: 1
Acties:
  • 527 views

Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Hallo!

Ik lees zo nu en dan dat er de mogelijkheid bestaat om broncode te verwerken in je eigen database. Hoe is dit mogelijk? Bijvoorbeeld:

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
<td class=i0>&nbsp;</td>
<td class=i0><a href="http://www.powder.com/uk/604/613.html?competitorid=30368&sector=AL&type=st-WC">GAUY Bjorn</a>&nbsp;</td>
<td class=i0>USA&nbsp;</td>
<td class=h width='1' style='padding:0 0 0 0'></td>
<td class=i0 align='right'>1</td>

<td class=i0 align='right'>1671</td>
<td class=h width='1' style='padding:0 0 0 0'></td>
<td class=i0 align='right'>1</td>
<td class=i0 align='right'>725</td>
<td class=h width='1' style='padding:0 0 0 0'></td>
<td class=i0 align='right'>14</td>
<td class=i0 align='right'>125</td>
<td class=h width='1' style='padding:0 0 0 0'></td>
<td class=i0 align='right'>28</td>
<td class=i0 align='right'>41</td>

<td class=h width='1' style='padding:0 0 0 0'></td>
<td class=i0 align='right'>1</td>
<td class=i0 align='right'>620</td>
<td class=h width='1' style='padding:0 0 0 0'></td>
<td class=i0 align='right'>1</td>
<td class=i0 align='right'>160</td>

</tr>


Vervolgens wil je de stukken tekst automatisch in je database laden. Ik heb gelezen dat dit met Phyton of AJAX kan worden gedaan alleen hoe is dan voor mij een grote vraag. Het zou mij wel aanzienlijk helpen als die mogelijkheid bestaat

Kan iemand mij vertellen met welke script taal dit het beste gedaan kan worden, of het uberhaupt gedaan kan worden etc?

Groet,

Bjorn

Acties:
  • 0 Henk 'm!

  • Cartman!
  • Registratie: April 2000
  • Niet online
Ik begrijp echt helemaal niks van wat je nu wilt. Wil je nu html opslaan in je database of juist eruit ophalen? Zet even precies op een rijtje wat je nu wilt doen (wat voor data, waarin ga je t opslaan etc). Nu komt het meer over als een scriptrequest zonder uberhaupt nagedacht te hebben over waar je mee bezig bent namelijk.

Acties:
  • 0 Henk 'm!

  • Janoz
  • Registratie: Oktober 2000
  • Laatst online: 19-09 08:51

Janoz

Moderator Devschuur®

!litemod

Knippen en plakken in excel?

Je zult gewoon iets moeten schrijven dat deze data inleest, parst en vervolgens in de database zet. Dat kan in zo ongeveer elke taal die de mogelijkheid biedt tot het inlezen van dat stukje (ik neem aan dat je dat van 1 of andere website haalt), het verwerken van textdata en/of xml (reguliere expressies of XML achtige tooling) en een database verbinding op kan zetten (om de gegevens weg te schrijven).

Kijkende naar die drie dingen voldoet zo ongeveer elke script taal (behalve Javascript en AJAX) hieraan.

@Cartman : Ik neem aan dat de topicstarter data wil gaan scrapen vanaf een andere site en die gegevens in zijn eigen database wil hebben.

[ Voor 11% gewijzigd door Janoz op 29-03-2010 16:53 ]

Ken Thompson's famous line from V6 UNIX is equaly applicable to this post:
'You are not expected to understand this'


Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Janoz heeft het bij het rechte eind. Ik wil uitslagen van wedstrijden bijhouden op mijn site maar dit bijhouden blijkt een enorme klus. Het zou handig zijn als dit automatisch kan. Als dat heel makkelijk blijkt te zijn moet ik toch ff doorspitten HOE.

Thanks in ieder geval

Acties:
  • 0 Henk 'm!

  • Niemand_Anders
  • Registratie: Juli 2006
  • Laatst online: 09-07-2024

Niemand_Anders

Dat was ik niet..

Je kunt gebruik maken van regular expressions om selectief stukjes tekst uit een groter stuk tekst te halen.

Vergeet niet dat de meeste informatie copyrighted is en dat je deze niet zomaar mag overnemen en (opnieuw) openbaar maken. Als je sport uitslagen op je website wilt tonen is het verstandig dat je eens contact opneemt met Infrostada. Infostrada kan jouw een feed aanleveren in meerdere formaten (csv, xml).

If it isn't broken, fix it until it is..


Acties:
  • 0 Henk 'm!

  • boe2
  • Registratie: November 2002
  • Niet online

boe2

'-')/

Je kunt gebruik maken van regular expressions om selectief stukjes tekst uit een groter stuk tekst te halen.
Gezien de data al in html tabellen staat lijkt het me veel eenvoudiger (en sneller!) om gewoon een xml-parser ertegenaan te werpen :)

'Multiple exclamation marks,' he went on, shaking his head, 'are a sure sign of a diseased mind.' - Pratchett.


Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Ben ik weer!

Ik heb denk ik iets gevonden dat kan helpen bij het uitlezen van XML bestanden. Zie link: http://www.sitemasters.be...00/PHP/Simpele_xml_parser

Als je stukken code hierin aanpast kan ervoor gezorgd worden dat dit in je database kan worden gezet.

Kan iemand mij dan nog een hint geven hoe ik de tekst kan inlezen. Dat blijft voor mij nog altijd een mysterie. Ik moet een broncode (dus een bepaalde URL) inlezen, tekst laten beoordelen, juiste tekst inlezen en dat ook nog is in een XML bestand verwerken. Klinkt ver gezocht?!

Acties:
  • 0 Henk 'm!

  • Sebazzz
  • Registratie: September 2006
  • Laatst online: 16-09 15:42

Sebazzz

3dp

Boeboe schreef op maandag 29 maart 2010 @ 17:23:
[...]

Gezien de data al in html tabellen staat lijkt het me veel eenvoudiger (en sneller!) om gewoon een xml-parser ertegenaan te werpen :)
Wel als voorwaarde dat het stuk wat je binnenkrijgt volledig well-formed is. Anders kan je beter een HTML parser gebruiken.

[Te koop: 3D printers] [Website] Agile tools: [Return: retrospectives] [Pokertime: planning poker]


Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Verwijderd schreef op maandag 29 maart 2010 @ 18:22:
Kan iemand mij dan nog een hint geven hoe ik de tekst kan inlezen.
Dat is de tweede keer in dit topic dat je vraagt "kan iemand me effe uitleggen hoe..."; en daar doen we in de Devschuur niet aan. We hebben het hier over zélf programmeren/maken. Mocht je tegen concrete problemen aanlopen, open dan gerust een topic, maar ga van ons niet verwachten je even een stoomcursus X of Y te geven. Daar is documentatie voor uitgevonden en daarbij stikt het van de tutorials op 't web.

Kort: we doen hier niet aan scriptrequests.

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij

Pagina: 1

Dit topic is gesloten.