Toon posts:

Grappige Tweakers.net Statistieken d.m.v. SQL

Pagina: 1
Acties:

Verwijderd

Topicstarter

UPDATE: verderop in het topic heb ik nog meer stats gepost

Na 3 jaar lurken wordt het tijd voor een eerste post, bij deze dan:

Ik heb een aantal (naar mijn mening) leuke, grappige of opmerkelijke statistieken gemaakt over tweakers.net met behulp van me zelf samengestelde (complete) database van alle tweakers.net nieuws posts. Hier zijn ze:

Er zijn de laatste jaren veel nieuws posters geweest, de één wat succesvoller dan de ander. In totaal zijn er ongeveer 81 nieuws posters geweest:
code:
1
2
3
4
5
6
SQL>SELECT COUNT(*) AS [nieuws posters] FROM poster;
+----------------+
| nieuws posters |
+----------------|
|             81 |
+----------------+

Naast de ééndagsvliegen zijn er natuurlijk de nieuws posters die ons al lange tijd trouw van nieuws voorzien, hier is de top 10:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
SQL>SELECT TOP 10 name, COUNT(*) AS posts FROM poster, article
 WHERE poster.id = article.poster_id GROUP BY name ORDER BY posts DESC;
+-----------------------------------+
|           name            | posts |
+---------------------------+-------|
| Femme Taken               |  8372 |
| Tweakers.net Nieuwsposter |  4349 |
| Hielko van der Hoorn      |  1911 |
| Wouter Tinus              |  1762 |
| Mark Timmer               |  1046 |
| Robin van Rootseler       |   903 |
| Jack Leenders             |   560 |
| Arjan van Leeuwen         |   515 |
| Jeroen P Hira             |   464 |
| Bram Kouwenberg           |   431 |
+-----------------------------------+

Wat is tweakers.net zonder de Opper-Tweaker? En wat is de Opper-Tweaker zonder zijn originele taalgebruik, zo getuige bijvoorbeeld het woord 'kijkdoos' (beeldscherm):
code:
1
2
3
4
5
6
7
8
SQL>SELECT COUNT(*) AS total FROM article
 WHERE poster_id = (SELECT id FROM poster WHERE name = 'Femme Taken')
 AND content LIKE '%kijkdoos%';
+-------+
| total |
+-------|
|     5 |
+-------+

Hoewel de meeste professionele websites het niet in hun hoofd halen om woorden zoals 'stijve plasser' te gebruiken, is dat op tweakers.net gelukkig wel anders:
code:
1
2
3
4
5
6
7
SQL>SELECT COUNT(*) AS plassers FROM article
 WHERE content LIKE '%stijve%plasser%';
+----------+
| plassers |
+----------|
|        4 |
+----------+

Wie herinnert zich het Wazige Plaatjes Paradijs nog?
code:
1
2
3
4
5
6
7
SQL>SELECT COUNT(*) AS [Akiba's PC Watch] FROM article
 WHERE content LIKE '%plaatjes paradijs%';
+------------------+
| Akiba's PC Watch |
+------------------|
|               18 |
+------------------+

Een top 20 lijstje van de nieuws bronnen:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
SQL>SELECT TOP 20 source_name, COUNT(*) AS total FROM article
 WHERE source_name != ' ' GROUP BY source_name ORDER BY COUNT(*) DESC;
+------------------------------+
|     source_name      | total |
+----------------------+-------|
| The Register         |  1021 |
| Webwereld            |   643 |
| ZDNET                |   618 |
| X-bit Labs           |   593 |
| AnandTech            |   574 |
| The Inquirer         |   574 |
| C|Net                |   564 |
| Tom's Hardware Guide |   396 |
| Digitimes            |   384 |
| Reuters              |   346 |
| GoT                  |   333 |
| Ace's Hardware       |   329 |
| Sharky Extreme       |   328 |
| News.com             |   304 |
| Nu.nl                |   252 |
| Thresh's Firingsquad |   220 |
| IDG Webwereld        |   216 |
| GamePC               |   203 |
| GA-Source            |   197 |
| Voodoo Extreme       |   191 |
+------------------------------+

Wat is het meest besproken OS?
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
SQL>SELECT COUNT(*) AS Windows FROM article WHERE content LIKE '%windows%';
SELECT COUNT(*) AS Linux FROM article WHERE content LIKE '%linux%';
SELECT COUNT(*) AS [*BSD] FROM article WHERE content LIKE '%bsd%';
SELECT COUNT(*) AS MacOS FROM article WHERE content LIKE '%macos%';
+---------+
| Windows |
+---------|
|    3591 |
+---------+
+-------+
| Linux |
+-------|
|  1937 |
+-------+
+------+
| *BSD |
+------|
|  646 |
+------+
+-------+
| MacOS |
+-------|
|   225 |
+-------+

Welke nieuws posts waren het vaakst te vinden onder 'gerelateerde nieuwspostings'?
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
SQL>SELECT title FROM article WHERE id IN (SELECT TOP 10 related_id
 FROM related GROUP BY related_id ORDER BY COUNT(*) DESC);
+-----------------------------------------------------------+
|                           title                           |
+-----------------------------------------------------------|
| Dean Kent Industry Update                                 |
| Analyse van huidige en toekomstige 64-bit platformen      |
| Intel server en workstation roadmap tot en met 2003       |
| Paul DeMone over 64-bit processors in 2003 en daarna      |
| Intel's Paul Otellini keynote speech @ IDF Fall 2002      |
| AnandTech AMD 760MP en Athlon MP review                   |
| AMD en Intel's plannen voor de komende jaren              |
| Athlon 64 uitgesteld, Barton- en Opteron-launch bevestigd |
| ATi Radeon 9700: Nieuwe koning in 'Land der Pixels'       |
| Intels IDF agenda: SerialATA II tot nanotechnologie       |
+-----------------------------------------------------------+

Wie heeft de meeste interesse in de verboden vruchten van het internet? Wie maakte de meeste nieuws posts met 'porno' in te titel? Foei!
code:
1
2
3
4
5
6
7
8
SQL>SELECT name FROM poster WHERE id = (SELECT TOP 1 poster_id
 FROM article WHERE title LIKE '%porno%' GROUP BY poster_id
 ORDER BY COUNT(*) DESC);
+-------------+
|    name     |
+-------------|
| Mark Timmer |
+-------------+

Maar ook de Opper-Tweaker heeft menselijke zwaktes:
code:
1
2
3
4
5
6
7
8
SQL>SELECT name FROM poster WHERE id = (SELECT TOP 1 poster_id
 FROM article WHERE title LIKE '%sex%' GROUP BY poster_id
 ORDER BY COUNT(*) DESC);
+-------------+
|    name     |
+-------------|
| Femme Taken |
+-------------+

Wie is populairder, Bill Gates of Linus Torvalds? Hoewel ik me afvraag of het hier om populariteit gaat...
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
SQL>SELECT COUNT(*) AS gates FROM article
 WHERE content LIKE '%gates%';SELECT COUNT(*) AS torvalds
 FROM article WHERE content LIKE '%torvalds%';
+-------+
| gates |
+-------|
|   258 |
+-------+
+----------+
| torvalds |
+----------|
|       83 |
+----------+

Menig tweaker heeft zich verbaast over de meest gekke tijden waarop Femme zijn nieuws posts plaatst. Hij heeft dan ook verreweg de meeste posts tussen 3 en 6 uur snachts:
code:
1
2
3
4
5
6
7
8
9
10
11
12
SQL>SELECT TOP 5 name, COUNT(*) AS total FROM poster, article 
 WHERE poster_id = poster.id AND DATEPART(hour, post_date)
 BETWEEN 3 and 5 GROUP BY name ORDER BY COUNT(*) DESC;
+-----------------------------------+
|           name            | total |
+---------------------------+-------|
| Femme Taken               |  1236 |
| Jack Leenders             |    92 |
| Tweakers.net Nieuwsposter |    71 |
| Bram Kouwenberg           |    17 |
| Wouter Tinus              |    17 |
+-----------------------------------+


Hopelijk waren dit wat interessante weetjes. Heb je een leuk(er) idee? Meldt het dan (al dan niet in SQL), dan probeer ik het toe te voegen.

[ Voor 10% gewijzigd door Verwijderd op 23-08-2003 16:15 ]


  • Tux
  • Registratie: Augustus 2001
  • Laatst online: 04-03 21:41

Tux

Hoeveel tijd heb jij wel niet gestoken in het maken van die database :P

Verder leuke statistieken :)

The NS has launched a new space transportation service, using German trains which were upgraded into spaceships.


  • Novah
  • Registratie: April 2002
  • Laatst online: 20-02 17:03
Tis van de frontpage, lache stats, alleen jammer dat je geen leuke stats heb van GoT :)

Verwijderd

Topicstarter
Tux schreef op 23 August 2003 @ 03:29:
Hoeveel tijd heb jij wel niet gestoken in het maken van die database :P

Verder leuke statistieken :)
Ik heb die database gelukkig niet handmatig aangelegt 8)7
:P

  • Tux
  • Registratie: Augustus 2001
  • Laatst online: 04-03 21:41

Tux

Verwijderd schreef op 23 August 2003 @ 03:36:
[...]

Ik heb die database gelukkig niet handmatig aangelegt 8)7
:P
Dat lijkt me logisch op deze schaal :P Maar doe je dit al sinds het begin zeg maar of ben je een tijdje terug begonnen met een script wat alle nieuwsposts doorging?

The NS has launched a new space transportation service, using German trains which were upgraded into spaceships.


Verwijderd

Topicstarter
Novah schreef op 23 August 2003 @ 03:36:
Tis van de frontpage, lache stats, alleen jammer dat je geen leuke stats heb van GoT :)
Dat komt misschien nog wel :) Maar GoT is natuurlijk wel veeeel groter, dus dat zal wel wat meer werk/tijd vergen.

Verwijderd

Topicstarter
Tux schreef op 23 August 2003 @ 03:38:
[...]

Dat lijkt me logisch op deze schaal :P Maar doe je dit al sinds het begin zeg maar of ben je een tijdje terug begonnen met een script wat alle nieuwsposts doorging?
Ik heb gister alles gedownload. Is in een half uurtje gebeurt. Idd met een (zelf gemaakt) progje.

  • JvS
  • Registratie: Februari 2000
  • Laatst online: 12:30

JvS

Ik heb hem zelf ook

haha, kan je dat allemaal zomaar downloaden dan?
Ow het lijkt me meer een frontpage feedback achtig dingetje (we zwemmen in de fora he? ;))

topic verplaatst van LA >> TFF dus maar

4x APsystems DS3; 4x495Wp OZO/WNW 10° ; 4x460Wp OZO/WNW 10°; Totaal 3820Wp


  • ACM
  • Registratie: Januari 2000
  • Niet online

ACM

Software Architect

Werkt hier

So__What... Ik heb dus gisteren een "abuse"-melding bij je provider gedropped omdat je een paar keer al onze nieuwsitems hebt geleeched...

[strekking van dat mailtje]
Aangezien dat vaker is gebeurd, door mensen met nul-verstand van een proxy bijvoorbeeld en er geen account hier op GoT en op de T.net-frontpage bij jouw ip te koppelen was, heb ik dus je provider een mailtje gestuurd met de mededeling dat ze "die gene" moesten melden dat zijn/haar proxy verkeerd stond ingesteld/oid en dat wij graag wensen dat het stopt -> zoniet, dan stoppen we het ip in de firewall.
[/strekking van dat mailtje]

't Is zeer sterk aan te bevelen even contact op te nemen met een van de medewerkers van tweakers.net voor je zoiets doet, want hoewel we het uiteraard best leuk vinden dat je zoiets maakt, is het niet de bedoeling dat alle gebruikers alle nieuwsitems meerdere keren per dag gaan lopen leechen...

Als je wilt kan ik je wel een kopietje sturen van dat "abuse"-mailtje, maar mocht je weer zoiets willen doen, stuur dan (liefst Kees of mij) een mailtje naar ons dat je wat gaat klooien :)

Verwijderd

Topicstarter
Ik begrijp dat jullie het liever niet hebben dat 'iedereen' de hele t.net nieuws database gaat downloaden. Ik kan me echter niet voorstellen dat ik voor problemen heb gezorgt. Ik heb de snelheid expres laag gehouden, het ging lang niet snel genoeg om de servers extra te belasten ofzo. Ook heb ik geen verdere intenties met de database dan het genereren van wat statistiekjes zoals ik hier heb laten zien. Ik zal voortaan contact opnemen met t.net voordat ik weer zoiets doe. Mijn excuses als ik onverhoopt toch voor problemen heb gezorgt.

[ Voor 2% gewijzigd door Verwijderd op 23-08-2003 13:54 . Reden: spelfout ]


  • ACM
  • Registratie: Januari 2000
  • Niet online

ACM

Software Architect

Werkt hier

Omdat we het ip niet konden terugleiden tot een gebruiker en het natuurlijk ook niet zichtbaar was of het een-/enkelmalig was hebben we besloten even een vriendelijke "abuse"-mail te versturen.
Bij voorgaande gevallen bleek er geregeld een foutief geconfigureerde proxy de dader te zijn en was dat alleen maar in het voordeel van de gebruiker dat hij een mailtje van zijn provider kreeg en in een enkel geval kregen we via de provider zelfs een berichtje terug met een bedankje namens hun klant :)

Het is inderdaad niet zo dat wij hier echt last van hadden, ik geloof dat je ook nog eens een erg rustig tijdstip had uitgekozen, en in die zin heb je zeker niet voor problemen gezorgd.
Maar anderzijds is het gewoon niet de bedoeling dat er dagelijks alle nieuwsitems opgehaald worden en daar zit niet altijd een bewuste of goede gedachte achter. (nu wel hoor :) )

Verder is het gewoon prettig om te weten dat een gebruiker 60k requests gaat lopen uitvoeren, dan 'schrik' je als beheerder wat minder en ga je niet zo snel actie uitvoeren als wanneer je van niks weet ;)

  • Sv3n
  • Registratie: Mei 2002
  • Laatst online: 05-03 21:37
misschien kan er gewoon een pagina worden gemaakt op tweakers.net waar deze stats staan :) So_what heeft vast geen problemen om het script te schrijven :) Deze hoeft dan alleen nog geplaatst te worden en iedereen kan up to date deze stats bekijken :7

Last.fm
Films!


Verwijderd

Topicstarter
sv3n schreef op 23 August 2003 @ 15:00:
misschien kan er gewoon een pagina worden gemaakt op tweakers.net waar deze stats staan :) So_what heeft vast geen problemen om het script te schrijven :) Deze hoeft dan alleen nog geplaatst te worden en iedereen kan up to date deze stats bekijken :7
Dat is misschien wel een goed idee idd. Sommige statistieken die ik hier nu post zijn wel erg flauw (ik zal zo nog ff een paar posten :p), maar sommige andere zijn wel leuke wetenswaardigheden. Zeker als je ook alle andere databases (reacties, meuktracker, .plan's, pricewatch, GoT, etc.) kan gebruiken is er misschien wel een geinige stats pagina van te maken :9

Verwijderd

Topicstarter
Hier zijn nog wat meer statistieken. Me inspiratie is nu wel op :p Hopelijk weten anderen nog wat statistieken te verzinnen.

Wie heeft nieuws poster als beroep? M.a.w, wie hebben de meeste posts tijdens kantoor uren? (Of wie hebben een relaxte baas/studie?)
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
SQL>SELECT TOP 10 name, COUNT(*) AS total FROM poster, article
 WHERE poster.id = article.poster_id
 AND DATEPART(weekday, post_date) BETWEEN 2 AND 6
 AND DATEPART(hour, post_date) BETWEEN 9 AND 17
 GROUP BY name ORDER BY COUNT(*) DESC;
+-----------------------------------+
|           name            | total |
+---------------------------+-------|
| Femme Taken               |  2433 |
| Tweakers.net Nieuwsposter |  2190 |
| Hielko van der Hoorn      |   864 |
| Wouter Tinus              |   665 |
| Mark Timmer               |   578 |
| Robin van Rootseler       |   494 |
| Martin Sturm              |   355 |
| Jeroen P Hira             |   326 |
| Jack Leenders             |   242 |
| Jan Laros                 |   226 |
+-----------------------------------+

Wie heeft de grootste? En wie de kleinste? (gemiddelde nieuws-post-titel-lengte ;))
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
SQL>SELECT TOP 5 name, AVG(LEN(title)) AS length
 FROM poster, article WHERE poster.id = article.poster_id
 GROUP BY name ORDER BY AVG(LEN(title)) DESC;
+-----------------------------+
|        name        | length |
+--------------------+--------|
| Bas Raayman        |     53 |
| Andries Mooij      |     48 |
| Tamara van Hal     |     46 |
| Harm Hilvers       |     45 |
| Harold van der Wal |     45 |
+-----------------------------+
SQL>SELECT TOP 5 name, AVG(LEN(title)) AS length
 FROM poster, article WHERE poster.id = article.poster_id
 GROUP BY name ORDER BY AVG(LEN(title));
+----------------------------+
|       name        | length |
+-------------------+--------|
| Jorma             |     25 |
| Tom Antonis       |     25 |
| Gert Jan de Smit  |     26 |
|                   |     29 |
| Reinder Gerritsen |     29 |
+----------------------------+

Wie zijn de trouwe kerkgangers? (Wie post er een stuk minder op zondag?)
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
SQL>SELECT TOP 10 name FROM poster, article 
WHERE poster.id = article.poster_id AND poster_id NOT IN (
    SELECT TOP 10 poster_id FROM article
    WHERE DATEPART(weekday, post_date) = 1 
    GROUP BY poster_id ORDER BY COUNT(*) DESC
) GROUP BY name ORDER BY COUNT(*) DESC;
+-------------------+
|       name        |
+-------------------|
| Arjan van Leeuwen |
| Jeroen P Hira     |
| Bram Kouwenberg   |
| Martin Sturm      |
| Ralph Smeets      |
| Jan Laros         |
| Onno Molenkamp    |
| Dries Arnolds     |
| Harm Hilvers      |
| Arthur Scheffer   |
+-------------------+

Iedereen weet: maandag is wasdag, woensdag is gehaktdag. Maar hoe zit het met windowsdag en linuxdag? (Op welke dag zat windows/linux het vaakst in de titel van de nieuwspost?)
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
SQL>SET LANGUAGE Nederlands
DECLARE @daynum int
SELECT TOP 1 @daynum = DATEPART(weekday, post_date) FROM article 
WHERE title LIKE '%windows%' GROUP BY DATEPART(weekday, post_date) ORDER BY COUNT(*) DESC
SELECT DATENAME(weekday, @daynum) AS windowsdag
SELECT TOP 1 @daynum = DATEPART(weekday, post_date) FROM article 
WHERE title LIKE '%linux%' GROUP BY DATEPART(weekday, post_date) ORDER BY COUNT(*) DESC
SELECT DATENAME(weekday, @daynum) AS linuxdag;
+------------+
| windowsdag |
+------------|
| donderdag  |
+------------+
+----------+
| linuxdag |
+----------|
| vrijdag  |
+----------+

Welke nieuws poster heeft een wiskundeknobbel? Wie hebben de meeste nieuws posts geplaats waarvan het id nummer zowel een priemgetal als een palindroom is?
code:
1
2
3
4
5
6
7
8
9
10
11
12
SQL>SELECT TOP 5 name, COUNT(*) FROM poster, article WHERE poster.id = article.poster_id
 AND dbo.IsPalindrome(article.id) = 'Yes' AND dbo.IsPrime(article.id) = 'Yes'
 GROUP BY name ORDER BY COUNT(*) DESC;
+--------------------------------+
|           name            |    |
+---------------------------+----|
| Femme Taken               | 20 |
| Tweakers.net Nieuwsposter |  6 |
| Wouter Tinus              |  4 |
| Hielko van der Hoorn      |  3 |
| Mark Timmer               |  3 |
+--------------------------------+

Sommige mensen blijven op vrijdag de 13e lekker in hun bed, je weet maar nooit... Wie van de nieuws posters heeft echter geen last van bijgeloof? (Wie heeft de meeste posts op vrijdag de 13e?)
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
SQL>SET LANGUAGE Nederlands; SELECT TOP 5 name, COUNT(*) AS posts FROM poster, article
 WHERE poster.id = article.poster_id AND DATEPART(day, post_date) = 13
 AND DATENAME(weekday, DATEPART(weekday, post_date)) = 'Vrijdag'
 GROUP BY name ORDER BY COUNT(*) DESC;
+-----------------------------------+
|           name            | posts |
+---------------------------+-------|
| Femme Taken               |    57 |
| Hielko van der Hoorn      |    27 |
| Tweakers.net Nieuwsposter |    12 |
| Arjan van Leeuwen         |     9 |
| Wouter Tinus              |     9 |
+-----------------------------------+

  • bazs2000
  • Registratie: November 2000
  • Laatst online: 26-09-2025

bazs2000

Pixels zo groot als een atoom

Geweldig dit, stats zijn altijd leuk en zeker dit soort statistieken. :)

Wat ik mij nu afvraag, heb je nu ook alle reacties of heb je alleen maar de postings?

Krankzinnige muziek vind je hier.


  • dingstje
  • Registratie: Augustus 2002
  • Laatst online: 02-01-2024
Mss is het intressanter om het uit te drukken in procenten... Femme heeft zowiezo de meeste nieuwsberichten gepost dus tien tegen één dat hij in de meeste stats er als eerste zal uitkomen. Bij dat dingetje over vrijdag de dertiende bijvoorbeeld. Dan zou je per poster het procent van posts op vrijdag de dertiende tegenover zijn/haar totaal aantal posts moeten berekenen. Die statistiekjes zijn 'representatiever' (kom ik met die moeilijke woord in GoT stats?) dan het aantal posts.

If you can't beat them, try harder


Verwijderd

Topicstarter
bazs2000 schreef op 23 August 2003 @ 16:18:
Geweldig dit, stats zijn altijd leuk en zeker dit soort statistieken. :)
Dank U :)
Wat ik mij nu afvraag, heb je nu ook alle reacties of heb je alleen maar de postings?
Alleen de postings. Maar misschien kan ik binnenkort ook wat leuke statistieken maken over de reacties (mits t.net dat goed vind, en ik dat in goed overleg met hun kan regelen).

Verwijderd

Topicstarter
dingstje schreef op 23 August 2003 @ 16:29:
Mss is het intressanter om het uit te drukken in procenten... Femme heeft zowiezo de meeste nieuwsberichten gepost dus tien tegen één dat hij in de meeste stats er als eerste zal uitkomen. Bij dat dingetje over vrijdag de dertiende bijvoorbeeld. Dan zou je per poster het procent van posts op vrijdag de dertiende tegenover zijn/haar totaal aantal posts moeten berekenen. Die statistiekjes zijn 'representatiever' (kom ik met die moeilijke woord in GoT stats?) dan het aantal posts.
Ja, idd, daar zat ik ook aan te denken. Hoewel de stats niet echt wiskundig verantwoord hoeven te zijn :Y) , is dit idd niet erg representatief. Ik zal ff proberen een SQL script in elkaar te draaien die met procenten werkt.

  • bazs2000
  • Registratie: November 2000
  • Laatst online: 26-09-2025

bazs2000

Pixels zo groot als een atoom

Om de reacties te gebruiken voor de statistieken lijkt mij niet handig. Ten eerste zal het veel tijd kosten om alles binnen te halen en ten tweede zal niet iedereen even blij zijn met het feit dat hun reacties worden gebruikt voor andere doeleinden dan waarvoor ze in de eerste instantie bedoeld waren (<-kromme zin). :)

Krankzinnige muziek vind je hier.


  • Cookie
  • Registratie: Mei 2000
  • Laatst online: 04-07-2025
Wie heeft de grootste? En wie de kleinste? (gemiddelde nieuws-post-titel-lengte ;))
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
SQL>SELECT TOP 5 name, AVG(LEN(title)) AS length
 FROM poster, article WHERE poster.id = article.poster_id
 GROUP BY name ORDER BY AVG(LEN(title)) DESC;
+-----------------------------+
|        name        | length |
+--------------------+--------|
| Bas Raayman        |     53 |
| Andries Mooij      |     48 |
| Tamara van Hal     |     46 |
| Harm Hilvers       |     45 |
| Harold van der Wal |     45 |
+-----------------------------+
SQL>SELECT TOP 5 name, AVG(LEN(title)) AS length
 FROM poster, article WHERE poster.id = article.poster_id
 GROUP BY name ORDER BY AVG(LEN(title));
+----------------------------+
|       name        | length |
+-------------------+--------|
| Jorma             |     25 |
| Tom Antonis       |     25 |
| Gert Jan de Smit  |     26 |
|                   |     29 |
| Reinder Gerritsen |     29 |
+----------------------------+
LOL, degenen met de kortste headlines zijn daar in de loop der tijden steeds beter in geworden zo lijkt het wel; ze maken tegenwoordig op de FP de kortste headlines die je je maar voor kunt stellen :+.

Never trust a computer you can't throw out a window [Steve Wozniak]


Verwijderd

Topicstarter
bazs2000 schreef op 23 August 2003 @ 16:37:
Om de reacties te gebruiken voor de statistieken lijkt mij niet handig. Ten eerste zal het veel tijd kosten om alles binnen te halen en ten tweede zal niet iedereen even blij zijn met het feit dat hun reacties worden gebruikt voor andere doeleinden dan waarvoor ze in de eerste instantie bedoeld waren (<-kromme zin). :)
Opzich is het downloaden geen probleem, dat moet makkelijk in 1 nacht te doen zijn, schat ik.
Als ik het bij grappige statistieken (bijv. zoals ik hier doe, en bijv. niet 'wie is een troll?') hou dan denk ik niet dat men dat erg zou vinden. Maar ik zou het ook bij algemene statistieken kunnen houden, zonder namen te noemen (bijv. 'welk onderwerp heeft meer reacties, linux of windows?').

Verwijderd

Topicstarter
testcase schreef op 23 augustus 2003 @ 16:40:
[...]
LOL, degenen met de kortste headlines zijn daar in de loop der tijden steeds beter in geworden zo lijkt het wel; ze maken tegenwoordig op de FP de kortste headlines die je je maar voor kunt stellen :+.
:D hehe idd >:)
Maar toch was er bij de veel-posters wel een redelijk opmerkelijk verschil te ontdekken, Femme had bijv. een kortere gemiddelde lengte dan bijv. Wouter Tinus.

Verwijderd

Topicstarter
Zoals belooft hier een aangepaste versie van het bijgeloof-statistiek.
Dit is nu tevens een SQL tutorial geworden :P

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
SQL>SET LANGUAGE Nederlands;
CREATE TABLE bijgeloof (name VARCHAR(100), 
    friday13 INT, totposts INT, procent FLOAT(1));
DECLARE @name VARCHAR(100)
DECLARE @friday13 INT
DECLARE @totposts INT
DECLARE @posters INT
DECLARE @i INT
DECLARE @procent FLOAT(1)
SELECT @posters = COUNT(*) FROM poster
SET @i = 0
WHILE @i < @posters
BEGIN
    SELECT @name = name FROM poster WHERE id = @i
    SELECT @friday13 = COUNT(*) FROM article WHERE DATEPART(day, post_date) = 13 
    AND DATENAME(weekday, DATEPART(weekday, post_date)) = 'Vrijdag' AND poster_id = @i
    SELECT @totposts = COUNT(*) FROM article WHERE poster_id = @i
    SET @procent = CAST((CAST(100 AS FLOAT(1))/(CAST(@totposts 
        AS FLOAT(1))/CAST(@friday13 AS FLOAT(1)))) AS FLOAT(1))
    INSERT INTO bijgeloof VALUES (@name, @friday13, @totposts, @procent)
    SET @i = @i + 1
END;
SELECT TOP 5 name, procent FROM bijgeloof WHERE name IN (SELECT TOP 25 name FROM poster, article 
WHERE poster.id = article.poster_id GROUP BY name ORDER BY COUNT(*) DESC) ORDER BY procent DESC;
+----------------------------------+
|         name         |  procent  |
+----------------------+-----------|
| Dries Arnolds        | 2.1126761 |
| Arjan van Leeuwen    | 1.7475728 |
| Daniel Kegel         | 1.7167382 |
| Hielko van der Hoorn | 1.4128728 |
| Jeroen P Hira        | 1.0775862 |
+----------------------------------+

Dit geeft de top5 weer van nieuws posters in de top25 (qua totaal aantal posts) die procentueel gezien de meeste posts op vrijdag de 13e plaatste.
Tja, ik moet toch wat op zo'n zaterdag... :D

  • Hielko
  • Registratie: Januari 2000
  • Nu online
hmm dat ziet er niet meer uit als sql voor beginners :D

  • zomertje
  • Registratie: Januari 2000
  • Laatst online: 17-02 12:22

zomertje

Barisax knorretje

Grapsig dit :)

het ultieme jaargetijde.... | #!/usr/bin/girl | Art prints and fun

Pagina: 1