Ik heb een setje SQLite databases waar ik een heleboel records uit wil verwijderen. De hoeveelheid is te groot om met de hand te verwijderen. Helaas kom ik er zelf nog niet uit om de juiste data te selecteren. Kan iemand mij op weg helpen wellicht?
Het gaat om circa 30 variabelen die elke minuut gelogd zijn, nu is er echter 1 variabele per ongeluk elke seconde gelogd. Dit levert dus een vervuilde/gigantische database op. Dit laatste wens ik op te schonen.
...
Ik heb het programma 'DB browser for SQLite' op een linux machine staan. Daarmee kan ik de data keurig inzien en records maken en verwijderen.
...
Ik heb geprobeerd om een select te maken met 'distinct' maar dat levert niet het gewenst resultaat op, en de functie 'lag' lijkt niet te bestaan of ik voer deze verkeerd uit.
...
Misschien is duidelijker aan de hand van een voorbeeld om uit te leggen wat er verwijderd moet worden uit de data, ik heb daarom de eerste 94 records in pastebin geplaatst: https://pastebin.com/Qqs8BgVp
Wat je hier ziet is dat de variable A77KB3A_F2 heel vaak voorkomt, de eerste 4 records zijn bijvoorbeeld overbodig, alleen de records die direct volgen op variable A79KB3A (record 34) zijn de juisten, dit kan je zien omdat de tijdstippen indentiek zijn. record 34 en 35 hebben hetzelfde tijdstip. De 59 daarop volgende records zijn dus elke seconde gemaakt en overbodig.
Is er iemand die hier inzicht in heeft en mij op weg kan helpen?
Het gaat om circa 30 variabelen die elke minuut gelogd zijn, nu is er echter 1 variabele per ongeluk elke seconde gelogd. Dit levert dus een vervuilde/gigantische database op. Dit laatste wens ik op te schonen.
...
Ik heb het programma 'DB browser for SQLite' op een linux machine staan. Daarmee kan ik de data keurig inzien en records maken en verwijderen.
...
Ik heb geprobeerd om een select te maken met 'distinct' maar dat levert niet het gewenst resultaat op, en de functie 'lag' lijkt niet te bestaan of ik voer deze verkeerd uit.
...
Misschien is duidelijker aan de hand van een voorbeeld om uit te leggen wat er verwijderd moet worden uit de data, ik heb daarom de eerste 94 records in pastebin geplaatst: https://pastebin.com/Qqs8BgVp
Wat je hier ziet is dat de variable A77KB3A_F2 heel vaak voorkomt, de eerste 4 records zijn bijvoorbeeld overbodig, alleen de records die direct volgen op variable A79KB3A (record 34) zijn de juisten, dit kan je zien omdat de tijdstippen indentiek zijn. record 34 en 35 hebben hetzelfde tijdstip. De 59 daarop volgende records zijn dus elke seconde gemaakt en overbodig.
Is er iemand die hier inzicht in heeft en mij op weg kan helpen?