Wat is het patroon/algoritme in deze bestandsnamen?

Pagina: 1
Acties:

Vraag


Acties:
  • 0 Henk 'm!

  • radicalEMT
  • Registratie: Juni 2000
  • Laatst online: 08-09 12:02
Ik ben bezig met het migreren van een beeldenarchief. De metadata van de beelden zitten in een SQL database, de daadwerkelijke beelden/bestanden staan op een fileshare.
Als er bij een onderzoek meerdere beelden zijn gemaakt plaatst het systeem deze in een .tar bestand (ongecomprimeerd).

Hieronder een schermafbeelding van de metadata en de .tar bestanden met inhoud.

Afbeeldingslocatie: https://i.imgur.com/ytgJEqx.jpg

De naam van het .tar bestand is eenvoudig te vinden in de database (544769087), maar de naam van de bestanden 544701102.dcm etc. niet. Het eerste gedeelte 5447 is duidelijk, maar waar komt de 01102 etc vandaan?

Ziet iemand het patroon?

Alle reacties


Acties:
  • 0 Henk 'm!

  • MAX3400
  • Registratie: Mei 2003
  • Laatst online: 27-09 22:07

MAX3400

XBL: OctagonQontrol

Het enige wat ik me kan voorstellen, maar aanname, dat je meerdere machines hebt staan die die bestanden opleveren en dat dus de correlatie tussen TAR en inhoud niet (meer) overeenkomt.

Simpele gedachtegang: 2 machines leveren allebei 001.tar aan maar in elke tar zitten andere bestanden. Als je de tar-naam als non-indexed waarde gebruikt, kan ik me voorstellen dat de rest van de records niet mag/kan worden geupdate.

Je zou het kunnen testen met een nieuwe tar (2x dezelfde naam) maar beiden met een ander bestand erin.

Mijn advertenties!!! | Mijn antwoorden zijn vaak niet snowflake-proof


Acties:
  • 0 Henk 'm!

  • nescafe
  • Registratie: Januari 2001
  • Laatst online: 08:23
De kolommen "offset" en "size" zouden al een hint moeten geven. Deze geven de relatieve positie van de bestanden in de tar aan. Met een willekeurige binary stream reader zou je deze files er zo gerelateerd aan de rows in de table uit kunnen halen.

* Barca zweert ook bij fixedsys... althans bij mIRC de rest is comic sans


Acties:
  • 0 Henk 'm!

  • radicalEMT
  • Registratie: Juni 2000
  • Laatst online: 08-09 12:02
Dank voor de suggesties. Inderdaad lukt het om de bestanden uit te pakken aan de hand van de offset en size, echter ben ik benieuwd hoe die naam nou opgebouwd is van de objecten. Er moet een logica inzitten, ik zie het echter nog niet....

Acties:
  • 0 Henk 'm!

  • nescafe
  • Registratie: Januari 2001
  • Laatst online: 08:23
Ah.. dan begrijp ik de vraag niet helemaal. Je wilt de beelden migreren, dit lukt niet met het untarren van de file (dan mis je de relatie tussen SQL-record en file) maar wel met het uitlezen van de tar als binary stream (waarbij je de relatie kunt leggen o.b.v. offset).

Dan kun je nog een relatie leggen tussen de binaire data en de bestandsnaam door in de 1e 100 bytes van het block van 512 bytes voor de offset te kijken (wiki).

Een verklaring voor de gebruikte bestandsnamen om hiermee gegevens te kunnen herleiden lijkt me niet nodig. Blijft over dat je een verklaring zou willen voor het "waarom" van de gebruikte bestandsnamen en daar kan ik eigenlijk alleen naar gissen.. wellicht gerelateerd aan de tijd in een bepaalde precisie?

Kun je aangeven waarom de bestandsnaam van belang is?

* Barca zweert ook bij fixedsys... althans bij mIRC de rest is comic sans


Acties:
  • 0 Henk 'm!

  • Stoelpoot
  • Registratie: September 2012
  • Niet online
nescafe schreef op donderdag 7 juni 2018 @ 09:46:
Kun je aangeven waarom de bestandsnaam van belang is?
Dit inderdaad. De bestandsnaam kan je aanpassen op elke manier die jij wilt, je bent toch aan het migreren. Je kan nu een bestand aan een record koppelen, dat is in principe voldoende, lijkt mij?

Acties:
  • 0 Henk 'm!

  • CCJJVV
  • Registratie: Maart 2016
  • Laatst online: 04-10 18:01
Het verschil tussen ID3 en het getal in Name is 14 maal 95631152, twee maal 956311523 en eenmaal 95631151. Dat extra verschil kan op werkelijk alles gebaseerd zijn, inhoud, tijd, size, offset een combinatie van meerdere. Verder snap ik net als de andere niet waarom je dit zou willen weten.

Acties:
  • 0 Henk 'm!

  • radicalEMT
  • Registratie: Juni 2000
  • Laatst online: 08-09 12:02
Ha, de reden waarom de bestandsnaam van belang is, is gewoon nieuwsgierigheid. Het migreren lukt zeker, ook zonder dat we de namen weten.
Het zit mij gewoon dwars dat ik de logica niet inzie van de naamgeving :-(, misschien dat een ander dat wel ziet!

Acties:
  • 0 Henk 'm!

  • Stoelpoot
  • Registratie: September 2012
  • Niet online
radicalEMT schreef op donderdag 7 juni 2018 @ 10:36:
Ha, de reden waarom de bestandsnaam van belang is, is gewoon nieuwsgierigheid. Het migreren lukt zeker, ook zonder dat we de namen weten.
Het zit mij gewoon dwars dat ik de logica niet inzie van de naamgeving :-(, misschien dat een ander dat wel ziet!
Ik bijna zeggen dat het gewoon willekeurig gegenereerd is. De bestandsnamen zijn niet nodig, dus de enige logica erachter moet er voor zorgen dat de namen uniek blijven.

Acties:
  • 0 Henk 'm!

  • Stinu
  • Registratie: December 2009
  • Laatst online: 29-09 07:04
Misschien dat het schrijven naar de TAR via een apart process/thread loopt.
En dat deze ook met een unique ID werkt.

En omdat het toevoegen in de database & schrijven naar TAR niet even snel / niet zelfde volgorde (door mogelijk priority) loopt.
Kom je mogelijk met kleine verschillen tussen de ID's zoals @CCJJVV aan geeft.

Deze zitten misschien nog ergens anders in de database opgeslagen?

Acties:
  • 0 Henk 'm!

  • radicalEMT
  • Registratie: Juni 2000
  • Laatst online: 08-09 12:02
Deze zitten misschien nog ergens anders in de database opgeslagen?
Overal al gekeken, is nergens in de database te vinden. Lijkt er inderdaad op dat een apart proces hier zorg voor draagt.

Acties:
  • 0 Henk 'm!

  • elhopo
  • Registratie: December 2005
  • Laatst online: 01-10 14:30
Lijkt een soort van timestamp te zijn. Waarschijnlijk zal een ontwikkelaar om unieke namen te genereren het laatste deel van een timestamp uit de een of andere systeemtimer hebben gehaald. Als je systeem niet al te snel is zal dit ws. wel goed gaan. File toevoegen aan een tar zal dan zo'n 9 a 10 milliseconden duren? Dus naam is (5447 + system.gettimeinmillis().toString.right(5)) ofzo. Of de uptime van het systeem in microseconden ofzo en dan de laatste 5 cijfers.

Blijkt dat citroenvlinders helemaal niet naar citroen smaken.


Acties:
  • 0 Henk 'm!

  • Kontsnorretje
  • Registratie: Augustus 2011
  • Laatst online: 14-06-2024
Volgens mij is het gewoon een volg nummer. Als ik kijk naar ID3, en de bestandsnamen in de Tar, slaan deze, op de eerste 2 na, net zoveel IDs over.

Hoe dit zich tot elkaar verhoudt is dan weer een andere vraag.

Acties:
  • 0 Henk 'm!

  • HuHu
  • Registratie: Maart 2005
  • Niet online
Voor zover ik weet zit er geen logica in DICOM bestandsnamen. Gewoon unieke nummers. Voor de volgorde en andere informatie moet je de DICOM tags uitlezen.

Acties:
  • 0 Henk 'm!

  • drm
  • Registratie: Februari 2001
  • Laatst online: 09-06 13:31

drm

f0pc0dert

Het patroon voor de tar bestanden is helder. Ze eindigen altijd op 69087. :+

Je zal toch met meer data moeten komen om hier een patroon in te kunnen ontdekken.

Music is the pleasure the human mind experiences from counting without being aware that it is counting
~ Gottfried Leibniz

Pagina: 1