Herkenbare bestanden uit een binary container plukken

Pagina: 1
Acties:

  • DiSiLLUSiON
  • Registratie: September 2000
  • Laatst online: 19-03 23:29
Ik twijfel of dit wel de juiste plaats is om dit te posten, aangezien ik niet op zoek ben naar programmeer methodes (het is te lang geleden dat ik geprogrammeerd heb), maar ik vermoed dat hier de meeste mensen zitten die ervaring hebben met het staren naar binary bestanden, vandaar dat ik dit toch maar hier post. Als het gemoved moet worden is dat best, natuurlijk.

Ik heb een binary container bestand, waar meerdere bestanden in opgeslagen zijn, waaronder een paar jpg's, gifjes, xml bestanden en dergelijke. Header is niet bekend, structuur is niet bekend. Het ook niet bekend welke tekens secties aanduiden/afsluiten en dergelijke. Ik zou graag zoveel mogelijk herkenbare bestanden eruit plukken. Het is opzich prima te doen met de hand dmv een hex editor, heb al enkele resultaten geboekt (headers van JPG's en dergelijke zijn herkenbaar genoeg). Het bestand zit alleen zó vol (32 mb) dat ik vrees dat als ik met deze methode doorga, ik over 10 jaar nog niet klaar ben..

Nu vroeg ik me af, weet iemand of er een programma is dat herkenbare bestanden uit een binary container herkent, en deze eruit kan halen? De meeste resource explorers zullen niet werken, die verwachten een executable, wat dit niet is.. Of misschien een hex editor die door middel van bijv templates, delen van het binary bestand kan markeren en in één rits kan extracten?

Ik ben al tegen ICY Hexplore aangelopen, die door middel van custom header info headers kan herkennen, maar dan zal ik alsnog handmatig al die bestanden eruit moeten halen, waardoor ik net zo goed gewoon naar bekende header tekst kan zoeken, dus daar heb ik helaas weinig aan..

  • Daos
  • Registratie: Oktober 2004
  • Niet online
Nee. Ik weet geen programma's.

In headers van plaatjes staat altijd hoe groot hij is. Waar de ene eindigt daar begint de volgende.
Dat is niet zo moeilijk te programmeren.


binary container bestand :? Zoiets als een .tar of een image van een hardeschijf? Bij schijfimage is het vrijwel onmogelijk om je bestanden terug te vinden omdat je last heb van fragmentatie.

  • DiSiLLUSiON
  • Registratie: September 2000
  • Laatst online: 19-03 23:29
Dan zal ik toch even m'n programmeerkennis moeten afstoffen. Toch bedankt in ieder geval. :)

En het is niet een image van een harde schijf, maar eerder een image van een flashkaart om het zo maar even te zeggen. Alles zit wel op volgorde, maar niet alle bestanden zijn herkenbaar, er zitten (blijkt nu) geen scheidingstekens in, wat het lastig maakt omdat er tussendoor onbekende bestanden zitten. En de plaatjes zijn niet alleen in JPG formaat, maar ook (vooral) GIF (zonder GIF89a header), ICO en ANI wat het een stuk lastiger maakt, waardoor heel veel toch handmatig zal moeten gebeuren wat een eeuwigheid kost helaas.

[ Voor 3% gewijzigd door DiSiLLUSiON op 22-01-2005 18:54 ]


  • Virgil
  • Registratie: November 2001
  • Laatst online: 16-05 23:54

Virgil

We're not alone

Weet je zeker dat deze 'container' niet gecomprimeerd is?

Wat je zou kunnen doen is de file openen in een filestream, en dan de rijen aflopen. Als je weet hoe lang de regels zijn kan je kijken of gedeelten van de regels overeenkomen met de herkenbare headers van jpeg etc.

-edit

Het gaat om een binary file. Dus als je nou steeds 8 bits bekijkt en dat vergelijkt met de 1e byte van een bekende header, bijvoorbeeld jpeg, en bij een match de volgende 8 bits gaat vergelijken met de volgende 8 bits van de bekende header. totdat je zegmaar 30 matches hebt :)

[ Voor 36% gewijzigd door Virgil op 22-01-2005 19:06 ]

Ik was heel, heeeel vroeger SeRRveR


  • Daos
  • Registratie: Oktober 2004
  • Niet online
DiSiLLUSiON schreef op zaterdag 22 januari 2005 @ 18:54:
Dan zal ik toch even m'n programmeerkennis moeten afstoffen. Toch bedankt in ieder geval. :)

En het is niet een image van een harde schijf, maar eerder een image van een flashkaart om het zo maar even te zeggen. Alles zit wel op volgorde, maar niet alle bestanden zijn herkenbaar, er zitten (blijkt nu) geen scheidingstekens in, wat het lastig maakt omdat er tussendoor onbekende bestanden zitten. En de plaatjes zijn niet alleen in JPG formaat, maar ook (vooral) GIF (zonder GIF89a header), ICO en ANI wat het een stuk lastiger maakt, waardoor heel veel toch handmatig zal moeten gebeuren wat een eeuwigheid kost helaas.
Bij gif heb je ook nog GIF87a. Helemaal zonder header bestaat niet omdat er allerlei info in de header staat.

Bij ANI staat de grootte in de header. JPEG en GIF eindigen met een speciale character. ICO kon ik zo snel niet vinden, maar dat moet ook wel te doen zijn.
Gevonden met google: ANI, ICO, GIF en JPEG