Hoi,
Ik wil een bestand analyseren en bepaalde data eruit halen. Ik dacht dat perl hier het meest geschikt voor was. Hier is een voorbeeld:
STREAM test;
blablabla;
blablabla;
blablabla;
INPUT;
INCLUDE all;
OUTPUT;
INCLUDE AAAA11 CCCC AAAA11 CCCC
AAAA11 CCCC AAAA11 CCCC AAAA11 CCCC;
END;
Het zijn de gegevens AAAA11 CCCC die ik moet hebben.
Deze gegevens hebben telkens dezelfde vorm, zie regex:
"[A-Z][A-Z][A-Z][A-Z][0-9][0-9] [A-Z][A-Z][A-Z][A-Z]"
Die INCLUDE in het begin en de ';' op het einde mogen niet inbegrepen worden. Ik weet ook niet hoeveel data er op één lijn zal bevinden. Iemand een idee hoe ik hieraan begin? Of in welke richting ik het beste zoek?
Ik heb met awk de data al tot dit kunnen beperken:
OUTPUT;
INCLUDE AAAA11 CCCC AAAA11 CCCC
AAAA11 CCCC AAAA11 CCCC AAAA11 CCCC;
END;
Zoals je al wel kunt zien, ben ik geen specialist in awk/sed/perl toestanden
Ik wil een bestand analyseren en bepaalde data eruit halen. Ik dacht dat perl hier het meest geschikt voor was. Hier is een voorbeeld:
STREAM test;
blablabla;
blablabla;
blablabla;
INPUT;
INCLUDE all;
OUTPUT;
INCLUDE AAAA11 CCCC AAAA11 CCCC
AAAA11 CCCC AAAA11 CCCC AAAA11 CCCC;
END;
Het zijn de gegevens AAAA11 CCCC die ik moet hebben.
Deze gegevens hebben telkens dezelfde vorm, zie regex:
"[A-Z][A-Z][A-Z][A-Z][0-9][0-9] [A-Z][A-Z][A-Z][A-Z]"
Die INCLUDE in het begin en de ';' op het einde mogen niet inbegrepen worden. Ik weet ook niet hoeveel data er op één lijn zal bevinden. Iemand een idee hoe ik hieraan begin? Of in welke richting ik het beste zoek?
Ik heb met awk de data al tot dit kunnen beperken:
OUTPUT;
INCLUDE AAAA11 CCCC AAAA11 CCCC
AAAA11 CCCC AAAA11 CCCC AAAA11 CCCC;
END;
Zoals je al wel kunt zien, ben ik geen specialist in awk/sed/perl toestanden