Bij het importeren van een CSV bestand laat ik de gebruiker drie stappen doorlopen:
1. Bestand selecteren en uploaden
2. Data-types van kolommen bevestigen en aangeven of eerste rij een header-rij is.
3. Data daadwerkelijk importeren
Nu wil ik bij stap 2 alvast een schatting/default maken voor de kolom-types en het al dan niet aanwezig zijn van een header rij.
Nu vroeg ik me af hoe je kunt achterhalen of een rij een header-rij is. Als "mens" zie je zoiets heel snel ... omdat de string in de header vrij veel afwijkt van het patroon in de de rijen eronder. Ik ben dus nu aan het denken in de richting van het vergelijken van het "gemiddelde" van alle strings in een kolom met de string in de eerste rij. Maar wat is het "gemiddelde" van een set strings? Ik neig naar levenshtein en similar_text achtige functies ... maar weet niet helemaal hoe ik die dan zou moeten toepassen.
Heeft iemand wellicht een gedachte hierover? Dit is waarschijnlijk meer algemeen programmeer-technisch dan PHP specifiek.
1. Bestand selecteren en uploaden
2. Data-types van kolommen bevestigen en aangeven of eerste rij een header-rij is.
3. Data daadwerkelijk importeren
Nu wil ik bij stap 2 alvast een schatting/default maken voor de kolom-types en het al dan niet aanwezig zijn van een header rij.
Nu vroeg ik me af hoe je kunt achterhalen of een rij een header-rij is. Als "mens" zie je zoiets heel snel ... omdat de string in de header vrij veel afwijkt van het patroon in de de rijen eronder. Ik ben dus nu aan het denken in de richting van het vergelijken van het "gemiddelde" van alle strings in een kolom met de string in de eerste rij. Maar wat is het "gemiddelde" van een set strings? Ik neig naar levenshtein en similar_text achtige functies ... maar weet niet helemaal hoe ik die dan zou moeten toepassen.
Heeft iemand wellicht een gedachte hierover? Dit is waarschijnlijk meer algemeen programmeer-technisch dan PHP specifiek.