?????1
^
Nee, m'n keyboard is niet vastgelopen, dat is wat ik momenteel in m'n bash console zie en daar kan ik uitermate weinig mee
Situatie:
Heb onlangs muziek uit de Sovietunie zitten downloaden don't ask... iig is copyright geen issue
. In Bash kreeg ik 'onzin' te zien. Bleek dat ik m'n terminal niet op Unicode had staan. Na overzetten op Unicode werd de helft van die onzin Cyrillisch, waardoor ik bijvoorbeeld Ария correct zag staan. Maar de andere helft is duidelijk op een andere manier geencodeerd, en het lukt mij niet om te achterhalen exact hoe.
Complicatie: ik zie verschillende dingen in mocp (ncurses-based media player) en op de console.
Het gaat primair om directorynamen, de filenames zijn soms gewoon in ASCII, maar soms ook niet. Grootste
Voorbeeld van hoogste directory, subdirectory en file in worst-case scenario in mocp:
?????1
1985 - ????? ???????
Àðèÿ - Ýòî ðîê (Ìàíèÿ âåëè÷èÿ)
Hetzelfde in de console bij ls:
?????1
1985 - ????? ???????
01-Eto rok.mp3
Wederom console, nu links van de prompt als ik in de directory zit:
�����1/1985
����� �������
Mijn vermoeden is trouwens dat wat ik in mocp zie ook nog met ID3-tags te maken heeft (eerste deel van de filename lijkt bijvoorbeeld verdacht op Ария ), daar wat aan doen is secundair, het gaat me primair gewoon om de filename in bash.
Enige tool die ik ken (of die ik bij het googlen kon vinden) om te achterhalen hoe text gecodeerd is, is file, maar die kijkt naar inhoud van files, niet naar de namen. Bij directories krijg ik "directory" als output, bij de files "binary". No shit sherlock
Op zich zijn de files niet corrupt, ik kan ze prima afspelen in mocp, maar het is wel zo lastig uitzoeken waar ik naar kijk, en ik kan alleen met copy/paste die dingen bewerken.
Iemand enig idee hoe ik kan achterhalen wat voor encodering deze file/directory names hebben?
OS: Xubuntu 11.10 (geupgrade vanaf 11.04) 32b desktop
Shell: gewoon default bash, geen modificaties aan bashrc
Grootste deel van de tijd log ik op deze bak in via putty vanaf Windowsgeval. Dat is ook waar ik bovenstaande stukken uit gecopy/paste heb. In putty heb ik UTF-8 ingesteld staan als codepage.
^
Nee, m'n keyboard is niet vastgelopen, dat is wat ik momenteel in m'n bash console zie en daar kan ik uitermate weinig mee
Situatie:
Heb onlangs muziek uit de Sovietunie zitten downloaden don't ask... iig is copyright geen issue
Complicatie: ik zie verschillende dingen in mocp (ncurses-based media player) en op de console.
Het gaat primair om directorynamen, de filenames zijn soms gewoon in ASCII, maar soms ook niet. Grootste
Voorbeeld van hoogste directory, subdirectory en file in worst-case scenario in mocp:
?????1
1985 - ????? ???????
Àðèÿ - Ýòî ðîê (Ìàíèÿ âåëè÷èÿ)
Hetzelfde in de console bij ls:
?????1
1985 - ????? ???????
01-Eto rok.mp3
Wederom console, nu links van de prompt als ik in de directory zit:
�����1/1985
����� �������
Mijn vermoeden is trouwens dat wat ik in mocp zie ook nog met ID3-tags te maken heeft (eerste deel van de filename lijkt bijvoorbeeld verdacht op Ария ), daar wat aan doen is secundair, het gaat me primair gewoon om de filename in bash.
Enige tool die ik ken (of die ik bij het googlen kon vinden) om te achterhalen hoe text gecodeerd is, is file, maar die kijkt naar inhoud van files, niet naar de namen. Bij directories krijg ik "directory" als output, bij de files "binary". No shit sherlock

Op zich zijn de files niet corrupt, ik kan ze prima afspelen in mocp, maar het is wel zo lastig uitzoeken waar ik naar kijk, en ik kan alleen met copy/paste die dingen bewerken.
Iemand enig idee hoe ik kan achterhalen wat voor encodering deze file/directory names hebben?
OS: Xubuntu 11.10 (geupgrade vanaf 11.04) 32b desktop
Shell: gewoon default bash, geen modificaties aan bashrc
Grootste deel van de tijd log ik op deze bak in via putty vanaf Windowsgeval. Dat is ook waar ik bovenstaande stukken uit gecopy/paste heb. In putty heb ik UTF-8 ingesteld staan als codepage.
[ Voor 5% gewijzigd door dion_b op 20-12-2011 08:25 ]
Oslik blyat! Oslik!