Ik heb moeite met het omzetten van een Kroatische text van ISO-8859-1 naar UTF-8.
Ik heb een PHP script dat de volgende zaken doet.
1. Het haalt HTML data van een url in ISO-8859-1 tekenset.
Tekst is Kroatisch, bijvoorbeeld:
Ovdje se uz mnogo trgovina nalazi i kuglana, biljarska dvorana, igraona, frizerski salon, te rent-a-bike.
Tjekom dana možete sudjelovati u mnogim aktivnostima. Dok se djeca zabavljaju sa animacijkim timom u raznim radionicama ili u mini klubu, odnosno junior klubu, Vi možete sudjelovati u aerobiku ili pak teèaju plesa. Naveèer možete pogledati razne priredbe u kazalištu, a kasnije zabavu možete potražiti u diskoteci "Coco Loco".
2. Er worden wat manipulaties gedaan aan de data
Hiervoor gebruik ik simplehtmldom
3. De data wordt geconverteerd naar utf8 en weergegeven.
echo (utf8_encode($convertedHtml));
Probleem
Het probleem is dat tekens zoals: 'ž' niet worden weergegeven. In plaats daarvan zie ik van die rare vraagtekentjes.
Daarom heb ik onderstaande functie gemaakt, maar dat helpt helaas niets...
<?php
// croatian entities
function charsToEnts($string) {
$chars = array (
"Č" => "Č",
"č" => "č",
"Ć" => "Ć",
"ž" => "ž"
);
foreach ($chars as $char => $ent) {
$string = str_replace($char, $ent, $string);
}
return $string;
}
$convertedHtml = charsToEnts($convertedHtml);
?>
Kan iemand me helpen om Poolse en Kroatische tekens om te zetten naar UTF-8?
Ik heb een PHP script dat de volgende zaken doet.
1. Het haalt HTML data van een url in ISO-8859-1 tekenset.
Tekst is Kroatisch, bijvoorbeeld:
Ovdje se uz mnogo trgovina nalazi i kuglana, biljarska dvorana, igraona, frizerski salon, te rent-a-bike.
Tjekom dana možete sudjelovati u mnogim aktivnostima. Dok se djeca zabavljaju sa animacijkim timom u raznim radionicama ili u mini klubu, odnosno junior klubu, Vi možete sudjelovati u aerobiku ili pak teèaju plesa. Naveèer možete pogledati razne priredbe u kazalištu, a kasnije zabavu možete potražiti u diskoteci "Coco Loco".
PHP:
1
2
3
4
5
6
7
8
9
10
| <?php // get converter HTML $curl_handle=curl_init(); curl_setopt($curl_handle, CURLOPT_URL,$url); curl_setopt($curl_handle, CURLOPT_CONNECTTIMEOUT, 4); curl_setopt($curl_handle, CURLOPT_RETURNTRANSFER, 1); curl_setopt($curl_handle, CURLOPT_USERAGENT, 'TDX Converter'); $converterHtml = curl_exec($curl_handle); curl_close($curl_handle); ?> |
2. Er worden wat manipulaties gedaan aan de data
Hiervoor gebruik ik simplehtmldom
3. De data wordt geconverteerd naar utf8 en weergegeven.
echo (utf8_encode($convertedHtml));
Probleem
Het probleem is dat tekens zoals: 'ž' niet worden weergegeven. In plaats daarvan zie ik van die rare vraagtekentjes.
Daarom heb ik onderstaande functie gemaakt, maar dat helpt helaas niets...
<?php
// croatian entities
function charsToEnts($string) {
$chars = array (
"Č" => "Č",
"č" => "č",
"Ć" => "Ć",
"ž" => "ž"
);
foreach ($chars as $char => $ent) {
$string = str_replace($char, $ent, $string);
}
return $string;
}
$convertedHtml = charsToEnts($convertedHtml);
?>
Kan iemand me helpen om Poolse en Kroatische tekens om te zetten naar UTF-8?
---