Toon posts:

[WS*/UTF] Webservices en UTF-8-Encoding

Pagina: 1
Acties:

Verwijderd

Topicstarter
Beste iedereen,

ik zit met het volgende probleem: ik heb een webservice die vertalingen moet kunnen ophalen vanuit babelfish (babelfish.altavista.com).

Hiervoor gebruik ik de volgende code:

C#:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
public string BabelFish(string translationmode, string sourcedata) 
{
    HttpWebRequest httpRequest = (HttpWebRequest)HttpWebRequest.Create(string.Format("http://babelfish.altavista.com/tr?trtext={0}&lp={1}", sourcedata, translationmode));
    HttpWebResponse response = (HttpWebResponse)httpRequest.GetResponse();
    Stream responseStream = response.GetResponseStream();
    StreamReader readStream = new StreamReader(responseStream);

    string s = readStream.ReadToEnd();

    Regex reg = new Regex(@"<td bgcolor=white class=s><div style=padding:10px;>((?:.|\n)*?)</div>");
    MatchCollection matches = reg.Matches(s);
    if (matches.Count != 1 || matches[0].Groups.Count != 2) 
        return ERRORSTRINGSTART + "The HTML returned from Babelfish appears to have changed. Please check for an updated regular expression" +  ERRORSTRINGEND;

    return matches[0].Groups[1].Value;
}


Het probleem is dan dat als ik vertalingen met umlauts of bijvoorbeeld russisch ophaal dat ik dan de speciale karakters kwijt ben. Kan iemand helpen?


Mzzl!

  • zwippie
  • Registratie: Mei 2003
  • Niet online

zwippie

Electrons at work

Ik vermoed dat je bij het openen van je StreamReader een charset mee moet geven als extra argument.

How much can you compute with the "ultimate laptop" with 1 kg of mass and 1 liter of volume? Answer: not more than 10^51 operations per second on not more than 10^32 bits.


Verwijderd

Topicstarter
zwippie schreef op maandag 03 april 2006 @ 16:31:
Ik vermoed dat je bij het openen van je StreamReader een charset mee moet geven als extra argument.
Heb ik al geprobeerd, maar dat maakt geen verschil. Ik heb Encoding.UTF8 meegegeven, maar de CurrentEncoding bljift UTF8 en een rotzooitje.

Verwijderd

Topicstarter
*schop*