Умляуты в юникод

  • Автор темы booper
  • Дата начала
Статус
Закрыто для дальнейших ответов.
B

booper

Гость
#1
Всем привет !
Есть вопросик, может не в тему.
Ииеем германский сайт в страницах которого не указана кодировка
( content chatset=).
Я пытаюсь парсить его содержимое, но вместо немецких умляутов приежает &*uml. можноли это как нитькодировать в юникод с сохранением нормальных немецких умляутов а не декодированых.
Вот кусок кода, как забираю ( сразу оговорка на немецких сайтах, где указана кодировка в страницаx content=iso-8859-1, все ок, приежает с нормальными умляктами ) Что подскажите ? Где грабли ? В зангаловке запроса указыва Accept-charsetб не помогает (((
Вот кусок кода на PHP, как граблю контенет :

$request = "GET " . $URL . " HTTP/1.0\r\n" .
"User-agent:Mozilla/2.02 Gold (WinNT;I)\r\n" .
"Accept:image/gif,image-x-xbitmap,image/jpeg,image/pjpeg,*/*\r\n" .
"Accept-Charset:iso-8859-1" .
"Host:$host\r\n" .
"Referer:$URL\r\n" .
"Content-type:application/x-www-form-urlencoded\r\n" .
"Content-length:" . 0 . "\r\n" .
"\r\n";

// send request
if (!fwrite ($sh, $request, strlen ($request))) {
return "Error requesting host $host\n";
}

// get result
$line = "";
while (!feof ($sh))
$line .= fgets ($sh, 1024);

fclose ($sh);
 
Статус
Закрыто для дальнейших ответов.