Проблема с кодировками

ancorid

Client
Регистрация
11.04.2013
Сообщения
45
Благодарностей
10
Баллы
8
Паршу страницу на японском, GET запросом и сохраняю ее в txt файл. Уже перепробовал кучу кодировок, но в txt файле сохраняются крякозябры ����饤����
или если выставить кодировку Shift-JIS то получается ・・スー・イ髫假スオ・。・シ・・・難ス・・ケ
Хотя должно быть так 通販サービス
Как правильно сохранить текст ?

Спасибо
 

VladZen

Administrator
Команда форума
Регистрация
05.11.2014
Сообщения
22 300
Благодарностей
5 861
Баллы
113
Попробуйте выбрать кодировку UTF8 при сохранении
 

ancorid

Client
Регистрация
11.04.2013
Сообщения
45
Благодарностей
10
Баллы
8
���Υ����ӥ� Вот такой результат с UTF8
 

ancorid

Client
Регистрация
11.04.2013
Сообщения
45
Благодарностей
10
Баллы
8
Разобрался...
В заголовке страницы прописана кодировка EUC-JP
Спарсил все в ней и норм получилось ))
 
  • Спасибо
Реакции: VladZen

VladZen

Administrator
Команда форума
Регистрация
05.11.2014
Сообщения
22 300
Благодарностей
5 861
Баллы
113
Разобрался...
В заголовке страницы прописана кодировка EUC-JP
Спарсил все в ней и норм получилось ))
Тогда да - нужно смотреть какая кодировка в сурсе и выставлять такую же при сохранении.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)