Как я могу преобразовать строки типа «\ u5c0f \ u738b \ u5b50 \ u003a \ u6c49 \ u6cd5 \ u82f1 \ u5bf9 \ u7167" на иероглифы

Теперь я работаю над небольшим инструментом для запроса и декодирования веб-страницы, на которой китайские символы хранятся в виде строки, например

\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167 

в исходном коде, что-то вроде unicode. Я хочу преобразовать его в китайские символы.

  • KeyError при индексировании кадра данных Pandas
  • как удалить элемент в lxml
  • Изменение временной отметки unix для другого часового пояса
  • Преобразование массива numpy в массив массивов numpy
  • Кросс-платформенный набор инструментов gui для развертывания приложений Python
  • Выполнение Python из php
  • Я могу пройти через этот сайт http://rishida.net/tools/conversion/ . Но как я могу сделать это с помощью python?

  • Самый распространенный элемент Python в списке
  • Понимание Popen.communicate
  • Терминология Python: вещи слева от «= argv» в программе Learn Python the Hard Way 13
  • Что означает «лямбда» в Python и какой самый простой способ использовать его?
  • AttributeError: объект 'module' (scipy) не имеет атрибута 'misc'
  • Извлечение читаемого текста из HTML с помощью Python?
  • One Solution collect form web for “Как я могу преобразовать строки типа «\ u5c0f \ u738b \ u5b50 \ u003a \ u6c49 \ u6cd5 \ u82f1 \ u5bf9 \ u7167" на иероглифы”

    Это уже кодовые обозначения Unicode. Они представляют китайские иероглифы, но используют escape-коды, которые проще для разработчика:

     >>> print u'\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167'小王子:汉法英对照 

    Вам не нужно ничего делать, чтобы преобразовать их; escape-форма \uxxxx – это просто еще один способ выразить один и тот же код. См. Литералы строк :

    \uxxxx
    Символ с 16-разрядным шестнадцатеричным значением xxxx (только для Unicode)
    \Uxxxxxxxx
    Символ с 32-разрядным шестнадцатеричным значением xxxxxxxx (только для Unicode)

    Python интерпретирует эти escape-коды при чтении исходного кода для построения значения unicode.

    Если источником данных не является исходный код Python, а из Интернета, вместо этого у вас есть данные JSON, который использует тот же формат escape:

     >>> import json >>> print json.loads('"\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167"')小王子:汉法英对照 

    Обратите внимание, что тогда значение должно быть частью большей строки, которая, по крайней мере, включает в себя кавычки, чтобы отметить эту строку.

    Также обратите внимание, что формат escape-последовательности строки JSON отличается от Python, когда речь заходит о не-BMP (дополнительных) кодовых точках; JSON рассматривает такие, как UTF-16, путем создания суррогатной пары и использует две последовательности \uxxxx для такого кода. В Python вы должны использовать 32-разрядное шестнадцатеричное значение \Uhhhhhhhh .

    Python - лучший язык программирования в мире.