Tag: unicode

Google App Engine: UnicodeDecodeError: кодек ascii не может декодировать байт 0xe2 в позиции 48: порядковый номер не в диапазоне (128)

Я работаю над небольшим приложением, использующим Google App Engine, который использует RSS-канал Quora. Существует форма и на основе ввода, введенного пользователем, он выведет список ссылок, связанных с вводом. Теперь приложения отлично работают для однобуквенных запросов и большинства двухбуквенных слов, если слова разделены символом «-». Однако для трехбуквенных слов и некоторых двухбуквенных слов возникает следующая ошибка: […]

Python: как преобразовать строку кода utf-8 в строку?

Я использую Python, и, к сожалению, моему коду нужно преобразовать строку, представляющую код utf-8 строки в исходную строку, например: Кодовая строка UTF-8, полученная из другого кода: \u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5 Мне нужно преобразовать его обратно в исходную строку. Как это сделать?

Python: Как заставить StringIO.writelines принимать строку Unicode?

Я получаю UnicodeEncodeError: 'ascii' codec can't encode character u'\xa3' in position 34: ordinal not in range(128) на строке, хранящейся в 'a.desc' ниже, поскольку она содержит символ '£'. Он хранится в базовом хранилище данных Google App Engine в виде строки в Юникоде, так что все в порядке. Функция cStringIO.StringIO.writelines пытается, по-видимому, пытаться закодировать ее в формате […]

Как преобразовать символы Unicode с акцентом в чистый ascii без акцентов?

Я пытаюсь загрузить некоторый контент со словарного сайта, например http://dictionary.reference.com/browse/apple?s=t Проблема, с которой я столкнулась, заключается в том, что в исходном абзаце есть все эти squiggly строки и обратные буквы и т. Д., Поэтому, когда я читаю локальные файлы, я получаю эти смешные escape-символы, такие как \ x85, \ xa7, \ x8d и т. Д. […]

Как сообщить Python, что sys.argv находится в Unicode?

Вот небольшая программа: import sys f = sys.argv[1] print type(f) print u"f=%s" % (f) Вот мой запуск программы: $ python x.py 'Recent/רשימת משתתפים.LNK' <type 'str'> Traceback (most recent call last): File "x.py", line 5, in <module> print u"f=%s" % (f) UnicodeDecodeError: 'ascii' codec can't decode byte 0xd7 in position 7: ordinal not in range(128) $ […]

python – Проблема сохранения символа Unicode для MySQL с Django

У меня есть строка u"Played Mirror's Edge\u2122" Который должен быть показан как Played Mirror's Edge™ Но это еще одна проблема. Моя проблема в том, что я помещаю ее в модель, а затем пытаюсь сохранить ее в базе данных. AKA: a = models.Achievement(name=u"Played Mirror's Edge\u2122") a.save() И я получаю: 'ascii' codec can't encode character u'\u2122' in […]

Проверьте строку, если это Юникод, какой стандарт UTF и длина его в байтах?

Мне нужно проверить, является ли строка Unicode, а затем, если это UTF-8. После этого получите длину строки в байтах, включая спецификацию , если она когда-либо ее использует. Как это можно сделать в Python? Также для дидактических целей, как выглядит представление списка байтов строки UTF-8? Мне любопытно, как строка UTF-8 представлена ​​в Python. Последнее редактирование: pprint […]

Как декодировать необработанные литералы Unicode для читаемой строки?

Если я присвою необработанным литералам Unicode переменной, я могу прочитать ее значение: >>> s = u'\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e' >>> s u'\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e' >>> print s Сообщение отправлено Но когда я уже присвоил значение простой, а не юникодной строке, я не могу: >>> s = '\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e' >>> s '\\u0421\\u043e\\u043e\\u0431\\u0449\\u0435\\u043d\\u0438\\u0435 \\u043e\\u0442\\u043f\\u0440\\u0430\\u0432\\u043b\\u0435\\u043d\\u043e' >>> print s \u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e Как […]

Использование формата Unicode для `time.strftime ()` Python `

Я пытаюсь вызвать time.strftime() Python с использованием строки формата Unicode: u'%d\u200f/%m\u200f/%Y %H:%M:%S' (« \u200f справа налево» (RLM)). Тем не менее, я получаю исключение, что символ RLM не может быть закодирован в ascii: UnicodeEncodeError: кодек 'ascii' не может кодировать символ u '\ u200f' в позиции 2: порядковый номер не в диапазоне (128) Я попытался найти альтернативу, […]

Python: конвертировать сложный словарь строк из Unicode в ASCII

Возможный дубликат: Как получить строку Объекты вместо Unicode из JSON в Python? У меня много входных данных, поскольку многоуровневые словари анализируются из вызовов API JSON. Строки все в Юникоде, что означает, что есть много таких u'stuff like this' . Я использую jq, чтобы поиграть с результатами и вам нужно преобразовать эти результаты в ASCII. Я […]

Python - лучший язык программирования в мире.