Tag: unicode

Сохранение текстов utf-8 в json.dumps как UTF8, а не как \ u escape-последовательность

образец кода: >>> import json >>> json_string = json.dumps("ברי צקלה") >>> print json_string "\u05d1\u05e8\u05d9 \u05e6\u05e7\u05dc\u05d4" Проблема: она не читаема человеком. Мои (умные) пользователи хотят проверить или даже отредактировать текстовые файлы с дампами JSON. (и я бы предпочел не использовать XML) Есть ли способ сериализации объектов в utf-8 json string (вместо \ uXXXX)? это не помогает: […]

В чем дело с Python 3.4, Unicode, разными языками и Windows?

Счастливые примеры: #!/usr/bin/env python # -*- coding: utf-8 -*- czech = u'Leoš Janáček'.encode("utf-8") print(czech) pl = u'Zdzisław Beksiński'.encode("utf-8") print(pl) jp = u'リング 山村 貞子'.encode("utf-8") print(jp) chinese = u'五行'.encode("utf-8") print(chinese) MIR = u'Машина для Инженерных Расчётов'.encode("utf-8") print(MIR) pt = u'Minha Língua Portuguesa: çáà'.encode("utf-8") print(pt) Несчастный выход: b'Leo\xc5\xa1 Jan\xc3\xa1\xc4\x8dek' b'Zdzis\xc5\x82aw Beksi\xc5\x84ski' b'\xe3\x83\xaa\xe3\x83\xb3\xe3\x82\xb0 \xe5\xb1\xb1\xe6\x9d\x91 \xe8\xb2\x9e\xe5\xad\x90' b'\xe4\xba\x94\xe8\xa1\x8c' b'\xd0\x9c\xd0\xb0\xd1\x88\xd0\xb8\xd0\xbd\xd0\xb0 \xd0\xb4\xd0\xbb\xd1\x8f […]

Что делает символ «b» перед строковым литералом?

По-видимому, следующий синтаксис … my_string = b'The string' Я бы хотел знать… Что означает этот символ b символа строки? Каковы последствия его использования? Каковы подходящие ситуации для его использования. Я нашел связанный вопрос прямо здесь, на SO, но этот вопрос касается PHP, хотя и указывает, что b используется для указания, что строка является двоичной, а […]

Что именно делают «u» и «r» строковые флаги, и каковы исходные строковые литералы?

Когда я задавал этот вопрос , я понял, что не знаю много о сырых струнах. Для кого-то, претендующего на роль тренера в Django, это отстой. Я знаю, что такое кодировка, и я знаю, что я делаю с тех пор, как получаю то, что такое Юникод. Но что делает r точно? В какой строке это результат? […]

Python, Unicode и консоль Windows

Когда я пытаюсь напечатать строку Unicode в консоли Windows, я получаю UnicodeEncodeError: 'charmap' codec can't encode character …. ошибка. Я предполагаю, что это связано с тем, что консоль Windows не принимает символы только для Юникода. Каков наилучший способ? Есть ли способ заставить Python автоматически печатать ? вместо того, чтобы потерпеть неудачу в этой ситуации? Изменить: […]

Каков наилучший способ удаления акцентов в строке юникода Python?

У меня есть строка Unicode в Python, и я хотел бы удалить все акценты (диакритики). Я нашел в Интернете элегантный способ сделать это в Java: преобразовать строку Unicode в ее длинную нормированную форму (с отдельным символом для букв и диакритики) удалить все символы, тип Unicode которых «диакритический». Нужно ли устанавливать библиотеку, такую ​​как pyICU, или […]

Преобразование строки Unicode в строку в Python (содержащий дополнительные символы)

Как вы преобразовываете строку Unicode (содержащую дополнительные символы, такие как £ $ и т. Д.) В строку Python?

UnicodeEncodeError: кодек ascii не может кодировать символ u '\ xa0' в позиции 20: порядковый номер не в диапазоне (128)

У меня проблемы с символами юникода из текста, полученного с разных веб-страниц (на разных сайтах). Я использую BeautifulSoup. Проблема в том, что ошибка не всегда воспроизводима; он иногда работает с некоторыми страницами, а иногда и с помощью barfs, бросая UnicodeEncodeError . Я пробовал все, о чем я могу думать, и все же я не нашел […]

Печать в терминале цветами с использованием Python?

Как я могу выводить цветной текст на терминал, в Python? Каков наилучший символ Юникода для представления сплошного блока?

Python - лучший язык программирования в мире.