Tag: unicode

Латинские символы Python и Unicode

У меня есть древовидная структура, в которой ключевые слова могут содержать некоторые латинские символы. У меня есть функция, которая пересекает все листья дерева и добавляет каждое ключевое слово в список при определенных условиях. Вот код, который у меня есть для добавления этих ключевых слов в список: print "Adding: " + self.keyword leaf_list.append(self.keyword) print leaf_list Если […]

Pygame – компиляция exe с Cx_Freeze

Я пытаюсь преобразовать свою игру pygame в exe с Cx_freeze; Он отлично работает, когда я запускаю его из сценария, но когда я запускаю его как exe, он выходит из строя с помощью: Traceback (most recent call last): File "C:\Python32\lib\site-packages\pygame\__init__.py", line 122, in <module> try: import pygame.display File "ExtensionLoader_pygame_display.py", line 12, in <module> File "ExtensionLoader_pygame_surface.py", line […]

Печать строки unicode в python независимо от среды

Я пытаюсь найти общее решение для печати строк юникода из сценария python. Требования заключаются в том, что он должен работать как на python 2.7, так и на 3.x на любой платформе и с любыми настройками терминала и переменными среды (например, LANG = C или LANG = en_US.UTF-8). Функция печати python автоматически пытается кодировать терминальную кодировку […]

chr () эквивалент, возвращающий объект байтов, в py3k

Python 2.x имеет chr() , который преобразует число в диапазоне 0-255 в строку байта с одним символом с этим числовым значением и unichr() , которое преобразует число в диапазоне 0-0x10FFFF в строку Unicode с одним символом с этим кодом Unicode. Python 3.x заменяет unichr() на chr() , в соответствии со своей политикой «Unicode strings default», […]

Python – Как изменить байты в файле

Я делаю программу шифрования, и мне нужно открыть файл в двоичном режиме для доступа к не-ascii и непечатаемым символам, мне нужно проверить, является ли символ из файла буквой, номером, символом или непечатаемым символом. Это означает, что я должен проверять 1 на 1, если байты (когда они декодированы в ascii) соответствуют любому из этих символов: {^9,dzEV=Q4ciT+/s};fnq3BFh% […]

специфичная для платформы семантика Unicode в Python 2.7

Ubuntu 11.10: $ python Python 2.7.2+ (default, Oct 4 2011, 20:03:08) [GCC 4.6.1] on linux2 Type "help", "copyright", "credits" or "license" for more information. >>> x = u'\U0001f44d' >>> len(x) 1 >>> ord(x[0]) 128077 Windows 7: Python 2.7.2 (default, Jun 12 2011, 15:08:59) [MSC v.1500 32 bit (Intel)] on win32 Type "help", "copyright", "credits" or […]

Можно ли создать шаблон регулярного выражения Python для соответствия и замены символов Unicode, отличных от ASCII?

В следующем регулярном выражении я хотел бы, чтобы каждый символ в строке заменен на «X», но он не работает. В Python 2.7: >>> import re >>> re.sub(u"[a-zA-Z]","X","dfäg") 'XX\xc3\xa4X' или >>> re.sub("[a-zA-Z]","X","dfäg",re.UNICODE) u'XX\xe4X' В Python 3.4: >>> re.sub("[a-zA-Z]","X","dfäg") 'XXäX' Возможно ли каким-либо образом «настроить» шаблон [a-zA-Z] для соответствия «ä», «ü» и т. Д.? Если это невозможно […]

Почему json.dumps сбрасывает символы не-ascii с помощью "\ uxxxx"

В Python 2 функция json.dumps() гарантирует, что все символы без ascii будут экранированы как \uxxxx . Python 2 Json Но разве это не сбивает с толку, потому что \uxxxx является символом юникода и должен использоваться внутри строки юникода. Вывод json.dumps() – это str , которая является байтовой строкой в ​​Python 2. И, таким образом, не […]

Hack Jinja2 для кодирования с `utf-8` вместо` ascii`?

Jinja2 преобразует все переменные шаблона в юникод перед обработкой. Может ли кто-нибудь найти место, где это происходит? Проблема заключается в том, что он предполагает, что строки являются ascii , но мы (в Roundup) используем utf-8 внутренне, и наш ORM (HyperDB) автоматически восстанавливает свойства объекта utf-8 и преобразовывает их все в unicode во всех представлениях перед […]

Выровнять текст юникода в окне терминала, используя шрифт моноширин по умолчанию

Я извлекаю данные из Интернета и хочу выровнять его в таблице в окне терминала. Я могу выровнять текст в большинстве случаев, но когда текст содержит определенные символы или чужие символы, все становится беспорядочным. Как я могу обрабатывать эти символы? Вот пример проблемы с третьей строкой вывода: >>> items = "Apple tree", "Banana plant", "Orange 으르", […]

Python - лучший язык программирования в мире.