Tag: unicode

Как использовать символы Unicode с PIL?

Я хотел бы добавить русский текст к изображению. Я использую PIL 1.1.7 и Python 2.7 на компьютере Windows. Поскольку PIL скомпилирован без библиотеки libfreetype , я использую следующее на сервере разработки: font_text = ImageFont.load('helvR24.pil') draw.text((0, 0), 'Текст на русском', font=font_text) ( helvR24.pil взято из http://effbot.org/media/downloads/pilfonts.zip ) В рабочей среде я делаю следующее: font_text = ImageFont.truetype('HelveticaRegular.ttf', […]

subprocess.Popen с помощью пути unicode

У меня есть имя файла в unicode, которое я хотел бы открыть. Следующий код: cmd = u'cmd /c "C:\\Pok\xe9mon.mp3"' cmd = cmd.encode('utf-8') subprocess.Popen(cmd) возвращается >>> 'C:\Pokיmon.mp3' is not recognized as an internal or external command, operable program or batch file. даже если файл существует. Почему это происходит?

Python: как перенести файл с файлом unicode в папку юникода

У меня ад с перемещением unicode с именем file между unicode именованными папками в скрипте Python под Windows … Какой синтаксис вы бы использовали, чтобы найти все файлы типа * .ext в папке и перенести их в относительное местоположение? Предположим, что файлы и папки являются unicode.

BeautifulSoup дает мне unicode + html символы, а не прямо вверх юникод. Это ошибка или непонимание?

Я использую BeautifulSoup для очистки веб-сайта. Страница веб-сайта отлично отображается в моем браузере: Доклад Oxfam International, озаглавленный «Офсайд! http://www.coopamerica.org/programs/responsibleshopper/company.cfm?id=271 В частности, одинарная и двойная кавычки выглядят отлично. Они выглядят html-символами, а не ascii, хотя странно, когда я рассматриваю источник в FF3, они кажутся нормальными ascii. К сожалению, когда я царапаю, я получаю что-то вроде этого […]

Как эти строки представлены внутри интерпретатора Python? Я не понимаю

# -*- coding: utf-8 -*- a = 'éáűőúöüó€' print type(a) # <type 'str'> print a # éáűőúöüó€ print ord(a[-1]) # 172 Почему это работает? Не должно быть этого SyntaxError: Non-ASCII character '\xc3' in file … ? В строке есть литералы unicode. Когда я префикс его с u , результаты разные: # -*- coding: utf-8 -*- […]

Unescaping Characters в строке с Python

Я сделал запрос JSON, который дает мне строку, которая использует коды символов Unicode, которые выглядят так: s = "\u003Cp\u003E" И я хочу преобразовать его в: s = "<p>" Каков наилучший способ сделать это в Python? Обратите внимание: это тот же вопрос, что и этот , только в Python, кроме Ruby. Я также использую Posterous API […]

как декодировать символ un unicode в python?

У меня строка: s = 'Chocolate Moelleux-M\xe8re' Когда я делаю: In [14]: unicode(s) ————————————————————————— UnicodeDecodeError Traceback (most recent call last) UnicodeDecodeError: 'ascii' codec can't decode byte 0xe8 in position 20: ordinal not in range(128) Аналогично, когда я пытаюсь декодировать это, используя s.decode() он возвращает ту же ошибку. In [13]: s.decode() ————————————————————————— UnicodeDecodeError Traceback (most recent […]

Как получить надежный счет символа Юникода в Python?

Google App Engine использует Python 2.5.2, видимо, с поддержкой UCS4. Но хранилище данных GAE использует UTF-8 внутренне. Поэтому, если вы храните u '\ ud834 \ udd0c' (длина 2) в хранилище данных, когда вы его извлекаете, вы получаете '\ U0001d10c' (длина 1). Я пытаюсь подсчитать количество символов Юникода в строке таким образом, чтобы дать тот же […]

Как писать русские символы в файле?

В консоли, когда я пытаюсь выводить русских символов, это дает мне ??????????????? Кто знает, почему? Я попытался написать в файл – в этом случае такая же ситуация. например f=open('tets.txt','w') f.write('some russian text') f.close внутри файла – ????????????????????????? / или p="some russian text" print p ????????????? В дополнительном блокноте не разрешается сохранять файл с русскими буквами. […]

Преобразование Unicode в UTF-8 Python

Я работаю с базой данных, которая на ней разбросала такие символы: â € ™. Мне нужно взять это из базы данных, конвертировать в UTF-8, а затем импортировать в другую базу данных, используя python. При печати в командной строке Windows эти символы выглядят следующим образом: \ xe2 \ u20ac \ u2122. Я попробовал различные комбинации .decode […]

Python - лучший язык программирования в мире.