Tag: unicode

Преобразование Unicode в UTF-8 Python

Я работаю с базой данных, которая на ней разбросала такие символы: â € ™. Мне нужно взять это из базы данных, конвертировать в UTF-8, а затем импортировать в другую базу данных, используя python. При печати в командной строке Windows эти символы выглядят следующим образом: \ xe2 \ u20ac \ u2122. Я попробовал различные комбинации .decode […]

Django создает CSV-файл, который содержит Unicode и может быть открыт непосредственно с помощью Excel

Я хочу создать CSV-файл через Django, который содержит данные Unicode (греческие символы), и я хочу, чтобы он был открыт непосредственно из MS Excel. В другом месте я читал об библиотеке уникодеков, и я решил использовать это. Итак, вот мое мнение; def get_csv (request, id): response = HttpResponse (mimetype = 'text / csv') response ['Content-Disposition'] = […]

напечатать символ UTF-8 в Python 2.7

Вот как я открываю, читаю и выводю. Файл представляет собой кодированный UTF-8 файл для символов Unicode. Я хочу напечатать первые 10 символов UTF-8, но вывод снизу фрагмента кода печатает 10 странных нераспознанных символов. Интересно, есть ли у кого-нибудь идеи, как правильно печатать? Благодарю. with open(name, 'r') as content_file: content = content_file.read() for i in range(10): […]

Как читать изображение с пути с символами Unicode?

У меня есть следующий код, и он терпит неудачу, потому что он не может прочитать файл с диска. Изображение всегда None . # -*- coding: utf-8 -*- import cv2 import numpy bgrImage = cv2.imread(u'D:\\ö\\handschuh.jpg') Примечание. Мой файл уже сохранен как UTF-8 с спецификацией. Я проверил с помощью Notepad ++. В Process Monitor я вижу, что […]

Показывать не ascii (японский) персонажей в легенде сюжета панд

Если я это сделаю: import pandas as pd pd.DataFrame( data=nr.random( (2,2) ), columns=[u'é',u'日本'] ).plot() Результат: Итак, é появляется, но не 日本 . После того, как вы немного matplotlib , я нашел эту страницу, которая, похоже, дает решение для matplotlib . Я загрузил файл шрифта здесь и получил его для работы с matplotlib : import matplotlib.font_manager […]

Печать Python не использует __repr__, __unicode__ или __str__ для юникодного подкласса?

Печать Python не использует __repr__ , __unicode__ или __str__ для моего юникодного подкласса при печати. Какие-нибудь подсказки относительно того, что я делаю неправильно? Вот мой код: Использование Python 2.5.2 (r252: 60911, 13 октября 2009, 14:11:59) >>> class MyUni(unicode): … def __repr__(self): … return "__repr__" … def __unicode__(self): … return unicode("__unicode__") … def __str__(self): … return […]

В чем разница между префиксом u и префиксом unicode () в python?

В чем разница между префиксом u'' префиксом unicode() ? # -*- coding: utf-8 -*- print u'上午' # this works print unicode('上午', errors='ignore') # this works but print out nothing print unicode('上午') # error Для третьей print ошибка показывает: UnicodeDecodeError: кодек ascii не может декодировать байт 0xe4 в позиции 0 Если у меня есть текстовый файл, […]

Преобразование латинской строки в unicode в python

Я работаю o scrapy, я очистил некоторые сайты и сохранил элементы со скрипичной страницы в json-файлах, но некоторые из них содержат следующий формат. l = ["Holding it Together", "Fowler RV Trip", "S\u00e9n\u00e9gal – Mali – Niger","H\u00eatres et \u00e9tang", "Coll\u00e8ge marsan","N\u00b0one", "Lines through the days 1 (Arabic) \u0633\u0637\u0648\u0631 \u0639\u0628\u0631 \u0627\u0644\u0623\u064a\u0627\u0645 1", "\u00cdndia, Tail\u00e2ndia & Cingapura"] Я […]

Как указать диапазон символов Unicode в регулярном выражении в python?

Я пытаюсь сопоставить диапазон символов Unicode, и мне интересно, как это сделать. Я могу сопоставить простые диапазоны, такие как [a-zA-Z], но как указать диапазон символов Unicode. я пробовал [#xD8-#xF6] без везения. Есть идеи?

ReportLab: работа с символами китайского / Юникода

TL; DR: Есть ли способ сообщить ReportLab использовать конкретный шрифт и отступить к другому, если отсутствуют символы глифов для некоторых символов? Альтернативно, знаете ли вы о сжатом шрифте TrueType, который содержит глифы для всех европейских языков, иврита, русского, китайского, японского и арабского? Я создаю отчеты с ReportLab и сталкиваюсь с проблемами с строк перевода, содержащих […]

Python - лучший язык программирования в мире.