Tag: unicode

MIMEText UTF-8 кодирует проблемы при отправке электронной почты

Вот часть моего кода, который отправляет электронное письмо: servidor = smtplib.SMTP() servidor.connect(HOST, PORT) servidor.login(user, usenha) assunto = str(self.lineEdit.text()) para = str(globe_email) texto = self.textEdit.toPlainText() textos = str(texto) corpo = MIMEText(textos.encode('utf-8'), _charset='utf-8') corpo['From'] = user corpo['To'] = para corpo['Subject'] = assunto servidor.sendmail(user, [para], corpo.as_string()) Все в порядке, кроме части Субъекта. Когда я пытаюсь отправить строку со […]

Панды и юникод

Это строка, которую я получаю из pandas.DataFrame.to_json() , помещая ее в redis, вытаскивая ее из redis в другом месте и пытаясь прочитать ее через pandas.read_json() : DFJ {"args":{"0":"[]","1":"[]","2":"[]","3":"[]","4":"[]","5":"[]","6":"[]","7":"[]"},"date":{"0":1385944439000000000,"1":1385944439000000000,"2":1385944440000000000,"3":1385944440000000000,"4":1385944440000000000,"5":1385944440000000000,"6":1385944440000000000,"7":1385944440000000000},"host":{"0":"yy38.segm1.org","1":"kyy1.segm1.org","2":"yy10.segm1.org","3":"yy24.segm1.org","4":"yy24.segm1.org","5":"yy34.segm1.org","6":"yy15.segm1.org","7":"yy15.segm1.org"},"kwargs":{"0":"{}","1":"{}","2":"{}","3":"{}","4":"{}","5":"{}","6":"{}","7":"{}"},"operation":{"0":"x_gbinf","1":"x_initobj","2":"x_gobjParams","3":"gtfull","4":"x_gbinf","5":"gxyzinf","6":"deletemfg","7":"gxyzinf"},"thingy":{"0":"a13yy38","1":"a19kyy1","2":"a14yy10","3":"a14yy24","4":"a14yy24","5":"a12yy34","6":"a15yy15","7":"a15yy15"},"status":{"0":-101,"1":1,"2":-101,"3":-101,"4":-101,"5":-101,"6":1,"7":-101},"time":{"0":0.000801,"1":0.003244,"2":0.002247,"3":0.002787,"4":0.001067,"5":0.002652,"6":0.004371,"7":0.000602}} Кажется, что в нем нет юникода. Но при попытке .read_json() я получаю: Traceback (most recent call last): File "./sqlprofile.py", line 160, in <module> maybe_save_dataframes(rconn, configd, results) File […]

Литералы Unicode, которые работают в python 3 и 2

Поэтому у меня есть сценарий python, который я бы предпочел работать на python 3.2 и 2.7 только для удобства. Есть ли способ иметь литералы в Unicode, которые работают в обоих? Например #coding: utf-8 whatever = 'שלום' Вышеприведенный код потребует строку unicode в python 2.x (u ''), а в python 3.x малое «u» вызывает синтаксическую ошибку. […]

эффективно заменить плохие символы

Я часто работаю с текстом utf-8, содержащим такие символы, как: \ Xc2 \ x99 \ Xc2 \ x95 \ Xc2 \ x85 и т.д Эти персонажи путают другие библиотеки, с которыми я работаю, поэтому их нужно заменить. Каков эффективный способ сделать это, а не: text.replace('\xc2\x99', ' ').replace('\xc2\x85, '…')

UnicodeEncodeError только при работе в качестве задания cron

Моя программа работает прямо в командной строке, но когда я запускаю ее как задание cron, она сбой при ошибке: UnicodeEncodeError: 'ascii' codec can't encode character u'\xa7' in position 13: ordinal not in range(128) Он сбой в заявлении print title Почему это происходит только тогда, когда приложение работает как cron-задание? Как это можно исправить? Я попробовал […]

Как я могу проверить, содержит ли строка юникода Python незападные буквы?

У меня есть строка Unicode Python. Я хочу убедиться, что он содержит только буквы из латинского алфавита (от A до Z), а также буквы, обычно встречающиеся в европейских алфавитах, такие как ß, ü, ø, é, à и î. Он не должен содержать символы из других алфавитов (китайский, японский, корейский, арабский, кириллический, иврит и т. Д.). […]

Django: символ не-ASCII

Мой Django View / Template не способен обрабатывать специальные символы. Простой вид ниже терпит неудачу из-за. Я становлюсь ниже ошибки: Не-ASCII-символ '\ xf1' в файле " def test(request): return HttpResponse('español') Есть ли какие-то общие настройки, которые мне нужно установить? Было бы странно, если бы мне пришлось обрабатывать все строки отдельно: неамериканские буквы довольно распространены! EDIT […]

unicode и кодировка для персидского или арабского в python3

некоторый фрагмент кода: city_name = obj['city_from']['name'].encode('utf-8') print(city_name) Результат этого кода: b'\xd8\xa8\xd9\x86\xd8\xaf\xd8\xb1\xd8\xb9\xd8\xa8\xd8\xa7\xd8\xb3' и если я удаляю вывод encode ('utf-8'), измените его следующим образом: UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-7: ordinal not in range(128) этот язык вывода является персидским (например, арабским), мне интересно, почему класс string в python3 не имеет никакого метода декодирования? У […]

Поиск символов Юникода в Python

Я работаю над проектом NLP, основанным на Python / NLTK, с текстом unicode без текста. Для этого мне нужно найти строку unicode внутри предложения. Существует файл .txt, сохраненный с некоторыми неанглийскими предложениями юникода. Используя NLTK PunktSentenceTokenizer, я сломал их и сохранил в списке python. sentences = PunktSentenceTokenizer().tokenize(text) Теперь я могу перебирать список и получать каждое […]

Unicode в PowerShell с Python? Альтернативные оболочки в Windows?

Я хочу оболочку, которая поддерживает Unicode в Windows. PowerShell по мере того как корабль не кажется. PowerShell V2 (Windows 7 x64): PS C:\> powershell Windows PowerShell Copyright (C) 2009 Microsoft Corporation. All rights reserved. PS C:\> python Python 2.6.2 (r262:71605, Apr 14 2009, 22:46:50) [MSC v.1500 64 bit (AMD64)] on win32 Type "help", "copyright", "credits" […]

Python - лучший язык программирования в мире.