Python: List vs Dict для поиска таблицы

У меня есть около 10 миллионов значений, которые мне нужно добавить в какую-то таблицу поиска, поэтому мне было интересно, какой из них будет более эффективным? Я знаю, что вы можете сделать что-то подобное для обоих: if something in dict_of_stuff: pass а также if something in list_of_stuff: pass Моя мысль – это дикт, который будет быстрее […]

Получить MD5-хэш больших файлов в Python

Я использовал hashlib (который заменяет md5 в Python 2.6 / 3.0), и он отлично работал, если я открыл файл и поместил его содержимое в hashlib.md5() . Проблема заключается в очень больших файлах, размер которых может превышать объем оперативной памяти. Как получить хэш MD5 файла без загрузки всего файла в память?

проверьте, идентичны ли все элементы в списке

Мне нужна следующая функция: Вход : list Выход : True если все элементы в списке ввода оцениваются как равные друг другу с помощью стандартного оператора равенства; False противном случае. Производительность : конечно, я предпочитаю не брать лишние накладные расходы. Я считаю, что было бы лучше: перебирать список сравнить соседние элементы и AND все полученные булевы […]

В чем разница между dict.items () и dict.iteritems ()?

Существуют ли какие-либо применимые различия между dict.items() и dict.iteritems() ? Из документов Python: dict.items() : возвращает копию списка словарей (пары ключ, значение). dict.iteritems() : возвращает итератор по парам словаря (ключ, значение). Если я запустил код ниже, каждый, похоже, вернет ссылку на тот же объект. Есть ли какие-то тонкие различия, которые мне не хватает? #!/usr/bin/python d={1:'one',2:'two',3:'three'} […]

Дата составления с часовым поясом из электронной почты?

Я пытаюсь получить дату из письма. Сначала это легко: message = email.parser.Parser().parse(file) date = message['Date'] print date и я получаю: 'Mon, 16 Nov 2009 13:32:02 +0100' Но мне нужен хороший объект datetime, поэтому я использую: datetime.strptime('Mon, 16 Nov 2009 13:32:02 +0100', '%a, %d %b %Y %H:%M:%S %Z') который вызывает ValueError, since %Z isn't format for […]

перестановки с уникальными значениями

itertools.permutations генерирует, где его элементы рассматриваются как уникальные, основанные на их позиции, а не на их значении. Поэтому в основном я хочу избежать дубликатов: >>> list(itertools.permutations([1, 1, 1])) [(1, 1, 1), (1, 1, 1), (1, 1, 1), (1, 1, 1), (1, 1, 1), (1, 1, 1)] Фильтрация впоследствии невозможна, потому что количество перестановок слишком велико […]

Должен ли я поставить #! (shebang) в сценариях Python и какую форму он должен принять?

Должен ли я помещать shebang в мои скрипты Python? В какой форме? #!/usr/bin/env python или #!/usr/local/bin/python Являются ли они одинаково переносимыми? Какая форма используется больше всего? Примечание: проект торнадо использует shebang. С другой стороны, проект Django этого не делает.

Регулярное выражение Python соответствует всему слову

У меня возникли проблемы с поиском правильного регулярного выражения для сценария ниже: Давайте скажем: a = "this is a sample" Я хочу совместить целое слово – например, матч "hi" должен возвращать False, так как "hi" не является словом, а "is" должен возвращать True, так как альфа-символ слева и справа отсутствует.

Django FileField с upload_to определяется во время выполнения

Я пытаюсь настроить свои загрузки таким образом, что если пользователь joe загружает файл, он переходит к MEDIA_ROOT / joe, а не к файлам всех, которые идут в MEDIA_ROOT. Проблема в том, что я не знаю, как определить это в модели. Вот как это выглядит в настоящее время: class Content(models.Model): name = models.CharField(max_length=200) user = models.ForeignKey(User) […]

Можно ли изменить строки в файле на месте?

Можно ли анализировать файл по строкам и редактировать строку на месте при прохождении строк?

Python - лучший язык программирования в мире.