Tag: pandas

Перенос панд внутри кадра данных

Теперь у меня есть данные: animal age count dogs 1 49 2 134 3 147 4 154 cats 1 189 2 254 3 259 4 261 Я хотел бы преобразовать возрастную колонку в 4 возрастных столбца для каждого возраста: animal age1 age2 age3 age4 dogs 49 134 147 154 cats ……………….. Я пробовал df.T и […]

используя «OR» для выбора данных в пандах

У меня есть dataframe значений, и я хотел бы изучить строки, которые являются выбросами. Я написал функцию ниже, которую можно вызвать с помощью функции groupby().apply() и она отлично работает для высоких или низких значений, но когда я хочу объединить их вместе, я генерирую ошибку. Я как-то испортил логический выбор OR но я мог найти документацию […]

Python Pandas преобразует тип данных столбца

Я знаю, что на такой вопрос задавали два типа, но до сих пор мне не удалось найти ответ на этот вопрос. Я присоединился к двум файлам .csv вместе с Pandas, и теперь я хотел бы добавить еще несколько столбцов в новый объединенный CSV-файл, а значения вычисляются на основе уже доступных данных. Тем не менее, я […]

Как я могу настроить свой код, чтобы он совместим с Microsoft Excel?

проблема Я пытался реализовать веб-API (на основе Flask ), который будет использоваться для запроса базы данных с учетом некоторых конкретных условий, восстановления данных и, наконец, экспорта результата в CSV- файл. Поскольку объем данных действительно действительно огромный, я не могу построить весь набор данных и сгенерировать CSV- файл сразу (например, создать DataFrame с помощью pandas и, […]

Чтение части большого файла xlsx с помощью python

У меня большой файл .xlsx с 1 миллионом строк. Я не хочу открывать весь файл за один раз. Мне было интересно, могу ли я прочитать фрагмент файла, обработать его, а затем прочитать следующий фрагмент? (Я предпочитаю использовать для этого панды).

Сравните словари с несмешиваемыми или несравнимыми значениями? (например, списки или данные)

TL; DR: Как вы можете сравнить два словаря python, если некоторые из них имеют значения, которые не подвержены изменению / изменяемости (например, списки или панд-данные)? Мне нужно сравнить словарные пары для равенства. В этом смысле этот вопрос аналогичен этим двум, но их решения, похоже, работают только на неизменные объекты … Есть ли лучший способ сравнить […]

Генерирование гистограмм в стеке для одних и тех же строк в двух разных кадрах данных с использованием matplotlib в python

У меня есть 2 кадра данных: Opposition Result GameType Count Afghanistan won Set 1 Australia won Set 10 Bangladesh won Set 15 Bermuda won Set 1 Canada won Set 1 England won Set 15 India won Set 17 Ireland won Set 3 Kenya won Set 1 Netherlands won Set 3 New Zealand won Set 13 […]

Извлечение дат в разных форматах с использованием регулярных выражений и их сортировка – панды

Я новичок в разработке текста, и мне нужно извлечь даты из файла * .txt и отсортировать их. Даты между предложениями (каждая строка) и их формат могут быть следующими: 04/20/2009; 04/20/09; 4/20/09; 4/3/09 Mar-20-2009; Mar 20, 2009; March 20, 2009; Mar. 20, 2009; Mar 20 2009; 20 Mar 2009; 20 March 2009; 20 Mar. 2009; 20 […]

Pandas boolean Неопределенность выбора DataFrame

EDIT: фиксированные значения в таблицах. Предположим, у меня есть pandas dataframe df: >>>df abc 0 0.016367 0.289944 -0.891527 1 1.130206 0.899758 -0.276587 2 1.390528 -1.472802 0.128979 3 0.023598 -0.931329 0.158143 4 1.401183 -0.162357 -0.959156 5 -0.127765 1.142039 -0.734434 Итак, теперь я пытаюсь выполнить булевское индексирование: >>>df[df > 0.5] abc 0 NaN NaN Nan 1 1.130206 […]

python, pd.read_csv рискованный импорт

Мне нужно импортировать pd.read_csv повторный импорт, поскольку в первый раз я импортирую node_t1 = pd.read_csv('5mins/nodes/N122') node_t2 = pd.read_csv('10mins/nodes/N122') node_t3 = pd.read_csv('15mins/nodes/N122') но мне нужно импортировать # раз как N1, N2, …, N121, N122 как второй раз: node_t1 = pd.read_csv('5mins/nodes/N121') node_t2 = pd.read_csv('10mins/nodes/N121') node_t3 = pd.read_csv('15mins/nodes/N121') и так далее. Другой вопрос, как вы можете видеть в […]

Python - лучший язык программирования в мире.