Tag: pandas

Python: Сплит CSV-файл в соответствии с первым символом первого столбца

У меня есть серия больших файлов CSV «basename.csv», например: B1,3,5,6 B2,2,1,5 B3,1,9,0 C1,4,7,9 C2,1,9,3 C3,8,5,2 Я хотел бы разбить их на разные файлы, например: basename_B.csv B1,3,5,6 B2,2,1,5 B3,1,9,0 basename_C.csv C1,4,7,9 C2,1,9,3 C3,8,5,2 Я уже делал подобные вещи в прошлом с циклами и ifs, но мне было интересно, есть ли более эффективный способ сделать это с […]

Почему параметры pandas в столбце dataframe изменяются автоматически?

Когда я вывел результат в CSV-файл, я создал рамку данных pandas. Но порядок столбцов dataframe менялся автоматически, мне любопытно. Почему это произошло? Изображение проблемы:

Множественная вставка многомерных данных

Я пытаюсь визуализировать многомерную модель данных, читая их из нескольких входных файлов. Я ищу простое решение для визуализации данных нескольких категорий, считываемых из нескольких входных файлов csv. Нет. Из строк в вводах от 1 до 10000 в отдельных файлах. Формат одинаковый для всех входов с четырьмя столбцами csv-файлов. Вход 1 tweetcricscore 34 51 high Вход […]

Переименование столбцов при использовании resample

Я хотел бы преобразовать годы в 4 квартала в качестве 2000q1, 2000q2, 2000q3, 2000q4 . Я использую приведенный ниже код mdf = mdf.resample('Q',axis=1).mean().rename( columns=lambda x: '{:}q{:}'.format(x.year, [1,2,3,4][x.quarter >1])) Но выход, который я получаю, – 2000q1, 2000q2, 2000q2, 2000q2 . Пожалуйста, предложите, где я буду ошибаться.

Pandas Python – может использоваться с векторизованными входами

В моем блоке данных pandas есть год, месяц и дата в первых трех столбцах. Чтобы преобразовать их в тип datetime, я использую цикл for, который пересекает каждую строку, занимая содержимое в первых трех столбцах каждой строки в качестве входных данных для функции datetime. В любом случае я могу избежать цикла for здесь и получить даты […]

Преобразование категориальных данных в рамку данных панд

У меня есть dataframe с данным типом данных (слишком много столбцов): col1 int64 col2 int64 col3 category col4 category col5 category Столбцы выглядят так: Name: col3, dtype: category Categories (8, object): [B, C, E, G, H, N, S, W] Я хочу преобразовать все значения в столбцах в целое число следующим образом: [1, 2, 3, 4, […]

Python запрещает DataFrame Pandas

Мне нужна помощь для получения pandas DataFrame из такого DataFrame (2 уровня): {u'instrument': u'EUR_USD', u'candles': [{u'complete': True, u'closeMid': 1.26549, u'highMid': 1.27026, u'lowMid': 1.25006, u'volume': 138603, u'openMid': 1.26864, u'time': u'2014-09-29T21:00:00.000000Z'}, … {u'complete': True, u'closeMid': 1.244995, u'highMid': 1.25774, u'lowMid': 1.239455, u'volume': 167259, u'openMid': 1.242075, u'time': u'2014-11-10T22:00:00.000000Z'} ] } CloseMid и значения столбцов должны быть instruments : Complete […]

Как избежать научной нотации при аннотации морской карты кластера?

У меня есть dataframe, который содержит проценты. Если я использую морское дно, чтобы сделать кластерное устройство каким-то образом, число 100 будет отображаться как 1+e01 . Есть ли способ избежать этого? Я попытался округлить проценты, прежде чем строить их, но это не влияет на сюжет.

Область получения при динамическом добавлении методов в цикл

У меня есть API для анализа моих данных упражнений (которые я очищаю веб-сайт поисковой машины ). Мой основной класс – это подкласс pandas.DataFrame , который в основном представляет собой контейнер для табличных данных. Он поддерживает индексирование по имени столбца, возвращая массив значений столбца. Я хотел бы добавить некоторые удобства, основанные на типах «фитнес-деятельности», которые присутствуют […]

Найти значения списка не в данных dataframe pandas

У меня есть список и данные dataframe для pandas, которые выглядят следующим образом: user_id = [10, 15, 20, 25, 30, 32, 40, 45, 50] user_id value 10 45 20 49 25 19' 30 58 32 48 Я пытаюсь найти список user_id не в списке. Мой желаемый результат result = [15, 40, 45, 50] Каков самый […]

Python - лучший язык программирования в мире.