Tag: pandas

Каков наиболее эффективный способ прокрутки данных с помощью панд?

Я хочу последовательно выполнять свои собственные сложные операции с финансовыми данными в dataframes. Например, я использую следующий файл MSFT CSV, взятый из Yahoo Finance : Date,Open,High,Low,Close,Volume,Adj Close 2011-10-19,27.37,27.47,27.01,27.13,42880000,27.13 2011-10-18,26.94,27.40,26.80,27.31,52487900,27.31 2011-10-17,27.11,27.42,26.85,26.98,39433400,26.98 2011-10-14,27.31,27.50,27.02,27.27,50947700,27.27 …. Затем я делаю следующее: #!/usr/bin/env python from pandas import * df = read_csv('table.csv') for i, row in enumerate(df.values): date = df.index[i] open, high, […]

добавить одну строку в pandas.DataFrame

Я понимаю, что pandas предназначен для загрузки полностью заполненного DataFrame но мне нужно создать пустой DataFrame, а затем добавить строки один за другим . Каков наилучший способ сделать это? Я успешно создал пустой DataFrame с: res = DataFrame(columns=('lib', 'qty1', 'qty2')) Затем я могу добавить новую строку и заполнить поле: res = res.set_value(len(res), 'qty1', 10.0) Он […]

Создайте Pandas DataFrame из txt-файла с определенным шаблоном

Мне нужно создать Pandas DataFrame на основе текстового файла на основе следующей структуры: Alabama[edit] Auburn (Auburn University)[1] Florence (University of North Alabama) Jacksonville (Jacksonville State University)[2] Livingston (University of West Alabama)[2] Montevallo (University of Montevallo)[2] Troy (Troy University)[2] Tuscaloosa (University of Alabama, Stillman College, Shelton State)[3][4] Tuskegee (Tuskegee University)[5] Alaska[edit] Fairbanks (University of Alaska Fairbanks)[2] […]

Как бороться с SettingWithCopyWarning в Pandas?

Задний план Я просто обновил свои Pandas с 0.11 до 0.13.0rc1. Теперь приложение выдает много новых предупреждений. Один из них: E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_index,col_indexer] = value instead quote_df['TVol'] = quote_df['TVol']/TVOL_SCALE Я хочу знать, что именно это означает? Нужно […]

В чем разница между размером и количеством в пандах?

Это разница между groupby("x").count groupby("x").size и groupby("x").size в пандах? Размер просто исключает ноль?

Как сделать хорошие воспроизводимые примеры панд

Проведя приличное количество времени, наблюдая как теги r, так и pandas на SO, создается впечатление, что вопросы, связанные с pandas , с меньшей вероятностью содержат воспроизводимые данные. Это то, что сообщество R было довольно хорошо поощряло, и благодаря таким путеводителям новички могут получить некоторую помощь по составлению этих примеров. Люди, которые могут читать эти руководства […]

Выберите строки из DataFrame на основе значений в столбце в пандах

Как выбрать строки из DataFrame на основе значений в некоторых столбцах в пандах? В SQL я бы использовал: select * from table where colume_name = some_value. Я попытался посмотреть документацию pandas, но не сразу нашел ответ.

Переименование столбцов в пандах

У меня есть таблица данных, использующая метки панды и столбцы, которые мне нужно редактировать, чтобы заменить исходные метки столбцов. Я хотел бы изменить имена столбцов в таблице данных A где имена исходных столбцов: ['$a', '$b', '$c', '$d', '$e'] в ['a', 'b', 'c', 'd', 'e']. У меня есть отредактированные имена столбцов, которые хранятся в списке, но […]

«Большие данные» работают с использованием панд

Я пытался много раз продумать ответ на этот вопрос, изучая панды. Я использую SAS для моей повседневной работы, и это отлично подходит для его внеочередной поддержки. Однако SAS является ужасным как часть программного обеспечения по многим другим причинам. Однажды я надеюсь заменить мое использование SAS на python и pandas, но в настоящее время мне не […]

Фильтрация строк данных данных, если значение в столбце указано в списке значений

У меня есть Python pandas DataFrame rpt : rpt <class 'pandas.core.frame.DataFrame'> MultiIndex: 47518 entries, ('000002', '20120331') to ('603366', '20091231') Data columns: STK_ID 47518 non-null values STK_Name 47518 non-null values RPT_Date 47518 non-null values sales 47518 non-null values Я могу фильтровать строки, чей '600809' следующим образом: rpt[rpt['STK_ID'] == '600809'] <class 'pandas.core.frame.DataFrame'> MultiIndex: 25 entries, ('600809', '20120331') […]

Python - лучший язык программирования в мире.