Tag: pandas

Python Pandas Создание нескольких данных из списка

Используя это как быструю отправную точку; http://pandas.pydata.org/pandas-docs/stable/reshaping.html In [1]: df Out[1]: date variable value 0 2000-01-03 A 0.469112 1 2000-01-04 A -0.282863 2 2000-01-05 A -1.509059 3 2000-01-03 B -1.135632 4 2000-01-04 B 1.212112 5 2000-01-05 B -0.173215 6 2000-01-03 C 0.119209 7 2000-01-04 C -1.044236 8 2000-01-05 C -0.861849 9 2000-01-03 D -2.104569 10 […]

Панды на OpenShift v3

Теперь, когда OpenShift Online V2 объявила о завершении службы, я хочу перенести приложение Python на OpenShift Online V3, aka OpenShift NextGen. Pandas – это требование (и указано в requirements.txt ) Уже было нетривиальным, чтобы установить pandas в v2, но V3 не разрешает ручное взаимодействие в процессе сборки (или делает это?). Когда я пытаюсь создать свое […]

Попытка разобрать текстовые файлы в python для анализа данных

Я делаю много анализа данных в perl, и я пытаюсь реплицировать эту работу на python, используя pandas, numpy, matplotlib и т. Д. Общий рабочий процесс выглядит следующим образом: 1) glob все файлы в каталоге 2) проанализировать файлы, поскольку они имеют метаданные 3) используйте regex для выделения соответствующих строк в заданном файле (обычно они начинаются с […]

проблемы с загрузкой данных запаса из google finance с использованием panda datareader

Вещи работали отлично до нескольких дней назад. Теперь, когда я запускаю следующее: from pandas_datareader import data symbol = 'AMZN' data_source='google' start_date = '2010-01-01' end_date = '2016-01-01' df = data.DataReader(symbol, data_source, start_date, end_date) Я получаю только самые последние данные ОДНОГО года, показанного ниже, как будто start_data и end_data, похоже, не имеют значения. Изменение их на разные […]

SQLAlchemy AttributeError: объект 'module' не имеет атрибута 'PandasSQLAlchemy'

Я пишу pandas Dataframe в базу данных Postgres: from sqlalchemy import create_engine, MetaData engine = create_engine(r'postgresql://user:password@localhost:5432/db') meta = MetaData(engine, schema='data_quality') meta.reflect(engine, schema='data_quality') pdsql = pd.io.sql.PandasSQLAlchemy(engine, meta=meta) pdsql.to_sql(dataframe, table_name) Он работал отлично, но теперь SQLAlchemy бросает следующую ошибку на 5-й строке: AttributeError: 'module' object has no attribute 'PandasSQLAlchemy' Я не уверен, что это связано, но Pandas […]

автомасштабирование в matplotlib, построение различных временных рядов на одном графике

У меня есть «главный» панда данных, который имеет временные ряды значений «полярности» для нескольких терминов. Я хочу работать с четырьмя из них, поэтому я извлек 4 отдельных кадра данных, содержащих временные ряды (одинаковые временные ряды для всех терминов, но разные значения полярности). Я построил их на 4 отдельных графиках matplotlib, используя код ниже fig, axes […]

pandas read_csv с последним столбцом, содержащим запятые

Поэтому у меня есть набор данных csv, который по моей книге хорошо сформирован, и я пытаюсь получить пакет pandas , чтобы загрузить его правильно. Заголовок состоит из 5 имен столбцов, но последний столбец состоит из объектов JSON, которые содержат неэкранированные запятые. например A,B,C,D,E 1,2,3,4,{K1:V1,K2:V2} Я загружаю свои данные с помощью простого training = pd.read_csv('data/training.dat') однако […]

Как изменить формат индекса Datetime (UTC) в Pandas?

У меня есть df, который выглядит так: 2015-01-29 08:30:00-05:00 199425 199950 199375 199825 2015-01-29 08:45:00-05:00 199825 199850 199650 199800 2015-01-29 09:00:00-05:00 199825 199900 199450 199625 Как я могу удалить -05: 00, чтобы он выглядел следующим образом ?: 2015-01-29 08:30:00 199425 199950 199375 199825 2015-01-29 08:45:00 199825 199850 199650 199800 2015-01-29 09:00:00 199825 199900 199450 199625 […]

Могу ли я хранить slicers в переменной? (Pandas / Python)

Мне просто интересно, могу ли я сделать что-то вроде: df.loc['1990':'2000'] делая что-то вроде: my_slice = '1990':'2000' df.loc[my_slice] То, что я написал, не работает, но есть ли что-то подобное?

создать биграмм из столбца в pandas df

У меня есть эта тестовая таблица в pandas dataframe Leaf_category_id session_id product_id 0 111 1 987 3 111 4 987 4 111 1 741 1 222 2 654 2 333 3 321 это продолжение моего предыдущего вопроса, на который ответил @jazrael. просмотреть ответ поэтому после получения значений в столбце product_id как (просто предположение, немного отличающееся […]

Python - лучший язык программирования в мире.