Tag: pandas

Как извлечь числовые диапазоны из 2 столбцов, содержащих числовые последовательности, и напечатать диапазон из обоих столбцов (разные значения прироста)?

Я в курсе изучения python и pandas (этот вопрос основан на четкой записи, но с дополнительным запросом); на данный момент есть 2 столбца, содержащие числовые последовательности (восходящие и / или убывающие), как описано ниже: Col 1: (числовой инкремент col1 и / или декремент = 1) 1 2 3 5 7 8 9 Col 2: (числовое […]

Панды: добавление столбца с вычислениями из других столбцов

У меня есть csv с измерениями: YY-MO-DD HH-MI-SS_SSS | x | y 2015-12-07 20:51:06:608 | 2 | 4 2015-12-07 20:51:07:609 | 3 | 4 и я хочу добавить еще один столбец с квадратным корнем из суммы x ^ 2 + y ^ 2, z = sqrt (x ^ 2 + y ^ 2) как это: […]

Метод pandas.DataFrame corrwith ()

Недавно я начал работать с pandas . Может ли кто-нибудь объяснить мне разницу в поведении функции .corrwith() с помощью Series и DataFrame ? Предположим, у меня один DataFrame : frame = pd.DataFrame(data={'a':[1,2,3], 'b':[-1,-2,-3], 'c':[10, -10, 10]}) И я хочу рассчитать корреляцию между функциями «a» и всеми другими функциями. Я могу сделать это следующим образом: frame.drop(labels='a', […]

изменить pandas 0.13.0 "print dataframe" для печати данных, как в предыдущих версиях

В новой версии 0.13.0 из pandas, dataframe df печатается в одном длинном списке чисел, используя df или print df вместо обзора, как и раньше, который теперь возможен только при использовании df.info() Можно ли изменить команду «df» или «print df» по умолчанию: In [12]: df.info() <class 'pandas.core.frame.DataFrame'> DatetimeIndex: 4319 entries, 2010-02-18 00:00:00 to 2010-03-13 23:15:00 Data […]

Pandas: SettingWithCopy Предупреждение:

Я попробовал следующий код для преобразования столбца в «date»: df.['DATE'] = pd.to_datetime(df['DATE']) или df.DATE = pd.to_datetime(df.DATE) но я получаю следующую ошибку: /Users/xyz/anaconda3/envs/sensor/lib/python3.6/site-packages/pandas/core/indexing.py:517: SettingWithCopyWarning: значение пытается быть установлено на копии среза из DataFrame. Попробуйте вместо этого использовать .loc [row_indexer, col_indexer] = значение См. Оговорки в документации: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy self.obj [item] = s Я изменил код на следующее: […]

Как добавить две серии в dataframe Row wise

У меня две серии maxRow Out[160]: var#0 2.175999 var#1 1.016451 var#2 0.705303 var#3 1.842707 var#4 1.196601 var#5 2.162564 var#6 1.350877 var#7 0.453014 var#8 2.144554 obj#0 445537.407762 Name: 9, dtype: float64 minRow Out[161]: var#0 2.593331 var#1 1.990545 var#2 2.011221 var#3 1.349357 var#4 2.808741 var#5 0.890439 var#6 1.275528 var#7 1.658743 var#8 2.343061 obj#0 51386.375391 Name: 10, dtype: […]

как применить функцию к нескольким столбцам в кадре данных pandas за один раз

Я часто имею дело с данными, которые плохо отформатированы (поля Ie числа не согласованы и т. Д.), Могут быть и другие способы, о которых я не знаю, но способ форматирования одного столбца в фреймворке данных – это использование функции и отображение столбца в эту функцию. format = df.column_name.map(format_number) Вопрос: 1 – что, если у меня […]

Dataframe в массив numpy со значениями, разделенными запятыми

Сценарий Я прочитал csv (который является \ t разделенным) в Dataframe, который теперь необходим для того, чтобы быть в формате numpy array для кластеризации без изменения типа Проблема Что касается проверенных ссылок (ниже), я не смог получить результат по мере необходимости. Значения двух столбцов, которые я пытаюсь извлечь, – это int64 / float64, как показано […]

Python Pandas Создание нескольких данных из списка

Используя это как быструю отправную точку; http://pandas.pydata.org/pandas-docs/stable/reshaping.html In [1]: df Out[1]: date variable value 0 2000-01-03 A 0.469112 1 2000-01-04 A -0.282863 2 2000-01-05 A -1.509059 3 2000-01-03 B -1.135632 4 2000-01-04 B 1.212112 5 2000-01-05 B -0.173215 6 2000-01-03 C 0.119209 7 2000-01-04 C -1.044236 8 2000-01-05 C -0.861849 9 2000-01-03 D -2.104569 10 […]

Панды на OpenShift v3

Теперь, когда OpenShift Online V2 объявила о завершении службы, я хочу перенести приложение Python на OpenShift Online V3, aka OpenShift NextGen. Pandas – это требование (и указано в requirements.txt ) Уже было нетривиальным, чтобы установить pandas в v2, но V3 не разрешает ручное взаимодействие в процессе сборки (или делает это?). Когда я пытаюсь создать свое […]

Python - лучший язык программирования в мире.