Tag: pandas

формат номера телефона в csv с использованием панд

Python / pandas n00b. У меня есть код, который обрабатывает данные событий, хранящиеся в файлах csv. Данные из df["CONTACT PHONE NUMBER"] выводят номер телефона как «5555551212.0». Очевидно, что «.0» является проблемой, но добавляется, потому что это целое число, я полагаю? Anyhoo, я решил, что я должен отформатировать номер телефона для удобства использования. Номер поступает из […]

Python pandas – pd.melt dataframe с индексом datetime приводит к NaN

У меня есть следующий dataframe (sim_2005): Date ELEM1 ELEM2 … ELEM1133 2005-01-01 0.021 2.455 … 345.2 2005-01-02 0.321 2.331 … 355.1 … … … … … 2005-12-31 0.789 3.456 … 459.9 [365 rows x 1133 columns] с Date – pandas.tseries.index.DatetimeIndex . Я преобразовал его с помощью @ ami-tavory, используя функцию pandas melt: sim_2005_melted = pd.melt(sim_2005, […]

разброс участков в морском / matplotlib с размером и цветом точки, заданной непрерывной колонкой данных

Я хотел бы сделать график рассеяния в морском / matplotlib, где размер точек определяется (непрерывным) значением в кадре данных, а цвет точек также определяется непрерывным значением другого столбца в кадре данных. В ggplot способ сделать это: ggplot(iris) + geom_point(aes(x=Sepal.Width, y=Sepal.Length, size=Petal.Width, color=Petal.Length)) (цвет / размер здесь непрерывные не категориальные значения) Каков синтаксис этого в морском […]

Как отслеживать предыдущий столбец записи даты в кадре данных pandas?

На этот вопрос ссылается этот вопрос. Я хочу выполнить некоторый анализ данных в pandas Dataframe. У меня есть один фрейм данных, как показано ниже: derived_symbol sport_name person_name city \ 0 football.RAM.mumbai.ram_count football RAM mumbai 1 football.RAM.mumbai.mum_count football RAM mumbai 2 football.RAM.delhi.mum_count football RAM delhi 3 football.RAM.delhi.ram_count football RAM delhi 4 football.RAM.mumbai.ram_count football RAM mumbai 5 […]

Как создать сюжет с текстом в виде ярлыков

Я просто знаком с matplotlib pandas и matplotlib . Можете ли вы показать мне в качестве примера, как создать сюжет, подобный этому, с matplotlib : На оси y вправо перечислены имена экземпляров данных. Ниже приведена ось x для некоторого значения, связанного с каждым экземпляром. Данные находятся в формате .csv, подобном этому: name;value1;value2 uk-2007-05;0.01;1000 В идеале, […]

Преобразование Pandas SparseDataframe в Scipy sparse csc_matrix

Я хочу преобразовать pandas SparseDataFrame в scipy.sparse.csc_matrix . Но я не хочу сначала преобразовывать его в плотную матрицу. Прямо сейчас у меня есть что-то вроде ниже. df = pd.get_dummies(df, sparse=True) В основном мне нужно, чтобы получить scipy.sparse.csc_matrix из df . Есть ли способ сделать это?

Многомерный / вложенный DataFrame / набор данных / панель в пандах

Я хотел бы сохранить некоторые многомерные данные в кадре или панели данных pandas, чтобы я мог вернуться, например: Все время для Runner A, Race A Все времена (и имена) для гонки A в течение определенного года говорят о 2015 году Пример данных будет выглядеть примерно так, обратите внимание, что не все бегуны будут иметь данные […]

Pandas df в редактируемом QTableView: снимите флажки

У меня есть рамка данных pandas, которую я хотел бы представить в QtableView и сделать ее доступной для редактирования. Я создал модель ниже, но по какой-то причине выход имеет флажки в каждом поле. Как я могу избавиться от них? Вывод выглядит следующим образом: И это та модель, которая используется, чтобы сделать фрейм данных pandas, показанный […]

Как импортировать таблицу с заголовками в фрейм данных с помощью модуля pandas

Я пытаюсь получить информацию из таблицы в Интернете, как показано ниже. Я использую jupyter ноутбук с python 2.7. Я хочу использовать эту информацию в Panda module в качестве фрейма данных. Но когда ı скопируйте таблицу с заголовками таблицы, а затем используйте команду read_clipboard, я вижу ошибку, как показано ниже ссылки в таблице. Но без заголовков […]

Быстрая numpy roll_product

Мне нужна функция roll_product или функция expand_product. Существуют различные функции pandas rolling_XXXX и rolling_XXXX , но я был удивлен, обнаружив отсутствие функции rolling_XXXX expanding_product() . Чтобы получить работу, я использовал эту довольно медленную альтернативу pd.expanding_apply(temp_col, lambda x : x.prod()) Мои массивы часто имеют 32 000 элементов, поэтому это оказывается немного узким местом. У меня возникло […]

Python - лучший язык программирования в мире.