Tag: pandas

Pandas: как использовать функцию apply для нескольких столбцов

У меня есть некоторые проблемы с функцией применения Pandas при использовании нескольких столбцов со следующим фреймворком данных df = DataFrame ({'a' : np.random.randn(6), 'b' : ['foo', 'bar'] * 3, 'c' : np.random.randn(6)}) и следующая функция def my_test(a, b): return a % b Когда я пытаюсь применить эту функцию, выполните следующие действия: df['Value'] = df.apply(lambda row: […]

Объедините два столбца текста в dataframe в pandas / python

У меня есть 20 x 4000 фрейм данных в python с использованием pandas. Две из этих столбцов называются Год и квартал. Я хотел бы создать переменную, называемую периодом, которая делает Year = 2000 и quarter = q2 в 2000q2 Может ли кто-нибудь помочь с этим?

python pandas: применить функцию с аргументами к ряду

Я хочу применить функцию с аргументами к серии в python pandas: x = my_series.apply(my_function, more_arguments_1) y = my_series.apply(my_function, more_arguments_2) … В документации описывается поддержка метода apply, но он не принимает никаких аргументов. Есть ли другой метод, который принимает аргументы? В качестве альтернативы, я пропустил простой обходной путь?

Значения Remap в столбце pandas с dict

У меня есть словарь, который выглядит так: di = {1: "A", 2: "B"} Я хотел бы применить его к столбцу «col1» в кадре данных, подобном: col1 col2 0 wa 1 1 2 2 2 NaN получить: col1 col2 0 wa 1 A 2 2 B NaN Как я могу это сделать? По какой-то причине условия, […]

Как применить функцию к двум столбцам кадра данных Pandas

Предположим, что у меня есть df который имеет столбцы 'ID', 'col_1', 'col_2' . И я определяю функцию: f = lambda x, y : my_function_expression . Теперь я хочу применить f к двум столбцам df « 'col_1', 'col_2' чтобы по элементам вычислить новый столбец 'col_3' , несколько похожий: df['col_3'] = df[['col_1','col_2']].apply(f) # Pandas gives : TypeError: […]

pandas + dataframe – выбор по частичной строке

У меня есть DataFrame с 4 столбцами, из которых 2 содержат строковые значения. Мне было интересно, есть ли способ выбора строк на основе частичного совпадения строк с конкретным столбцом? Другими словами, функция или лямбда-функция, которая будет делать что-то вроде re.search(pattern, cell_in_question) возвращая логическое значение. Я знаком с синтаксисом df[df['A'] == "hello world"] но, похоже, не […]

группировка строк в списке в pandas groupby

У меня есть кадр данных pandas, например: A 1 A 2 B 5 B 5 B 4 C 6 Я хочу сгруппировать по первому столбцу и получить второй столбец в виде списков в строках: A [1,2] B [5,5,4] C [6] Можно ли сделать что-то подобное, используя pandas groupby?

Pandas DataFrame: удалить ненужные части из строк в столбце

Я ищу эффективный способ удаления ненужных деталей из строк в столбце DataFrame. Данные выглядят так: time result 1 09:00 +52A 2 10:00 +62B 3 11:00 +44a 4 12:00 +30b 5 13:00 -110a Мне нужно обрезать эти данные, чтобы: time result 1 09:00 52 2 10:00 62 3 11:00 44 4 12:00 30 5 13:00 110 […]

Pandas% от общего числа с groupby

Это, очевидно, просто, но как новый новичок, я застреваю. У меня есть файл CSV, который содержит 3 столбца, состояние, идентификатор Office и Sales для этого офиса. Я хочу рассчитать процент продаж на офис в определенном состоянии (общее количество всех процентов в каждом штате составляет 100%). df = pd.DataFrame({'state': ['CA', 'WA', 'CO', 'AZ'] * 3, 'office_id': […]

Преобразование объекта Pandas GroupBy в DataFrame

Я начинаю с входных данных, подобных этому df1 = pandas.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] , "City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"] } ) Что при печати выглядит следующим образом: City Name 0 Seattle Alice 1 Seattle Bob 2 Portland Mallory 3 Seattle Mallory 4 Seattle Bob 5 […]

Python - лучший язык программирования в мире.