MultiIndex / Перестановка различий между версиями Pandas

У меня есть DataFrame, используя следующий код:

import pandas as pd import numpy as np index = pd.DatetimeIndex(['2017-05-04', '2017-05-05', '2017-05-08', '2017-05-09', '2017-05-10'], dtype='datetime64[ns]',name = 'date', freq='B') columns = pd.MultiIndex(levels=[['HSBA LN Equity', 'UCG IM Equity', 'ISP IM Equity'], ['LAST PRICE', 'HIGH', 'LOW']], labels=[[0, 0, 0, 1, 1, 1, 2, 2, 2], [0, 1, 2, 0, 1, 2, 0, 1, 2]]) data = np.array([[ 663.8, 672.5, 661.1, 15.97, 16.02, 15.49, 2.76, 2.768, 2.694], [ 658.6, 663.9, 656.0, 16.22, 16.48, 15.77, 2.842, 2.868, 2.77 ], [ 660.6, 664.1, 658.9, 16.01, 16.49, 15.94, 2.852, 2.898, 2.826], [ 664.9, 669.2, 662.5, 15.90, 16.41, 15.90, 2.848, 2.898, 2.842], [ 670.9, 673.4, 663.8, 16.09, 16.15, 15.59, 2.85, 2.888, 2.802]]) df = pd.DataFrame(data, columns=columns, index = index) 

Результат выглядит следующим образом:

  • ValueError: numpy.dtype имеет неправильный размер, попробуйте перекомпилировать
  • Что такое простая структура для тестирования времени панд и решений, связанных с numpy?
  • Значение истины серии неоднозначно. Используйте команды a.empty, a.bool (), a.item (), a.any () или a.all ()
  • Pandas: несколько столбцов в один столбец
  • Группировка ежедневных данных по месяцам в python / pandas, а затем нормализация
  • Использование pandas для выбора строк с использованием двух разных столбцов из dataframe?
  •   HSBA LN Equity UCG IM Equity \ LAST PRICE HIGH LOW LAST PRICE HIGH LOW date 2017-05-04 663.8 672.5 661.1 15.97 16.02 15.49 2017-05-05 658.6 663.9 656.0 16.22 16.48 15.77 2017-05-08 660.6 664.1 658.9 16.01 16.49 15.94 2017-05-09 664.9 669.2 662.5 15.90 16.41 15.90 2017-05-10 670.9 673.4 663.8 16.09 16.15 15.59 ISP IM Equity LAST PRICE HIGH LOW date 2017-05-04 2.760 2.768 2.694 2017-05-05 2.842 2.868 2.770 2017-05-08 2.852 2.898 2.826 2017-05-09 2.848 2.898 2.842 2017-05-10 2.850 2.888 2.802 

    Начиная с обновления до Pandas 0.20.1 от 0.19.2 когда я использую df = df.stack(0) результат выглядит следующим образом:

      HIGH LAST PRICE LOW date 2017-05-04 HSBA LN Equity 672.500 663.800 661.100 UCG IM Equity 2.768 2.760 2.694 ISP IM Equity 16.020 15.970 15.490 2017-05-05 HSBA LN Equity 663.900 658.600 656.000 UCG IM Equity 2.868 2.842 2.770 ISP IM Equity 16.480 16.220 15.770 2017-05-08 HSBA LN Equity 664.100 660.600 658.900 UCG IM Equity 2.898 2.852 2.826 ISP IM Equity 16.490 16.010 15.940 2017-05-09 HSBA LN Equity 669.200 664.900 662.500 UCG IM Equity 2.898 2.848 2.842 ISP IM Equity 16.410 15.900 15.900 2017-05-10 HSBA LN Equity 673.400 670.900 663.800 UCG IM Equity 2.888 2.850 2.802 ISP IM Equity 16.150 16.090 15.590 

    Колонки изменили порядок, и цены на акции больше не соответствуют правильным тикерам.

    Это ошибка?

  • Почему -1/2 оценивается как 0 в C ++, но -1 в Python?
  • Как получить текущую дату и время от времени отладки GPS в python
  • Pythonic способ распечатать элементы списка
  • Сгладить столбец со значением списка типов при одновременном дублировании значения другого столбца в Pandas
  • Использовать массив numpy в общей памяти для многопроцессорности
  • Как обернуть все методы класса?
  • One Solution collect form web for “MultiIndex / Перестановка различий между версиями Pandas”

    Это определенно было ошибкой, и, поскольку две мои команды сильно использовали колонки MultiIndex и укладывали их, было немного страшно. Отследил его в своем номере # 16323 и сделал PR ( # 16325 ).

    Это уже было объединено в master и будет частью выпуска исправлений 0.20.2, которое запланировано на 13 июня 2017 года.

    Python - лучший язык программирования в мире.