Второе дополненное издание бестселлера о высокопроизводительной обработке и анализе данных
Запуск библиотеки pandas и знакомство с ее структурами данных
Представление табличных и многомерных данных
Доступ к данным внутри объекта
Выполнение операций над объектом и его содержимым
Индексация данных и работа с индексами
Применение численных методов и статистических операций
Загрузка данных, в том числе и с удаленных сервисов
Как работать с пропущенными данными
Объединение, связывание и изменение формы данных
Приведите данные в порядок!
Библиотека pandas – популярный пакет для анализа и обработки данных на языке Python. Он предлагает эффективные, быстрые, высокопроизводительные структуры данных, которые позволяют существенно упростить работу. Данная книга познакомит вас с обширным набором инструментов, предлагаемых библиотекой pandas, – начиная с обзора загрузки данных с удаленных источников, выполнения численного и статистического анализа, индексации, агрегации и заканчивая визуализацией данных и анализом финансовой информации.
Во второе издание добавлены новые приложения, посвященные предварительной подготовке данных и настройке гиперпараметров, работе с датами, строками и предупреждениями. Подробно освещены алгоритмы случайного леса, градиентного бустинга CatBoost и логистической регрессии.
Издание предназначено всем разработчикам на языке Python, интересующимся обработкой данных.