Классификация, регрессия и другие алгоритмы Data Mining с использованием R — Описана широкая совокупность методов построения статистических моделей классификации и регрессии для отклика, представленного в альтернативной, категориальной и метрической шкалах наблюдений. Подробно рассматириваются деревья решений, машины опорных векторов с различными разделяющими поверхностями, нелинейные формы дискриминантного анализа, искусственные нейронные сети и т.д. Показана технология применения таких методов бутстреп-агрегирования деревьев решений как бэггинг (bagging), случайный лес (random forrest) и бустинг (boosting). Представлены различные методы построения ансамблей моделей для коллективного прогнозирования. Особое внимание уделяется сравнительной оценке эффективности и поиску оптимальных областей гипер-параметров тестируеных моделей с использованием пакета caret статистической среды R. Рассматриваются такие алгоритмы Data Mining, как генерация ассоциативных правил и анализ последовательностей. Отдельные главы посвящены методам построения моделей многомерной ординации данных и различным алгоритмам кластерного анализа. Описание методов статистического анализа неизменно сопровождается иллюстрациями на примерах из различных областей на основе общедоступных исходных данных. Представлены тексты несложных скриптов в кодах R, дающие возможность читателям легко воспроизвести самим технику выполнения расчетов. Предполагается, что читатель знаком с языком и особенностями работы в статистической среде R. Книга может быть использована в качестве учебного пособия по статистическим методам для студентов и аспирантов высших учебных заведений.
Название: Классификация, регрессия и другие алгоритмы Data Mining с использованием R Автор: Шитиков В. К., Мастицкий С. Э. Издательство: Тольятти [б. и.] Год: 2017 Страниц: 351 Формат: PDF