Машинное обучение стало неотъемлемой частью различных коммерческих и исследовательских проектов, начиная от постановки медицинского диагноза c последующим лечением и заканчивая поиском друзей в социальных сетях. Многие полагают, что машинное обучение могут использовать только крупные компании, обладающие мощными командами аналитиков. В этой книге авторы Андреас Мюллер и Сара Гвидо хотят показать вам, с какой легкостью можно самостоятельно построить модели машинного обучения, и рассказать, как это сделать. Прочитав эту книгу, вы сможете построить свою собственную систему машинного обучения, которая позволит выяснить настроения пользователей Твиттера или получить прогнозы по поводу глобального потепления. Область применения машинного обучения безгранична и, учитывая все многообразие данных, имеющихся на сегодняшний день, ограничивается лишь вашим воображением. Данная книга адресована действующим и начинающим специалистам по машинному обучению, решающим реальные задачи.
Эта книга является вводной и не требует предварительных знаний в области машинного обучения или искусственного интеллекта. Вы сосредоточитесь на использовании языка Python и библиотеки scikit-learn, рассмотрите все этапы создания успешного проекта по машинному обучению. Методы, которые будут затронуты, пригодятся ученым и исследователям, а также специалистам по анализу данных, работающим в различных коммерческих сферах. Вы получите максимальную отдачу от книги, если хотя бы немного знакомы с языком Python и библиотеками NumPy и matplotlib.
Книга организована примерно следующим образом. В главе 1 кратко рассказывается об основных понятиях машинного обучения и сферах его применения, а также описана установка основных библиотек, которые мы будем использовать на протяжении всей книги. В главах 2 и 3 освещаются актуальные алгоритмы машинного обучения, которые широко используются на практике, и обсуждаются их преимущества и недостатки. В главе 4 обсуждается важность определенного представления данных, которое можно получить с помощью алгоритмов машинного обучения, а также рассказывается о том, какие аспекты данных требуют внимания. В главе 5 освещаются передовые методы, предназначенные для оценки качества модели и настройки параметров, при этом особое внимание уделено перекрестной проверке и решетчатому поиску. В глава 6 излагаются принципы построения конвейеров для связывания моделей в единую цепочку и инкапсуляции рабочего потока. В главе 7 рассказывается о том, как применять методы, описанные в предыдущих главах, к текстовым данным, а также кратко описываются некоторые методы обработки текста. В главе 8 дается общий обзор различных аспектов машинного обучения.
В архив с электронным изданием книги добавлено содержимое компакт-диска, который шел в комплекте с бумажным изданием книги.
Название: Введение в машинное обучение с помощью Python+CD Автор: Андреас Мюллер, Сара Гвидо Язык: Русский Издательство: Вильямс Жанр: Компьютерная литература Год выхода: 2017 Формат: pdf Страниц: 480