Захвачены машинным обучением - есть ли книга по ML101?

Похоже, что с машинным обучением связано так много подполей. Есть ли книга или блог, в которых дается обзор этих различных областей и того, чем занимается каждая из них, может быть, с чего начать и какие базовые знания требуются?

Ответов (13)

Решение

Вот лучшее описание машинного обучения, которое я когда-либо слышал:

На самом деле машинное обучение - это программный метод. Это способ создания программного обеспечения. Итак, он использует статистику, но в основном ... это почти как компилятор. Вы используете данные для создания программ . - Джон Платт, выдающийся ученый Microsoft Research, в своем выступлении в серии «Будущее искусственного интеллекта» (2:17:53)

Некоторые даже утверждают, что « все, чем алгоритмы были для информатики 15 лет назад, сегодня является машинное обучение ».

Для получения более подробной информации я бы рекомендовал начать с забавного вступления к возможностям, например, выступления Питера Норвига Theorizing from Data , взглянуть на то, что делает DeepMind , или, совсем недавно, с серии выступлений Future of AI (которые я цитировал выше ).

Затем запачкайте руки с помощью книги Джереми Ховарда « Приведение в форму для спорта науки о данных ». Это отличный прагматичный обзор реальной работы с данными.

После того, как вы немного поигрались, посмотрите книгу Бена Хамнера « Гремлины машинного обучения », чтобы получить хороший прагматичный отказ от ответственности за то, что может легко пойти не так при машинном обучении.

Я написал в блоге сообщение « Вычисление ваших навыков » после того, как потратил несколько месяцев, пытаясь понять TrueSkill , систему машинного обучения , которая занимается подбором игроков и ранжированием в Xbox Live. В этом посте рассказывается об основополагающей статистике, необходимой для дальнейшего изучения машинного обучения.

Возможно, лучший способ научиться этому - просто попробовать. Один из подходов - попробовать соревнование Kaggle, которое вам интересно. Несмотря на то, что я не преуспеваю в этой таблице лидеров, я всегда учусь чему-то, когда пробую соревноваться.

После этого я бы порекомендовал что-нибудь более формальное, например онлайн-класс Эндрю Нг . Это на уровне колледжа, но доступный. Если вы выполнили все вышеперечисленные шаги, у вас будет больше мотивации не сдаваться, когда вы столкнетесь с более сложными делами.

Как вы будете продолжать, вы узнаете о таких вещах, как R и его многочисленных пакетов , SciPy , Cross Validation , байесовского мышления , глубокого обучения , и многое многое другое .

ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ : я работаю в Kaggle, и в некоторых из приведенных выше ссылок упоминается Kaggle, но я считаю, что это отличное место для начала.

videolectures.net имеет большую коллекцию видео по машинному обучению . Одна очень хорошая вводная лекция на сайте - " Машинное обучение, вероятности и графические модели" Сэма Роуиса.

Хороший обзор этой области - семинар Тома Митчелла « Дисциплина и будущее машинного обучения» . Вот прямая ссылка на видео [mov] . И на странице Syllabus есть хороший список рекомендуемых текстов:

Я обнаружил, что книга « Программирование коллективного разума » действительно помогла мне (с практическими примерами), а в конце - «Алгоритм Beastiary».

Попробуйте «Первая встреча с машинным обучением» , это бесплатный курс для студентов бакалавриата.

Введение в машинное обучение Этхема Алпайдина представляет собой довольно доступный обзор этой области.

Если вы чувствуете себя подавленным другими вариантами, вы можете сначала начать с них.

Вводный курс доктора Ясера Абу Мустафы также подробно описан, и он довольно хорошо его объяснил.

http://work.caltech.edu/telecourse.html

Мне очень нравится курс машинного обучения на Coursera . Я считаю, что короткие лекции очень легко усваиваются.

Я рекомендую вам взглянуть на ml-class.org.

Вы правы, чувствуя, что в ML есть множество подполей.

Машинное обучение в целом - это просто идея алгоритмов, которые со временем улучшаются. Если вам просто любопытно, на ум приходят несколько случайных тем:

Классификация, ассоциативный анализ, кластеризация, деревья решений, генетические алгоритмы, концептуальное обучение

Что касается книг:

В настоящее время я использую курс « Введение в интеллектуальный анализ данных» . Он охватывает довольно много тем, которые я перечислил выше, и обычно содержит примеры алгоритмов / использования в каждом разделе.

Вам не нужно слишком много дополнительных знаний, чтобы понять многие темы. В основе большинства алгоритмов лежит некоторая математика, которая используется для улучшения результатов, и вам, очевидно, нужно хорошо разбираться в общих структурах программирования / данных.

Два лучших учебника:

Еще один хороший ресурс - сайт Open CourseWare Массачусетского технологического института, посвященный их классу машинного обучения .

«Искусственный интеллект: современный подход» - это самый распространенный учебник для вводных курсов по ИИ.

Книгу Виттена и Фрэнка по интеллектуальному анализу данных немного легче усвоить, если вам нравится эта тема.

В субреддите Machine Learning есть интересные ссылки для всех уровней.

Я использовал «Машинное обучение: алгоритмическая перспектива» Стивена Марсленда. И я считаю, что это потрясающий подход. Автор разместил код Python на своем сайте. Таким образом, вы можете загрузить код и посмотреть на него, чтобы увидеть, как все работает.

http://www-ist.massey.ac.nz/smarsland/MLbook.html