Машинное обучение на основе данных

В машинном обучении все вращается вокруг алгоритмов. Алгоритм — это процедура или формула решения задачи. Предметная область включает и вид необходимого алгоритма, но базовая предпосылка всегда одинакова: решить своего рода задачу, такую как вождение автомобиля или игра в домино. В первом случае задача сложна и многогранна, но сводится в конечном счете к одному — доставить пассажира из одного пункта в другой, не разбив автомобиль. Аналогично задача при игре в домино заключается в победе.

Обучение бывает разным в зависимости от алгоритма и его целей. Алгоритмы машинного обучения можно отнести к трем основным группам на основании их задач.

Контролируемое обучение

Контролируемое обучение происходит, когда алгоритм учится на основе данных примеров и относящихся к цели ответов, которые могут состоять из числовых значений или строковых меток, таких как классы или тэги, чтобы впоследствии спрогнозировать правильный ответ, когда появятся новые примеры. Контролируемый подход подобен обучению человека под присмотром учителя. Учитель обеспечивает ученику хорошие примеры для запоминания, а ученик усваивает общие правила из этих конкретных примеров.

Необходимо различать задачи регрессии, целью которых является числовое значение, и задачи классификации, целью которых является такая качественная переменная, как класс или тэг. Задачей регрессии может быть определение средней цены домов в окрестности города Бостон, а примером задачи классификации может быть поиск различий между цветами ириса на основании размеров их лепестков и чашелистиков. Вот некоторые из примеров контролируемого обучения с важными применениями в искусственном интеллекте, описанные по их вводу и выводу данных, а также реальному применению для решения.

Неконтролируемое обучение

Неконтролируемое обучение происходит, когда алгоритм учится на основе простых примеров без какого-либо ассоциированного ответа, позволяя алгоритму самостоятельно определять шаблоны данных. Этот тип алгоритма стремится реструктурировать данные в нечто еще, такое как новая возможность, способная представить класс, или новая последовательность некоррелированых значений. Полученные данные весьма полезны людям со способностью проникновения в суть смысла первоначальных данных, а также как новые полезные входные данные для алгоритмов контролируемого машинного обучения.

Неконтролируемое обучение напоминает методы, используемые людьми для выявления определенных объектов или событий того же самого класса, с учетом наблюдаемой степени сходства между объектами. Некоторые системы рекомендаций, которые можно найти на сайтах интернет-магазинов, построены на базе обучения этого типа. Алгоритм автоматизированных интернетмагазинов создает свои рекомендации на основании того, что вы покупали в прошлом. Рекомендации создаются на основании оценки того, какую группу клиентов вы напоминаете больше всего, а затем вычисляет ваши вероятные предпочтения на основании предпочтений этой группы.

Обучение с подкреплением

Обучение с подкреплением происходит, когда алгоритму предоставляют примеры без меток, как при неконтролируемом обучении. Но вы можете сопроводить примеры положительной или отрицательной оценкой в зависимости от предлагаемого алгоритмом решения.

Обучение с подкреплением связано с приложениями, алгоритм которых должен принимать решения, и эти решения имеют последствия. В мире людей это точно то же, что и обучение методом проб и ошибок. Ошибки помогают учиться, поскольку убыток от них наглядно демонстрирует, что определенный образ действия менее вероятен для успеха, чем другие. Интересен пример обучения с подкреплением, когда компьютеры учатся играть в видеоигры.

В данном случае приложение предоставляет алгоритму примеры определенных ситуаций, когда игрок прячется в лабиринте от врага. Приложение позволяет алгоритму узнать результат его действий, и обучение происходит в результате попыток избежать обнаружения опасным преследователем и выжить. Вы можете увидеть, как созданная Google DeepMind программа обучения с подкреплением играет в видеоигры старого Атари. Просматривая видео, обратите внимание на то, что сначала программа неуклюжа и неумела, но постоянно совершенствуется и учится, пока не становится чемпионом.

1CDU