глубокое обучение

Проблемы глубокого обучения искусственного интеллекта

При нынешнем положении дел у людей сложилось нереальное представление о том, как глубокое обучение может помочь обществу в целом. Вы видите, что приложение глубокого обучения побеждает кого-то в шахматах и думаете, что если они способны на эту действительно удивительную вещь, то на какие еще удивительные вещи они способны? Проблема в том, что в глубоком обучении не очень хорошо разбираются даже его сторонники. В технических изданиях о глубоком обучении авторы нередко описывают организованные в сеть уровни обработки туманно, без каких-либо объяснений фактически происходящего в каждой из этих коробок. Главное — помнить, что даже глубокое обучение фактически ничего не понимает. Оно использует огромные массивы примеров, чтобы получить статистически обоснованное соответствие шаблону, и использует математические принципы. Когда искусственный интеллект выигрывает игру, подразумевающую действия в лабиринте, понятия о лабиринте он не имеет; он просто знает, что определенные входные данные при обработке некими способами создают определенные выходные данные, ведущие к победе.

В отличие от людей, глубокое обучение должно полагаться на огромные количества примеров, чтобы выявить конкретные отношения между вводом и выводом. Если вы скажете ребенку, что все люди от одного возраста до другого являются подростками, то ребенок будет в состоянии распознать любого соответствующего этой категории с высоким процентом точности, даже если это совершенно чужой человек. Для решения той же задачи глубокое обучение требовало бы специального обучения, и его будет довольно просто ввести в заблуждение, поскольку отсутствовавшие в его практике примеры ему непонятны.

Люди способны также создавать иерархии знаний безо всякого обучения. Например, без большого усилия понятно, что собаки и коты — это животные. Кроме того, зная, что собаки и коты — это животные, человек может легко сделать скачок и увидеть других животных как животных даже без специфического обучения. Глубокое обучение требовало бы отдельного обучения по каждому объекту, который является животным. Короче говоря, глубокое обучение не может перенести то, что оно знает, на другие ситуации, как люди.

Даже при этих ограничениях глубокое обучение — это удивительный, но не единственный инструмент в арсенале искусственного интеллекта. Наилучший способ применения этой технологии — поиск неочевидных людям шаблонов. Шаблоны — это основной элемент обнаружения чего-то нового. Например, люди довольно давно борются с раком. Выявление глубоким обучением неочевидных людям шаблонов может стать серьезным шагом к решению с куда меньшими усилиями, что очень нужно людям.

Поскольку исследователи, наконец, сумели заставить сотрудничать некоторые простые, но очень хорошие решения, появилась возможность автоматически фильтровать, обрабатывать и преобразовывать большие данные. Например, такие новые активизации, как ReLU, не так уж и новы; они были известны еще со времен перцептрона. Кроме того, возможности по распознаванию образов, сделавшие глубокое обучение столь популярным, тоже не новы. Первоначально глубокое обучение получило хороший толчок благодаря сверточным нейронным сетям (CNN), открытым в 1980-х годах французским ученым Яном Лекуном. Такие сети и сейчас дают удивительные результаты, поскольку используют много уровней нейронов и много данных. То же самое относится к технологии, позволяющей машине понимать человеческую речь или переводить с одного языка на другой; этим технологиям уже десятилетия, но исследователи вернулись к ним в новой парадигме глубокого обучения. Современная информационная система управления в строительстве также использует искусственный интеллект для решения своих специфических задач.

Конечно, часть различий относится также к данным, улучшению применения GPU и работе с компьютерными сетями. Вместе с параллелизмом, GPU позволяют создавать большие сети и успешно обучать их на большом количестве данных. Фактически процессоры GPU выполняют определенные операции примерно в 70 раз быстрее любого процессора CPU, позволяя сократить время обучения нейронных сетей с недель до дней или даже часов.