Гарри Поттер и Искусственный Интеллект
09 Янв 2018, 09:18

Гарри Поттер и Искусственный Интеллект

Data Scientist из SMART business Андрей Белас просто о deep learning на примере книги «Гарри Поттер и Орден Феникса»

В 2017 году трудно было отрицать прогнозы о том, что машинное обучение изменит все.
Вряд ли это изменится в 2018 году. И вот почему.

Что же происходит сейчас? Что стоит изучать сейчас? На что обращать внимание сегодня и в будущем?

Андрей Белас
Эксперт в области искусственного интеллекта, Data Scientist компании SMART business

Если выписать популярные термины, которые встречаются в учебниках, курсах по темам «искусственный интеллект» и «машинное обучение», то будет видно, что под соусом «искусственный интеллект» подаются вещи, придуманные более полувека или даже век назад. Это ни хорошо, ни плохо. Просто нужно это понимать, брать за основу и использовать, как кубики. И сегодня из них можно собирать интересные вещи.
 

Итак, что можно делать сегодня? Что такое машинное/глубинное обучение сегодня?

Начнем с первой темы – мультимодальное обучение

Чтобы понять эту концепцию, давайте представим, как учится ребенок. Такие параллели удобно приводить потому, что обучение человека схоже с тем, как происходит обучение искусственного интеллекта. Он не просто воспринимает однотипную информацию. Он видит, слышит, чувствует, может воспринимать запахи. Так же и с нейронной сетью, ей можно подавать на вход не обязательно однотипный кусочек данных, на которых она будет обучаться. Если это задача анализа видео, то в один канал можно подавать видеопоток, в другой аудио, а в третий текстовую информацию и геолокацию. И если эти факторы комбинировать при помощи одной нейросети, получим значительные приросты в точности. 

Другой пример, важный для прогнозирования, учитывать не только исторические продажи или исторические показатели. Например, прогнозируем энергопотребление. Берем просто исторические или макропоказатели. Можно добавить сюда внешние цены, геолокацию, погоду, солнце, ветер, влияние новостей и получить прирост точности в разы уже сейчас.

Следующий пример похож на предыдущий. Он называется многозадачное обучение. Его суть тоже удобно объяснить на примере, связанном с изображениями. Если мы посмотрим на человека, то можем сразу сказать пол, возраст, определить его эмоциональное состояние в данный момент и другие факторы. Смотрим на лицо: мужчина или женщина, возраст, психотип, эмоциональное состояние, возможно, болезни. Делаем нейросеть, которая по одной фотографии определяет несколько вещей. Решает не просто задачу распознавания эмоций (страх, радость и так далее), а определяет также, спокойный он или нет, можно повысить точность – спокойные менее ярко выражают эмоции и наоборот. Анализ микровыражений (как в «Теории лжи») – возможно, тот же детектор лжи.

Это была техническая часть.

Покажу наглядные примеры использования искусственного интеллекта и нейросетей. 

Они создают картинки, звуки, голоса, тексты, которые человек уже и не отличит, где компьютер, а где человек. Почему они и называются генеративно-состязательная сеть (википедия) Собственно, это комбинация нейросетей. 

Как работают генеративные сети. Есть реальные изображения, на которых учатся дискриминаторы. Это аналог понятия актер и критик или ученик и учитель. Дискриминатор нужен, чтобы учить нейросеть не заходить далеко в своих фантазиях. Он обучает распознавать картинку. Например, мы хотим создавать милых котиков. У нас будет дискриминатор, который четко обучен на котиках и понимает — это котик или не котик. Есть генератор, который создает просто случайный шум, отправляя дискриминатору, а дискриминатор решает – это котик или нет. И за это штрафует или награждает генератор.  

Так происходит соревнование нейросетей. В их комбинации эти изображения улучшаются и улучшаются. В итоге получается что-то классное. 

Например, эксперимент с голосами, которые сгенерировала нейросеть. Угадайте, какой из голосов принадлежит человеку, а какой искусственному интеллекту? 

Примеры лиц, которых не существует. С них началось появление генеративных сетей. Часть — это знаменитости, на которых сеть обучалась, а часть – созданные лица после обучения.

Задача переноса стиля изображения с лошадей на зебру. Для фильма нужны были зебры. А были только лошади. И их никто не отличил. И два цветка, которых в природе не существует, – их тоже создали нейросети.

Свежий пример генеративных нейросетей, которые научились менять погоду на фото и на видео.

К примеру, есть зима и лето. Из зимы искусственный интеллект делает лето в реальном времени, как на фото, так и на видео. Есть пример с обычной солнечной погодой, где нейронная сеть может делать из солнечной погоды дождь и наоборот. Очень сложно отличить. Это deep learning сегодня. Вы сами на компьютере это можете делать. 

Еще один пример, что можно делать сегодня.
Я взял нейросеть и обучил ее на примере книги «Гарри Поттер и Орден Феникса». Дал ей почитать книжку и записал историю ее обучения. Вот, что она нам выдавала, когда только начинала учиться. Запустил ее на фразе: «Гарри медленно выдохнул и стал смотреть в ослепительно синее небо.»

То есть, как только нейросеть начала учиться на тексте «Гарри Поттер и Орден Феникса», она начала выдавать несвязные наборы букв. Но примерно уже понятно, что она видит короткие и длинные слова, прилагательные. После суток обучения она понимает, что есть абзацы, диалоги и некоторые слова похожи на реальные. Даже появляется имя Гарри.

Когда она доучилась до конца, стала похожей на реальный диалог. Смысла в нем никакого нет – это самая простая сеть. Но она понимает пунктуацию, знаки вопроса, понимает диалоги, строит предложения, придумала профессора и нашла Гермиону, потому что часто встречались Гермиона и Рон.

Это все реализуемо. Я обучил сеть за вечер. Если взять больше ресурсов, то можно создавать тексты. Что уже было сделано, когда искусственный интеллект New York Times написал статьи лучше, чем сотрудник издательства и его уволили 🙂 вот пример генеративных сетей. Это можно делать сейчас. 

Продолжение следует…

Расскажите друзьям про новость