Машинное обучение в Google или как искусственный интеллект делает сервисы компании и жизнь людей лучше
Ежедневно миллионы людей используют сервисы Google даже не подозревая, что в этот ..., Ежедневно миллионы людей используют сервисы Google даже не подозревая, что в этот момент решитьЕжедневно миллионы людей используют сервисы Google даже не подозревая, что в этот момент решить их задачи помогают не просто компьютеры, а машины, которые учатся. Они позволяют находить более релевантную информацию, улучшают перевод с одного языка на другой, превращают голос в текст и борются со спамом в почте. И это далеко не всё, что позволяет реализовать машинное обучение. На специальном мероприятии в Цюрихе, компания Google рассказала, как и зачем учит компьютеры, и как они помогут нам в будущем.
Маффины или чихуахуа, мопс или круассан? Почему машинное обучение — это сложно
Открытый в прошлом году в Цюрихе исследовательский центр, занимающийся машинным обучением, выделяет четыре основные направления своей работы: основы машинного обучения (инструменты и платформы), компьютерное восприятие (распознавание изображений и видео), обработка естественного языка, а также алгоритмы и компрессия.
По словам Анны Ухановой, технического менеджера по исследованиям в Google, компания сейчас пытается создать машины, которые бы выглядели умными, в то время как думающий компьютер пока остаётся очень сложной задачей. При этом Google достигла определённых успехов в некоторых областях, например, в машинном переводе с использованием нейронных сетей. Но пока архитектура этих нейронных сетей хороша только для решения тех задач, для которых они создавались.
«Человек не рождается со знанием, что коровы едят траву, он получает эту информацию от окружающего мира» — объясняет Эммануэль Могене, глава европейского исследовательского центра Google — «Чтобы реализовать это для машин, необходим огромнейший объём данных, и мы близки к тому, чтобы его получить. Если взять все изображения доступные в интернете, то это примерно такое же количество изображений, которое вы видели за свою жизнь. Но нам также необходимо больше производительности, ведь если посмотреть на количество нейронов в мозгу человека и на то, как хорошо они взаимодействуют друг с другом, то мы пока не можем реализовать это в компьютере, а тем более воссоздать человеческий мозг».
Также важно отметить, что с самого детства люди получают информацию об окружающем мире посредством шести основных органов чувств, в то время как компьютер в этом плане ограничен, ему нужны данные, которыми можно описать окружающий мир. «Если я покажу вам картинку и спрошу, есть ли на ней кто-нибудь, вы легко сможете ответить да или нет. Но вы не сможете объяснить, как именно ваш мозг пришёл к этому решению» — рассказывает Могене.
В качестве одной из проблем, с которой сталкивается машина при, например, попытке распознать изображение — это визуально похожие фотографии. Компьютеру довольно сложно отличить маффин от чихуахуа, а шарпея от круассана. И если вы посмотрите на эти изображения, то поймёте почему. Иногда и человеческий мозг, очень продвинутую вычислительную машину, можно обмануть.
title="Машинное обучение в Google или как искусственный интеллект делает сервисы компании и жизнь людей лучше"
-->Таким образом компьютеры пока учатся, чтобы быть умнее, но им далеко до настоящего искусственного интеллекта, который может думать и решать более сложные задачи. Тем не менее исследователи в Google не сидят на месте. «Искусственный интеллект — это сложное поле для исследований, и оно состоит из нескольких компонентов, которые отвечают за прогресс в этой области» — объясняет Анна Уханова — «И как мы видим, за последние пять лет мы достигли хороших результатов. Во-первых, большую роль в этом сыграл рост вычислительных мощностей, что позволило тренировать нейронные сети. Во-вторых, количество доступной информации, примеров и специализированных данных, которые нужны для решения конкретных задач. В-третьих, для машинного обучения появились платформы, программное обеспечение, которое может быстро обучаться. Это, например, Tensorflow, проект с открытым программным кодом, который позволяет всем желающим работать с машинным обучением, используемым в таких крупных компаниях, как Google. И в-четвёртых, но самое важное — это креативность и знания, которые инженеры и учёные вкладывают в системы машинного обучения. Это может быть новая архитектура нейронной сети или комбинация определённых алгоритмов, предложенная сообществу исследователей. В итоге, чтобы двигаться вперёд, нам нужные все эти четыре составляющие, и это одна из причин, почему мы делимся своими исследованиями, выступаем на конференциях, обмениваемся знаниями».
Что такое глубокое машинное обучение?
«Машинное обучение началось ещё в 90-х годах, тогда мы использовали SVM (support vector machine — метод опорных векторов), а с 2006 года появилось глубокое машинное обучение (deep learning) — это более продвинутая техника, чтобы обучать компьютеры» — рассказывает Эммануэль Могене — «И в большей степени это мощность новых нейросетей, они просто намного больше тех, которые были у нас в самом начале. Но самое главное, они сделали глубокое машинное обучение реальностью, и самое интересное это то, зачем они нам понадобились. Нейронные сети — не новое изобретение, они появились ещё в 80-х годах, но не работали. Причины, по которым они не работали: у нас не было достаточно данных и компьютерной мощности. Эксперименты прогонялись на трёх «нейронах», что занимало около трёх дней, и это были очень простые задачи. Но доступность огромных массивов информации, благодаря интернету, и значительный рост производительности компьютеров, благодаря видеокартам, позволил глубокому машинному обучению взлететь».
Как Google тренирует нейронные сети
Сегодня существует несколько техник машинного обучения: с учителем, без учителя и с подкреплением.
1. Обучение с учителем — это обучение на примерах, на манер того, как спам-фильтр Gmail фильтрует почту, получая всё новые и новые примеры спам-рассылок. Единственная проблема с этим способом: для того, чтобы он был эффективным, нужно иметь большое количество готовых примеров.
2. Обучение без учителя — это кластеризация данных, компьютеру предоставляются объекты без описания и он пытается найти между ними внутренние закономерности, зависимости и взаимосвязи. Так как данные изначально не имеют обозначений, то для системы нет сигнала ошибки или награды, и она не знает правильного решения.
3. Обучение с подкреплением — этот метод связан с «обучением с учителем», но здесь данные не просто вводятся в компьютер, а используются для решения задач. Если решение правильное, то система получает позитивный отклик, который запоминает, подкрепляя тем самым свои знания. Если же решение неверное, то компьютер получает негативный отклик, и должен найти другой способ решения задачи.
Также по теме: