Введение
Android, Wear OS и Pixel являются хорошо известными продуктами компании Google. Однако не они привлекали к себе главное внимание на открытии конференции разработчиков Google I/O 2024 года. Основной темой здесь была технология искусственного интеллекта Gemini. Конференция разработчиков рассказывает, чем Google собирается заниматься в ближайшем году. А именно, она намеревается внедрить Gemini куда только можно, от приложения Google Фото до виртуальных помощников. Давайте узнаем, что ещё было показано на конференции.
Наступление Gemini
Каждый день в сервис Google Фото загружают свыше 6 млрд фотографий. Вручную все их обработать невозможно. Появление нынешним летом Gemini в составе Google Фото позволит расширить поиск на основе функции под названием Ask Photos. Вопрос вроде «Какой у меня номерной знак» выполнит поиск среди ваших фотографий, чтобы найти ответ. Вам не придётся искать нужную фотографию вручную.
На конференции прошлого года была описана языковая модель Notebook LM. В её состав Gemini тоже войдёт, расширяя возможности искусственного интеллекта. На презентации было показано, как урок физики описывается на примере баскетбола. Подобная персонализация обучения может в будущем стать более распространённой.
Версия Gemini 1.5 Pro будет доступна разработчикам и продвинутым пользователям более чем на 35 языках.
Агенты Gemini будут делать дела за вас
Gemini может не просто отвечать на вопросы и давать сводку данных. Google хочет разрешить делать нечто полезное. Естественно, программа не сможет пылесосить или стирать, но новый искусственный помощник под названием «Агенты» сможет получать задачи. Google показала это, сфотографировав пару обуви и дав агентам задание вернуть её. При помощи искусственного интеллекта обувь была распознана, в Gmail был найден чек на её покупку, потом появилось предложение возврата по электронной почте. Таким же способом можно планировать отпуска, рабочие поездки, другие связанные с информацией задачи.
Проект Astra
Другим экспериментальным проектом Google является Astra. Здесь Gemini связывается с камерами для интерпретации окружающего мира. В демонстрации Astra идентифицирует динамик, определяет, какая его часть издаёт звук, читает код и объясняет его. Astra может применяться для добавления искусственного интеллекта в смарт-очки, чтобы потом можно было задавать вопросы о том, что вы видите, не трогая телефон и его камеру.
Нечто похожее прежде демонстрировал ChatGPT, но от этого возможности Astra впечатляют не меньше. Пока нет точных сроков, когда эти опции появятся и сколько будут стоить.
Генеративный искусственный интеллект
Генеративный искусственный интеллект является наиболее распространённым видом ИИ, поэтому Google не может пройти мимо. Новая модель для создания изображений получила название Imagen 3. Естественно, Google называет её лучшей в своём роде к настоящему времени. Она занимается созданием изображений при помощи словесных описаний и подходит для понимания подсказок.
Помимо изображений Google трудится над моделями ИИ для создания музыки и видео формата HD. Последняя модель получит название Veo. На основе подсказок можно редактировать уже существующие видеоролики, поэтому не придётся каждый раз делать их с нуля. Показанные примеры демонстрируют видеоролики качеством выше, чем большинство созданных искусственным интеллектом прежде. Уже ведётся создание фильма с использованием новой модели ИИ.
Если вы опасаетесь, что сгенерированные изображения, звуки и видео могут использоваться злоумышленниками в противозаконных целях, Google добавляет идентификатор SynthID. Это невидимые водяные знаки, благодаря которым можно распознать созданный искусственным интеллектом контент. Инструменты для работы с изображениями и видео можно найти в ImageFX и Video FX.
Генеративный ИИ будет отображаться и в результатах поисковых запросов в системе Google. Обзоры ИИ будут давать резюме результатов поиска наверху страницы вместо того, чтобы отправлять пользователя на разные сайты. Многоэтапные рассуждения будут развивать запросы на основе индекса в Google, чтобы давать наиболее актуальную информацию. Таким же способом можно планировать поездки.
Одним из наиболее впечатляющих элементов AI Overviews является возможность задавать вопросы в Google Lens и получать персонализированный актуальный обзор. В США AI Overviews уже доступны для пользователей.
Gemini и Workspace
Gemini предлагается в составе Google Workspace на протяжении некоторого времени, но теперь Google собирается перевести это на новый уровень. Боковая панель с Gemini будет представлена в июне. Также Gemini войдёт в состав приложения Meet на разных языках.
Естественно, появится Gemini и в составе Gmail. Благодаря этому длинные электронные письма будут получать краткую сводку, чтобы не нужно было выделять информацию вручную. Введя вопрос или подсказку, вы получите ответ или действие со стороны Gemini. Умные ответы будут обновлены и станут контекстными. Всё это будет доступно пользователям Workspace Labs нынешним летом.
Скоро появится возможность работать вместе с ИИ. Google продемонстрировала сотрудника по имени Chip, отвечавшего за мониторинг ресурсов команды. Помощник на основе искусственного интеллекта умеет отвечать на вопросы в чатах Google Workspace. Он запоминает, когда были приняты те или иные решения, а также отслеживает прогресс указанных проектов.
Приложение Gemini
Можно сказать, что речь идёт об обновлённом ассистенте Google. Здесь вы сможете общаться теми же способами, в том числе текстом и голосом. Можно будет применять видео и более неформальную речь в рамках Gemini Live.
Gemini Gems представляет собой уменьшенные в размерах персонализированные варианты Gemini для разных ниш. Если вы пользуетесь Gemini с одной и той же целью снова и снова, можно создать Gem для экономии времени. Можно заставить ассистента рассказывать истории в стиле, который вам нравится, вместо обращения к обычному чат-боту с одними и теми же подсказками.
Приложение Gemini способно выполнять ряд вещей, вроде планировки поездок и составления маршрутов. Эти возможности будут представлены летом.
Искусственный интеллект и Android
Можно не сомневаться, что Google встроит Gemini в состав своей мобильной операционной системы. Android будет первой системой с поддержкой такого продвинутого искусственного интеллекта, что должно дать системе преимущество над конкурентами. То есть над Apple.
Circle to Search является частью этого проекта, а теперь Gemini станет стандартным помощником с искусственным интеллектом на Android. Функциональность будет расширена.
Можно сказать, что это усиленный ассистент Google. Он сможет понимать контекстную информацию на экране, в том числе анализировать видеоролики на YouTube и выдавать краткое изложение. Можно будет создавать изображения в качестве ответов и получать ответы на любые поставленные вопросы, не покидая экрана, на котором вы находитесь.
Не забыты и специальные возможности для людей с проблемами со здоровьем. Функция Talkback существует не первый день, но благодаря Gemini изображения будут подробно описываться для людей с нарушениями зрения. Поскольку приложение работает локально, всё это будет происходить быстро.
Gemini будет помогать бороться со спамом и мошенничеством. Прослушивая звонки пользователей, ассистент будет предупреждать о обнаружении подозрительной активности. Вся связанная информация будет храниться на устройстве. Работа над этой возможностью продолжается и пока она недоступна.