Искусственный интеллект Цифровые технологии

Google по ошибке представила своего революционного ИИ-ассистента Jarvis

09.11.2024

747

Google наращивает свои амбиции, когда речь заходит об искусственном интеллекте. Согласно последним сообщениям, компания разрабатывает потенциально революционную технологию, которая должна изменить взаимодействие пользователей с компьютерами с помощью агента искусственного интеллекта под кодовым названием Jarvis, способного управлять Chrome для выполнения различных задач. Хотя этот инструмент еще не был представлен официально, случайная публикация в Интернете позволила нескольким привилегированным пользователям обнаружить его.

Недавно издание The Information рассказало о существовании этого «секретного» проекта Google. По словам источников, близких к компании, проект, получивший внутреннее название Jarvis в честь виртуального помощника Железного человека, представляет собой интеллектуального агента, способного брать под контроль веб-браузер для выполнения задач. Разработанный для интеграции с браузером Chrome, Jarvis может имитировать действия человека. Например, он может просматривать веб-страницы, осуществлять поиск, совершать покупки или бронировать авиабилеты, избавляя вас от ежедневного управления онлайн-активностью.

Для выполнения этих задач агент использует технику, которая заключается в частом создании скриншотов пользовательского интерфейса. Он анализирует эти изображения, чтобы расшифровать интерфейс, что позволяет ему выполнять такие действия, как нажатие кнопок или заполнение текстовых полей. Сообщается, что бот работает на основе языковой модели Gemini 2.

Случайное раскрытие

О существовании Jarvis стало известно, когда Google случайно обнародовал его 5 ноября. В течение нескольких часов он был доступен в магазине расширений Google, после чего страница была удалена. О происшествии сообщил сайт The Information, подтвердив предыдущие утечки. По слухам, компания планирует запустить Jarvis в следующем месяце, одновременно с выходом Gemini 2.

Новый помощник описывается как «полезный компаньон, который будет ориентироваться в Интернете для своего пользователя». Однако для того, чтобы полностью раскрыть его возможности, нам придется дождаться официального запуска. Действительно, когда журналист попытался исследовать его, продукт оказался неработоспособным из-за требуемых разрешений на доступ. Более того, по данным The Information, Jarvis все еще относительно медленно выполняет свои действия.
ИИ-анализ пользовательского экрана: бурно развивающаяся технология?

Это случайное откровение Jarvis произошло в то время, когда другие технологические гиганты объявляют о подобных проектах. Например, Microsoft недавно дополнила своего помощника Copilot новыми визуальными возможностями, чтобы обеспечить более персонализированный опыт. Функция Copilot Vision позволяет ассистенту «видеть», что пользователь просматривает на веб-странице, анализируя текст, изображения и другой контент, чтобы отвечать непосредственно на запросы.

Anthropic, в свою очередь, усовершенствовал свою модель Claude 3.5, интегрировав в нее функции, схожие с Jarvis, используя снимки экрана для анализа контента и автономного выполнения таких задач, как перемещение курсора или нажатие кнопки. Сообщается, что OpenAI также участвует в аналогичном проекте.

Хотя инструмент Google направлен на улучшение пользовательского опыта, он, тем не менее, может вызвать критику. Некоторые пользователи считают, что компания уделяет слишком много внимания развитию своего нового искусственного интеллекта, иногда в ущерб надежности своих текущих сервисов, и часто отмечают ошибки при использовании некоторых продуктов.

09.11.2024

747