Президент Android Самир Самат и руководитель Google AI Studio Логан Килпатрик продемонстрировали, как Gemini связывает визуальные данные с языковой моделью. Система успешно опознала арт-объект The Orb, солнечную крышу Gradient Canopy и площадку Shoreline Amphitheatre. Разработчики уверяют, что конфиденциальность под защитой: камера не ведет непрерывную запись, а активируется лишь в момент запроса и отключается сразу после получения ответа.
Технология пока находится на ранней стадии. Сейчас наблюдаются задержки при передаче данных на серверы, а взаимодействие ограничено голосовым режимом — изображение не выводится на дисплей автомобиля. В будущем Google планирует использовать систему для перевода дорожных знаков в поездках за границу, чтобы водитель не отвлекался на экран смартфона. Сроки внедрения функции в серийные авто пока остаются неизвестными.
Комментарии (0)
Пока нет комментариев. Будьте первым!