Авторизация


На главнуюКарта сайтаДобавить в избранноеОбратная связьФотоВидеоАрхив  

Беспилотные грузовики фирмы "КАМАЗ"
Источник: Яндекс картинки
09:52 / 27.12.2016

Искусственный интеллект авторобота неделён функцией гиппокампа
Используемая технология позволяет решить одну из главных проблем для любой системы компьютерного зрения – распознавания объектов, находящихся на самой границе картинки. Как показывает практика, именно в этих случаях возникает наибольшее количество ошибок детекции объектов

Компания Cognitive Technologies разработала технологию компьютерного зрения, благодаря которой авторобот будет способен с высокой точностью интерпретировать сложные ситуации, возникающие, как правило, в критических ситуациях – внезапном появлении на дороге других участников движения, пешеходов, посторонних предметов.

Новая технология, как считают в компании, позволит избежать ошибок, которые допускали известные зарубежные системы при распознавании объектов дорожной сцены.

«Фактически мы в чём-то научились моделировать функцию гиппокампа человека, который выделяет и удерживает в потоке внешних сигналов наиболее важную информацию по текущей ситуации, выполняя функцию хранилища кратковременной памяти, как ОЗУ компьютера», – комментирует  руководитель департамента разработки беспилотных транспортных средств Юрий Минкин.

Известно, что гиппокамп также определяет степень важности запоминаемой информации и принимает решение, что нужно сохранить, а что забыть.

Система компьютерного зрения Cognitive Technologies научилась, как и гиппокамп человека, обогащать информацию о текущей дорожной ситуации данными, которые она запомнила несколькими мгновениями ранее.

При этом система хранит в памяти не всю картинку, полученную с видеокамеры, а лишь наиболее важные её элементы, непосредственно влияющие на дорожную обстановку и безопасность.

Это даёт возможность не хранить все изображение целиком, а лишь 5–10% его объёма и не требует какого-либо значительного повышения ресурсов вычислительного устройства. Также это позволяет использовать видеокамеры не с самой высокой разрешающей способностью или относительно узкоугольные объективы.

Использование технологии, по мнению разработчиков, даст серьёзное преимущество над аналогами, поскольку она позволяет решить одну из главных проблем для любой системы компьютерного зрения – распознавания объектов, находящихся на самой границе картинки. Как показывает практика, именно в этих случаях возникает наибольшее количество ошибок детекции объектов.

При использовании модели Cognitive Technologies для их распознавания мы получаем отступ (padding – зона, выделенная цветом на рисунке 1 между прямоугольниками A’B’C’D’ и ABCD), который необходим для работы нейронных сетей глубокого обучения и других сверточных нейронных сетей.


Когда объект попадает на границу картинки (поля зрения видеокамер) ABCD, распознать его очень сложно (часть автомобиля, обведённого кругом, попавшего в поле зрения камер – прямоугольник ABCD).

Эта проблема успешно решается, когда искусственный интеллект авторобота дополняет знание о текущей дорожной ситуации данными из ближайшего прошлого – из своей оперативной памяти (моделирование функции гиппокампа человека). Картинка, попавшая в поле зрения видеокамер мгновением ранее A’B’C’D’, содержит информацию об объекте (автомобиль, обведённый кругом), достаточную для его распознавания.

Использование подобной технологии позволило бы системе компьютерного зрения, установленной на автомобиле Tesla, избежать аварии, произошедшей в мае этого года.

«Наша система смогла бы детектировать транспортное средство, приближавшееся сбоку, – утверждает Юрий Минкин. – Программная эмуляция большего угла охвата видеокамер позволила бы «увидеть» колеса, подвеску, а также другие элементы грузовика и в итоге идентифицировать приближающийся объект как автомобиль. И, кроме того, выиграть доли секунды, крайне необходимые для принятия правильного решения в критической ситуации».



Комментарии:

Для добавления комментария необходима авторизация.