Способность высокоавтоматизированных транспортных средств (ВАТС) определять положение объектов в трехмерном пространстве играет ключевую роль в планировании движения. Реализация алгоритмов, решающих данную проблему, особенно сложна для систем, использующих исключительно монокулярные камеры, т.к. для них оценка глубины представляет нетривиальную задачу. Тем не менее такие системы широко распространены ввиду относительной дешевизны и простоты эксплуатации. В данной статье мы предлагаем метод к определению положения транспортных средств (наиболее распространенного типа объектов окружения в городских условиях) в виде произвольно ориентированных ограничивающих рамок на виде сверху (birds’-eye view) по изображению, полученному с одной монокулярной камеры. Этот метод состоит из двух этапов. На первом этапе вычисляется проекция видимой границы транспортного средства в виде сверху на основе 2D-детекций препятствий и сегментации проезжей части на изображении. Предполагается, что полученная проекция представляет зашумленные измерения двух ортогональных сторон ТС. На втором этапе строится ориентированная ограничивающая рамка вокруг полученной проекции. Для этого этапа мы предлагаем новый алгоритм построения рамки на основе предположения об L-образности проекции: L-shape алгоритм. Тестирование алгоритма проводилось на самостоятельно подготовленном наборе реальных данных. Предлагаемый L-shape алгоритм превзошел лучший из сравниваемых алгоритмов по коэффициенту Жаккара (Intersection over Union, IoU) на 2.7%.
Индексирование
Scopus
Crossref
Высшая аттестационная комиссия
При Министерстве образования и науки Российской Федерации