Preview

Вестник Концерна ВКО «Алмаз – Антей»

Расширенный поиск

Классификация объектов военной техники с использованием сверточной нейронной сети на радиолокационных изображениях, сформированных в условиях ретрансляционных помех

https://doi.org/10.38013/2542-0542-2022-4-70-79

Полный текст:

Содержание

Перейти к:

Аннотация

В статье решена задача оценки влияния ретрансляционной помехи на точность классификации объектов на радиолокационных изображениях, формируемых в РЛС с синтезированной апертурой антенны. Новизну работы составляет получение зависимостей с использованием не традиционных методов статистического анализа, а глубокой сверточной нейронной сети. Показано, что при субметровом разрешении и количестве ложных точечных отметок, сопоставимом с количеством разрешаемых элементов отметки объекта (порядка 250), точность классификации объектов авто- и бронетехники не превышает 20 %.

Для цитирования:


Купряшкин И.Ф. Классификация объектов военной техники с использованием сверточной нейронной сети на радиолокационных изображениях, сформированных в условиях ретрансляционных помех. Вестник Концерна ВКО «Алмаз – Антей». 2022;(4):70-79. https://doi.org/10.38013/2542-0542-2022-4-70-79

For citation:


Kupryashkin I.F. Classification of military equipment targets on radar images generated in repeater jamming conditions using a convolutional neural network. Journal of «Almaz – Antey» Air and Space Defence Corporation. 2022;(4):70-79. https://doi.org/10.38013/2542-0542-2022-4-70-79

Введение

В последнее время вопросам обработки радиолокационных изображений (РЛИ) с использованием технологий глубокого обучения уделяется самое пристальное внимание [1–11]. Так, в обширном обзоре [1] авторами в качестве одного из основных направлений их применения отмечается поиск и классификация объектов на РЛИ. Оно также представляет существенный интерес и с точки зрения видовой радиолокационной разведки. Как правило, в качестве наиболее перспективного инструмента для решения этой задачи рассматриваются глубокие сверточные нейронные сети (ГСНС), демонстрирующие уверенное преимущество перед алгоритмами, рассматриваемыми как традиционные (K-ближайших соседей (K-Neighbor), опорных векторов (SVM), AdaBoost, множества решающих деревьев (Random Forest), CART и др.) [2][12].

Постоянная тенденция к улучшению разрешающей способности в сочетании с качественным скачком эффективности систем автоматического дешифрирования РЛИ за счет применения ГСНС существенно повышает информационные возможности систем видовой радиолокационной разведки [13][14] и одновременно делает их весьма сложным объектом с точки зрения эффективного радиопротиводействия [15–19].

В связи с этим оценка эффективности противодействия таким системам, особенно учитывающая возможность обработки РЛИ с использованием технологий глубокого обучения, представляет значительный интерес. Тем не менее в известных публикациях вопросы детектирования и классификации объектов с использованием ГСНС рассматриваются применительно к изображениям, сформированным при отсутствии преднамеренных помех РЛС. В работе [19] приведены сведения о публикациях, включающих описания результатов работы ГСНС по зашумленным РЛИ, а также собственные результаты авторов для случая преднамеренных шумовых помех. Однако известно, что достаточная эффективность противодействия современным РЛС видовой разведки с использованием средств постановки шумовых помех может быть обеспечена только при условии, если их энергетический потенциал (произведение мощности передающего устройства и коэффициента усиления передающей антенны) составляет от 30–40 дБ и более [15–17].

Это обусловливает повышенный интерес к средствам формирования сигналоподобных помех, в значительной степени лишенных отмеченных недостатков, в качестве которых, как правило, рассматриваются средства постановки помех ретрансляционного типа [15][18]. Определение требований к ним, особенно с учетом современных возможностей по обработке радиолокационной информации, является актуальной задачей, тем более что в известной литературе результаты подобных исследований не отражены.

В связи с этим целью работы является определение зависимости точности классификации объектов военной и специальной техники на радиолокационных изображениях от характеристик преднамеренных ретрансляционных помех, выполняемой с использованием глубоких сверточных нейронных сетей.

Подготовка данных обучающей и тестовой выборок

В качестве исходных данных используется открытая часть стандартного набора MSTAR (Moving and Stationary Target Acquisition and Recognition) [20], включающая РЛИ десяти образцов военной техники с разрешением около 0,3 м, полученных по результатам съемки РЛС X-диапазона. Примеры РЛИ набора приведены на рисунке 1.

Рис. 1. Радиолокационные изображения объектов набора MSTAR и их фотографии

Из всех имеющихся изображений сформированы обучающий, проверочный и тестовой наборы, причем изображения обучающих и проверочных наборов получены при съемке с углом визирования 17 градусов, тестового набора – 15 градусов. Общее количество изображений обучающего набора составляет 1923, проверочного – 891 и тестового – 2503.

Каждое исходное изображение представляет массив комплексных отсчетов, размерность которого для объектов разных классов является различной (минимальная составляет 128×128 отсчетов) [19].

С целью исключения влияния фона местности на результаты классификации подготовка данных для обучения включает этап подавления фоновых отсчетов и снижения размерности изображения, описанный в [19]. Результатом его выполнения является формирование массива отсчетов комплексного изображения ij, где i = и j = при N = 44.

Наиболее часто рассматриваемым вариантом противодействия авиационным и космическим РЛС на основе ретрансляционного метода является тот, при котором в течение интервала синтезирования в ответ на каждый импульс РЛС средство постановки помех переизлучает серию его копий, каждую со своими амплитудой, временной задержкой и доплеровским сдвигом. Результатом обработки такой помехи на РЛИ является формирование совокупности ложных точечных отметок (ЛТО) [15], смещение каждой из которых по наклонной и путевой дальности определяется введенными временной задержкой и доплеровским сдвигом соответствующих копий импульсов. Амплитуды переизлученных импульсов определяют уровни ЛТО на изображении. Необходимым условием достижения этого эффекта является сохранение когерентности переизлучаемых сигналов, а также, в простейшем случае, неизменность заданных параметров амплитудно-фазовой модуляции и временной задержки для каждой копии от импульса к импульсу [15].

Выбор временного смещения, амплитуд и доплеровских сдвигов для каждой ЛТО определяется исходя из целей создания помехи. Если целью является имитация отметки объекта, ЛТО размещаются таким образом, чтобы максимально правдоподобно воспроизвести характер и уровни его локальных центров рассеяния. Так как при субметровом разрешении правдоподобная имитация подобным способом является весьма сложной задачей и практически нерешаемой в части имитации радиолокационной тени объекта, то в качестве цели создания ретрансляционных помех также рассматривают случайные совокупности ЛТО, размещаемые в пределах отметки объекта и затрудняющие его идентификацию [15]. Энергетический выигрыш по сравнению со средствами постановки шумовых помех при таком способе их создания пропорционален отношению площади совокупности ЛТО к общей площади кадра РЛИ и может достигать 20–30 дБ [15].

Исходя из перечисленных соображений, дальнейшая подготовка наборов изображений, включающих помимо истинных отметок объектов еще и совокупности ЛТО, включает следующие этапы.

Для определения требуемого отношения помеха/сигнал на РЛИ, под которым понимается отношение среднего уровня ЛТО к среднему уровню отметки объекта q, осуществляется оценка среднего значения амплитуд ненулевых отсчетов отметки объекта . Далее формируется матрица комплексного помехового изображения, представляющего собой совокупность Np ЛТО, каждая из которых описывается двумерной гауссоидой, ширина которой по уровню 0,5 соответствует разрешению РЛИ

(1)

где ap и φp – случайные амплитуда и фаза p-й ЛТО, распределенные по рэлеевскому закону с параметром и равномерно на интервале [– π; π] соответственно; ip и jp – случайные индексы строки и столбца матрицы помехового изображения, распределенные по гауссовскому закону с одинаковыми средними значениями, равными N/2 и среднеквадратическими отклонениями, равными N/4;
G(m, n) = exp (–1/2 (m2 + n2)).

Заключительный этап формирования набора данных состоит в поэлементном суммировании комплексных сигнального и помехового изображений с последующим определением их абсолютных значений

(2)

и преобразованием в 8-битный целочисленный формат

(3)

где

Imax = max{I} и Imin = min{I} – максимальная и минимальная амплитуды отсчетов соответственно; int{x} – целая часть x.

Перед подачей на вход ГСНС целочисленные значения в диапазоне [ 0;255] преобразуются в вещественные в диапазоне [ 0;1] путем деления на 255.

Примеры изображений наборов, сформированных при Np =50; 125; 250; 500 и q = 0 дБ, для объектов всех десяти классов приведены на рисунке 2.

Рис. 2. Примеры изображений наборов изображений при различном количестве ЛТО (q = 0 дБ)

Структура глубокой сверточной нейронной сети, процесс и результаты обучения

Разработка и обучение сети осуществлялись с использованием фреймворка TensorFlow 2.0 и библиотеки Keras [21]. Архитектура сети соответствует архитектуре VGG-типа [22] и включает последовательности четырех пар сверточных слоев (Convolution Layers) с ядрами 3×3 и единичным шагом свертки. После каждой пары включены слои подвыборок (MaxPooling) 2×2. Первая пара включает по 32 фильтра, вторая, третья и четвертая – по 64, 128 и 256 соответственно. Полносвязный классификатор включает входной слой на 4096 входов и 256 выходов, слой 50-процентного прореживания (Dropout) и выходной слой с десятью выходами по числу классов. Для активации сверточных слоев и входного слоя классификатора используется кусочно-линейная функция (ReLU). Количество настраиваемых параметров такой сети составляет 2’223’082 [19].

Сеть с описанной архитектурой, для которой далее в работе принято обозначение C-CNN (Custom Convolutional Neural Network), на тестовом наборе продемонстрировала точность классификации 97,91 %, т.е. из 2503 изображений неверно распознала 52. Несмотря на то что такая точность является довольно высокой, на сегодняшний день существует значительное разнообразие более сложных архитектур, включающих bottleneck-слои (сети типа Inception), residual-блоки (сети типа ResNet), а также ряд других решений и их сочетаний [19]. Тем не менее из сравнительного анализа точности классификации, выполненного с использованием техники переноса обучения (Transfer Learning) [23] для различных архитектур ГСНС, следует, что заметного улучшения точности классификации не происходит.

Для проверки того, повлияет ли существенным образом выбор архитектуры сети на получаемые результаты в условиях ретрансляционных помех, были дополнительно дообучены сети Xception [24] и MobileNetV1 [25], продемонстрировавшие в беспомеховой обстановке сопоставимую с C-CNN точность 97,35 и 96,47 % соответственно.

Продолжительность обучения с использованием GPU (GeForce GTX1660SUPER) для отдельной эпохи составила 7 с для сети C-CNN, 16 с – для MobileNetV1 и 47 с – для Xception. Общее количество эпох для сетей C-CNN составляло от 300до 500, сети MobileNetV1 – от 100 до 350, сети Xception – от 50 до 500. Различное количество эпох обусловлено более ранним появлением признаков переобучения сети при разном количестве ЛТО. Так, при малом количестве ЛТО сети быстро обучаются правильно классифицировать объекты, при большом – рост точности классификации быстро прекращается, так как сети быстро достигают ее предельного небольшого показателя. При промежуточных значениях количества ЛТО стабилизация значения точности наступает только при значительном (порядка 400–500) количестве эпох. Полное обучение на отдельном наборе заняло от 35 до 58 мин (C-CNN), от 27 до 93 мин (MobileNetV1) и от 42 мин до 6,5 ч (Xception).

Каждая из трех сетей (C-CNN, MobileNetV1, Xception) обучалась на каждом наборе данных по отдельности, оценка точности классификации каждой обученной сети проводилась на тестовых наборах с соответствующим количеством ЛТО. Значения максимальной точности классификации, достигнутые каждой сетью, приведены в таблице 1.

Таблица 1

Максимальные точности классификации в условиях ретрансляционных помех (q = 0 дБ)

Архитектура сети

Тестовый набор (количество ЛТО)

0

50

125

250

500

C-CNN

97,91 %

94,47 %

89,22 %

77,04 %

59,13 %

MobileNetV1

96,47 %

90,76 %

80,77 %

61,94 %

43,46 %

Xception

97,35 %

94,55 %

87,26 %

70,47 %

46,99 %

Как следует из полученных результатов (табл. 1), все сети довольно успешно решают задачу классификации даже при 250 ЛТО, когда визуальные отличия объектов разных классов практически не наблюдаются (рис. 2).

Тем не менее даже при 500 ЛТО точность классификации для C-CNN достигает практически 60 %. Для оценки характеристик совокупности ЛТО, обеспечивающей срыв выполнения задачи классификации, были сформированы аналогичные наборы изображений при q = 10 дБ, примеры которых приведены на рисунке 3.

Рис. 3. Примеры изображений наборов изображений при различном количестве ЛТО (q = 10 дБ)

Значения максимальной точности классификации, достигнутые каждой сетью при q = 10 дБ, приведены в таблице 2.

Графическое представление результатов, приведенных в таблицах 1 и 2, приведено на рисунке 4. Зависимости с заштрихованными маркерами соответствуют результатам при q = 10 дБ.

Таблица 2

Максимальные точности классификации в условиях ретрансляционных помех (q = 10 дБ)

Архитектура сети

Тестовый набор (количество ЛТО)

0

50

125

250

500

C-CNN

97,91 %

88,1 %

57,53 %

22,44 %

10,98 %

MobileNetV1

96,47 %

76,24 %

40,78 %

13,42 %

10,93 %

Xception

97,35 %

80,29 %

48,84 %

17,22 %

11,34 %

Из их анализа следует, что срыв задачи классификации (точность порядка 20 % и ниже) обеспечивается при условии, что количество ЛТО превышает 250, а их средняя амплитуда на порядок превышает средний уровень отметки объекта (q = 10 дБ).

Учитывая, что при разрешении около 0,3 м отметка даже отдельного объекта авто- и бронетехники включает несколько сотен разрешаемых элементов, оценка количества ЛТО, требуемого для срыва задачи классификации, составила сопоставимую величину.

Следует полагать, что при более низком разрешении необходимое количество ЛТО будет существенно меньшим, так как даже в беспомеховой обстановке ухудшение пространственного разрешения РЛИ объективно приводит к снижению качества работы классификатора любого типа.

Для проверки этого предположения был сформирован набор изображений с 25, 50, 125 и 250 ЛТО (q = 0 дБ) с исходным разрешением, после чего над ним осуществлялись процедуры пространственной фильтрации для формирования двух наборов, разрешение одного из которых ухудшено в два (рис. 5), а другого – в три раза (рис. 6).

Рис. 5. Примеры из наборов изображений при различном количестве ЛТО (kr = 2; q = 0 дБ)

Рис. 6. Примеры из наборов изображений при различном количестве ЛТО (kr = 3; q = 0 дБ)

Пространственная фильтрация изображений осуществлялась путем выполнения операции вида

(4)

где

kr – коэффициент, характеризующий, во сколько раз в результате фильтрации ухудшается разрешение изображения, в рассматриваемом случае принимались kr = 2 и kr = 3.

Значения максимальной точности классификации, достигнутые сетью С-CNN при исходном разрешении (kr = 1), и разрешении, ухудшенном в два (kr = 2) и три (kr = 3) раза, приведены в таблице 3, а также представлены в виде графических зависимостей на рисунке 7.

Таблица 3

Максимальные точности классификации в условиях ретрансляционных помех при различном разрешении изображений

 

Тестовый набор (количество ЛТО)

0

25

50

125

250

kr = 1

97,91 %

95,89 %

94,47 %

89,22 %

77,04 %

kr = 2

89,74 %

59,58 %

51,68 %

35,69 %

26,12 %

kr = 3

79,13 %

42,94 %

37,01 %

25,48 %

19,87 %

Из полученных результатов следует, что при трехкратном ухудшении разрешения (приблизительно до 1 м) точность классификации в условиях ретрансляционных помех резко снижается и при 50 ЛТО не превышает 40 %. При 250 ЛТО, средняя амплитуда которых сопоставима со средним уровнем отметки объекта (q = 0 дБ), достигается практически гарантированный срыв классификации (точность классификации не превышает 20 %).

Выводы

В беспомеховой обстановке точность классификации РЛИ объектов с использованием ГСНС достигает практически 98 %, что свидетельствует о необходимости повышения их скрытности от радиолокационной разведки, в том числе и за счет постановки ретрансляционных помех.

В целом, ГСНС продемонстрировала хорошую устойчивость к воздействию ретрансляционных помех. Так, при среднем уровне ЛТО, сопоставимом со средним уровнем отметки объекта (при отношении помеха/сигнал 0 дБ), точность классификации даже при 125 ложных отметках снизилась только на 10–15 %. При 250 ЛТО, когда визуальная классификация представляется практически невозможной, ГСНС продемонстрировали довольно высокую точность (от 61,94 % для MobileNetV1 до 77,04 % для C-CNN). Даже при 500 ЛТО точность классификации не снизилась менее чем до 40 %, а для C-СNN осталась достаточно высокой – 59,13 %.

Только при увеличении среднего уровня ЛТО до величины, на 10 дБ превышающей средний уровень отметок объектов, и доведении их количества до 250-ти и более, ретрансляционная помеха обеспечила снижение точности классификации допрактически приемлемых (менее 20 %) с позиции задач радиоподавления значений.

При ухудшении пространственного разрешения РЛИ, которое само по себе приводит к быстрому снижению точности классификации даже в беспомеховой обстановке, требования к ретрансляционной помехе смягчаются. Так при разрешении около 0,6 и 0,9 м требуемое количество ЛТО, обеспечивающее снижение точности классификации до 20–35 %, составило 125–250 при их среднем уровне, сопоставимом со средним уровнем отметок объектов.

Список литературы

1. Zhu X., Montazeri S., Ali M., Hua Yu., Wang Yu., Mou L., Shi Yi., Xu F., Bamler R. Deep Learning Meets SAR. arXiv:2006.10027v2 [eess. IV] 5 Jan 2021.

2. Wang H., Chen S., Xu F., Jin Y.-Q. Application of Deep-Learning Algorithms to MSTAR Data. 2015 IEEE International Geoscience and Remote Sensing Symposium (IGARSS). 2015. P. 3743– 3745. DOI: 10.1109/IGARSS.2015.7326637

3. Chen S., Wang H., Xu F., Jin Y.-Q. Target Classification Using the Deep Convolutional Networks for SAR Images. IEEE Transaction Geoscience and Remote Sensing. 2016. Vol. 54. No. 8. P. 4806–4817. DOI: 10.1109/TGRS.2016.2551720

4. Anas H., Majdoulayne H., Chaimae A., Nabil S.M. Deep Learning for SAR Image Classification. 2020. DOI: 10.1007/978-3-030-29516-5_67

5. Chen S., Wang H. SAR Target Recognition Based on Deep Learning. 2014 International Conference on Data Science and Advanced Analytics (DSAA). 2014. P. 541–547. DOI: 10.1109/DSAA.2014.7058124

6. Coman C., Thaens R. A Deep Learning SAR Target Classification Experiment on MSTAR Dataset. 2018 19th International Radar Symposium (IRS). 2018. P. 1–6. DOI: 10.23919/IRS.2018.8448048

7. Furukawa H. Deep Learning for End-to-End Automatic Target Recognition from Synthetic Aperture Radar Imagery. arXiv:1801.08558v1 [cs. CV] 25 Jan 2018.

8. Profeta A., Rodriguez A., Clouse H.S. Convolutional Neural Networks for Synthetic Aperture Radar Classification. Proc. SPIE 9843, Algorithms for Synthetic Aperture Radar Imagery XXIII, 98430M (14 May 2016). DOI: 10.1117/12.2225934

9. Wang Z., Xu X. Efficient deep convolutional neural networks using CReLU for ATR with limited SAR images. The Journal of Engineering. 2019. Vol. 2019. No. 21. P. 7615–7618. DOI: 10.1049/joe.2019.0567

10. Wilmanski M., Kreucher C., Lauer J. Modern Approaches in Deep Learning for SAR ATR. Proc. SPIE 9843, Algorithms for Synthetic Aperture Radar Imagery XXIII, 98430N (14 May 2016). DOI: 10.1117/12.2220290

11. Xinyan F., Weigang Z. Research on SAR Image Target Recognition Based on Convolutional Neural Network. Journal of Physics: Conference Series, 2019. Ser. 1213(2019) 042019. DOI: 10.1088/1742-6596/1213/4/042019

12. Бородинов А. А., Мясников В. В. Сравнение алгоритмов классификации радарных изображений при различных методах предобработки на примере базы MSTAR // Сборник трудов IV международной конференции и молодежной школы «Информационные технологии и нанотехнологии» (ИТНТ-2018). Самара: Новая техника, 2018. С. 586–594.

13. Биленко С. В., Чередеев К. Ю., Зограбян М. К. Перспективы использования глубоких нейронных сетей в радиолокации // Вопросы радиоэлектроники. 2017. № 1. C. 57–63.

14. Казачков Е. А., Матюгин С. Н., Попов И. В., Шаронов. В. В. Обнаружение и классификация малоразмерных объектов на изображениях, полученных радиолокационными станциями с синтезированной апертурой // Вестник Концерна ВКО «Алмаз – Антей». 2018. № 1. C. 93–99.

15. Купряшкин И. Ф., Лихачев В. П. Космическая радиолокационная съемка земной поверхности в условиях помех. Воронеж: Научная книга, 2014. 460 с.

16. Радзиевский В. Г., Неволин А. В. Модели и методики оценки эффективности радиоподавления средств радиоэлектронной разведки и поражения авиационно-космических систем высокоточного оружия в условиях информационного конфликта. Воронеж: ВУНЦ ВВС «ВВА», 2016. 234 с.

17. Современная радиоэлектронная борьба. Вопросы методологии / Под ред. В.Г. Радзиевского. М.: Радиотехника, 2006. 424 с.

18. Владимиров В. И., Лихачев В. П., Шля хин В. М. Антагонистический конфликт радиоэлектронных систем. Методы и математические модели / Под ред. В. М. Шляхина. М.: Радиотехника, 2004. 384 с.

19. Купряшкин И. Ф., Мазин А. С. Классификация объектов военной техники с использованием сверточной нейронной сети на радиолокационных изображениях, сформированных в условиях шумовых помех // Вестник Концерна ВКО «Алмаз – Антей». 2022. № 1. C. 71–81. DOI: 10.38013/2542-0542-2022-1-71-81

20. Kechagias-Stamatis O., Aouf N. Automatic Target Recognition on Synthetic Aperture Radar Imagery: A Survey. arXiv:2007.02106v2 [cs.CV] 12 Dec 2020.

21. Николенко С., Кадурин А., Архангельская Е. Глубокое обучение. СПб.: Питер, 2018. 480 с.

22. Simonyan K., Zisserman A. Very Deep Convolutional Networks For Large-Scale Image Recognition. arXiv:1409.1556v6 [cs.CV] 10 Apr 2015.

23. Купряшкин И. Ф. Сравнительные результаты точности классификации радиолокационных изображений объектов набора MSTAR сверточными нейронными сетями с различными архитектурами // Журнал радиоэлектроники. 2021. № 11. DOI: 10.30898/1684-1719.2021.11.14

24. Chollet F. Xception: Deep Learning with Depthwise Separable Convolutions. arX-iv:1610.02357v3 [cs.CV] 4 Apr 2017.

25. Howard A. G., Zhu M., Chen B., Kalenichenko D. MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications. arXiv:1704.04861v1 [cs.CV] 17 Apr 2017.


Об авторе

И. Ф. Купряшкин
Военный учебно-научный центр Военно-воздушных сил «Военно-воздушная академия имени профессора Н. Е. Жуковского и Ю. А. Гагарина»
Россия

Купряшкин Иван Федорович – доктор технических наук, доцент, начальник кафедры боевого применения средств радиоэлектронной борьбы (с воздушно-космическими системами управления и наводящимся оружием)

Воронеж



Рецензия

Для цитирования:


Купряшкин И.Ф. Классификация объектов военной техники с использованием сверточной нейронной сети на радиолокационных изображениях, сформированных в условиях ретрансляционных помех. Вестник Концерна ВКО «Алмаз – Антей». 2022;(4):70-79. https://doi.org/10.38013/2542-0542-2022-4-70-79

For citation:


Kupryashkin I.F. Classification of military equipment targets on radar images generated in repeater jamming conditions using a convolutional neural network. Journal of «Almaz – Antey» Air and Space Defence Corporation. 2022;(4):70-79. https://doi.org/10.38013/2542-0542-2022-4-70-79

Просмотров: 425


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2542-0542 (Print)