С точки зрения робота

ОБЗОР / #4_2025
Записала Надежда ФЕТИСОВА / Фото: Midjourney, Wikipedia, Газпром Нефть, VizorLabs, ТВЭЛ

Системы компьютерного зрения были созданы больше полувека назад. Сейчас они повсеместно используются в быту и на производстве, в том числе в атомпроме. Но смогут ли они полностью заменить человека? Мы попросили поразмышлять над этой проблемой директора Института информационных технологий (ИИТ) НИЦ «Курчатовский институт» Петра Александрова и его коллег: начальника лаборатории математических методов Александра Прусакова, ведущих экспертов Владимира Саркисова и Сергея Романова, инженера-­исследователя Галину Антонову. Они подготовили обзор глобального и российского рынков технологий компьютерного зрения, а также особенностей их внедрения на предприятиях атомной энергетики.

Компьютерное зрение — ​способность функционального блока получать, обрабатывать и интерпретировать визуальные данные. Британская ассоциация машинного зрения (BMVA) определяет компьютерное зрение как «автоматическое извлечение полезной информации из изображения или их последовательности, ее понимание и анализ».
«Первые же эксперименты (связанные с техническим зрением) выявили огромные трудности, вытекающие из наделения машины способностью видеть. Оказалось, что изображения одного и того же объекта, полученные в естественных условиях, настолько не похожи друг на друга, что их очень сложно распознать».
А.С. Потапов, «Системы компьютерного зрения: учебное пособие»
Впервые о компьютерном зрении (после писателей-­фантастов) начали говорить ученые, изучавшие зрение животных и человека. Уже с начала 1960‑х началось моделирование на ЭВМ наблюдаемых у биологических организмов феноменов восприятия изображений на сетчатке.

В Советском Союзе самой знаменитой научной школой, изучавшей «биологическое» зрение, был коллектив биофизиков и нейрофизиологов под руководством М. М. Бонгарда. В 1953 году М. М. Бонгард провел измерения реакций на зрительном нерве лягушки. В начале 1960‑х биофизики приступили к компьютерному моделированию отдельных функций зрительного восприятия человека. Промежуточные результаты 1967 года были изложены в монографии М. М. Бонгарда «Проблема узнавания»; там, например, описываются первые в СССР исследования распознавания образов с использованием нейросетей, выполненные в 1963 году аспирантом лаборатории Бонгарда А. П. Петровым. Способности нейросетей обобщать образы и обнаруживать (в процессе обучения) значимые признаки изучались посредством попыток моделирования распознавания букв, по-разному деформированных и искаженных. Открытые таким образом теоретические ограничения возможностей распознавания у базовых нейросетевых алгоритмов подтверждаются экспериментами на основных типах современных нейросетевых архитектур.

В 1982 году выходит монография известного американского нейрофизиолога и психолога Дэвида Марра «Зрение. Информационный подход к изучению представления и обработки зрительных образов». Эта знаменитая книга — ​первая попытка построить единую теорию зрения на алгоритмической основе.

С начала 1980‑х работы по моделированию зрительного восприятия были направлены в основном на решение технических задач и не подразумевали изучения механизмов восприятия в живой природе.

«Первые же эксперименты (в техническом зрении) выявили огромные трудности, связанные с наделением машины способностью видеть, — ​отмечает авторитетный исследователь А. С. Потапов в книге „Системы компьютерного зрения: учебное пособие“. — ​Оказалось, что изображения одного и того же объекта, полученные в естественных условиях, настолько не похожи друг на друга, что их очень сложно распознать. Не так просто оказалось осуществлять и навигацию в пространстве по изображениям, поскольку в явном виде плоские изображения не содержат информацию о трехмерных характеристиках окружающих объектов и расстояниях до них. Попытки решить данные проблемы привели к возникновению новой области знаний — ​компьютерного зрения».
Зарегистрировать, распознать, обработать
Основной компонент системы компьютерного зрения (КЗ) — ​цифровая фото- или видеокамера, регистрирующая излучение в оптическом диапазоне. Практически во всех современных оптических камерах используются датчики изображения CCD или CMOS. Некоторые оптические матрицы работают и с ИК-составляющей спектра. Цифровые данные, поступающие с чувствительных элементов матриц, можно представить себе как несколько (как правило, три) двухмерных массивов чисел, соответствующих величинам оптического потока для трех каналов цветности в цветовой модели — ​RGB.

Множество алгоритмов и методов, накопленных за десятилетия развития КЗ, часто применяют для обработки данных, регистрируемых не только традиционными оптическими сенсорами, но и лидарами, радарами, различными видами микроскопов, тепловизорами, тактильными сенсорами. К методам КЗ относится и цифровая обработка данных в рентгеновской, нейтронной и мюонной томографии.
Дальностный портрет, полученный с помощью ToF 3D-камеры, используемой для контроля доступа
Относительно новый инструмент промышленного КЗ — ​ToF 3D, или трехмерная времяпролетная камера. Это устройство для обнаружения, идентификации и определения расстояния до объектов с помощью света. Принцип работы такой камеры заключается в определении времени, за которое свет покрывает расстояние от своего источника до объекта и обратно.

Системы компьютерного зрения решают три главных типа задач:
  • обработка изображений и видеорядов; это редактирование и улучшение цифровых данных, совмещение изображений из разных источников, создание фото- и видеоэффектов, сжатие, предобработка для дальнейшего анализа методами машинного обучения;
  • распознавание образов; это алгоритмы выделения признаков, автоматической идентификации и классификации объектов на изображениях, применение методов машинного обучения для работы с изображениями;
  • анализ сцен; это определение действий операторов и персонала, контроль за ними, а также функционированием агрегатов, отслеживание движений в видеопотоке, создание трехмерных моделей на основе двухмерной информации и пр.

Основные цели использования КЗ в промышленности:
  • контроль качества продукции и выполненных работ (оценка целостности изделий, их комплектности, обнаружение поверхностных дефектов);
  • контроль операций (автоматический контроль порядка и типов действий работника, качества выполнения погрузочно-­разгрузочных работ, наличия посторонних объектов на производственных участках);
  • мониторинг безопасности (фиксация событий и инцидентов, сбор данных о состоянии оборудования, соблюдении сотрудниками требований техники безопасности, обнаружение посторонних лиц в зонах контроля, а также биометрические системы доступа);
  • обработка, хранение, индексация видеорядов и изображений (при получении потока с видеокамер производится цифровая обработка визуальных данных методами КЗ);
  • «умная» робототехника (КЗ - главный интеллектуальный элемент роботов, применяемых на производствах).

В любой операции визуального контроля на основе оптического сенсора источник света играет решающую роль. Конструкция источника света оказывает существенное влияние на успех всей промышленной системы КЗ, иногда создание особого осветителя — ​это ключевая работа проекта по КЗ. Однако во многих промышленных системах КЗ, например, на основе тепловизоров, камер с гамма-­спектрометром, источником излучения является сам объект наблюдения.
Основные модули и их взаимодействие в системе промышленного КЗ
Все технологии КЗ следует разделить на две основные категории: классическое компьютерное зрение и компьютерное зрение на основе машинного обучения.

Наиболее ярко их различие проявляется в распознавании образов — ​автоматической идентификации и классификации объектов на изображениях.

Классическое компьютерное зрение — ​это набор алгоритмов, в котором эталонные описания изображений объектов (например, символов алфавита) строятся на придуманных инженером признаках (выделенных на изображениях с помощью написанного кода) и отношениях между ними. Вычисленное признаковое описание входного символа сравнивается с хранимым эталонным описанием. Успех «классического» проекта КЗ сильно зависит от таланта инженера, это почти искусство, которое в мире называют feature engineering.

Основные типы алгоритмов классического КЗ:
  • Анализ формы. В 1980‑х годах был достигнут значительный прогресс в этой технике: преобразование Хафа позволило компьютерам распознавать и интерпретировать геометрические фигуры на изображениях. В то же время интенсивно разрабатывались алгоритмы стереозрения для восприятия 3D-сцен с помощью двух разнесенных камер.
  • Фильтрация, детекция контуров, геометрические преобразования. Основные алгоритмы также были созданы в 1980‑х. Они расширили возможности обработки и сравнения визуальных данных.
  • Извлечение признаков и локальные дескрипторы. Совершенствование алгоритмов извлечения признаков сыграло решающую роль в истории КЗ. В 1990‑х годах исследователи разработали алгоритмы извлечения отличительных признаков из изображений, позволившие надежно обнаруживать и сопоставлять признаки. Введение локальных дескрипторов дало возможность эффективно описывать и сравнивать области изображений и сделало распознавание объектов гораздо более эффективным.

При компьютерном зрении на основе машинного обучения формирование признаков, отношений между ними и выбор решающего правила распознавания выполняются автоматически. Как правило, это происходит при помощи параметрической оптимизации на выбранной модели машинного обучения, например, методом градиентного спуска, как это делается в нейросетевых алгоритмах «глубокого обучения». Такая оптимизация выполняется в процессе «обучения» на основе предоставленных примеров решений (иными словами, на заранее размеченной выборке).

Самый распространенный алгоритм КЗ на основе машинного обучения — ​это метод Виолы — ​Джонса (Viola-Jones object detection), позволяющий обнаруживать объекты на изображениях в реальном времени. Его предложили Паул Виола и Майкл Джонс в 2001 году для поиска лиц на изображениях. Теперь этим алгоритмом пользуется каждый, делающий фотоснимки при помощи смартфона. В основе алгоритма лежат придуманные авторами воистину гениальные признаки, опирающиеся на суммирование пикселей из прямоугольных регионов; их можно вычислять невероятно быстро даже на очень слабом процессоре.
КЗ: есть проблемы
При разработке системы КЗ на основе машинного обучения сбор необходимого объема репрезентативных данных для обучающей выборки может оказаться самым дорогостоящим этапом. При этом заранее, до сбора размеченных данных и "обучения модели", нельзя сказать, какую именно алгоритмическую модель машинного обучения нужно применить, какой объем обучающей выборки достаточен для достижения требуемой точности классификации и будет ли классификатор устойчив к малому изменению в будущих реальных данных по сравнению с теми, на которых проводилось обучение. При решении этих проблем опыт инженера становится ключевым для успеха проекта.

Часто для достижения требуемых параметров точности работы системы требуются огромные обучающие выборки. Например, не самый большой набор для обучения и тестирования распознавания лиц — ​CelebFaces Attributes Dataset (CelebA) — ​содержит более 200 тыс. изображений 10 177 уникальных людей. Что же делать, если требуется сформировать обучающий набор изображений аварийных событий: течей, возгораний, задымлений и прочих нетипичных выбросов в конкретном цехе? Можно ли вообще набрать необходимое количество таких изображений для представительной обучающей выборки? Одна из самых актуальных задач КЗ на основе машинного обучения — ​это моделирование способности человека обучаться распознаванию на небольшом числе примеров.

Кроме того, для успешной работы системы КЗ с использованием метода машинного обучения требуется выполнять предобработку изображений (разрабатывать код программы по извлечению уникальных признаков). Для этого нужны опытные специалисты по классическому компьютерному зрению.

Основная проблема систем КЗ на основе машинного обучения (и в особенности на основе нейросетей) — ​это неустойчивость решений к "шумам" во входных данных. Возьмем в качестве примера автомобильный автопилот, считывающий дорожный знак. Если кто-то разместит на знаке наклейку, это не отвлечет внимания водителя-­человека. А нейросеть ошибется, потому что знак теперь отличается от тех, на которых система обучалась. Реальная обстановка может создавать всевозможные «шумы», которые люди проигнорируют, а машинный алгоритм легко в них запутается.

Несмотря на общий восторженный новостной фон вокруг использования нейросетей, их применение на практике не всегда успешно. Так, российская компания «Малленом Системс» более 10 лет работает на рынке систем компьютерного зрения. При этом доля внедрения систем КЗ с использованием машинного обучения — ​лишь 10 %, отмечают в компании. Кроме того, обучение и использование достаточно больших и надежных моделей нейронных сетей требуют выполнения параллельных вычислений на специальном многопроцессорном оборудовании, например GPU (графических ускорителях).

Компьютерное зрение как наука пока еще не состоялось, считает А. С. Потапов: «Разрабатываемые в настоящее время системы компьютерного зрения предназначены для решения конкретных задач, обычно ориентированы только на один тип изображений и работают в ограниченных предметных областях. Построение системы компьютерного зрения общего назначения является неразрешимой на текущий момент задачей и может рассматриваться лишь как некая конечная цель исследований в данной области».
Рожденный в СССР
Коммерчески успешные применения КЗ берут начало с алгоритмов ввода в компьютер печатных текстов. Так, сотрудники лаборатории М. М. Бонгарда Г. М. Зенкин и А. П. Петров в статье, опубликованной в 1967 году в журнале «Биофизика», описали первый промышленный алгоритм OCR (оптического распознавания печатных символов). Возможность проверить практическую ценность этого алгоритма появилась только в 1990‑х, когда стали доступны сканеры. OCR-алгоритм Зенкина-Петрова не использовал нейросеть или какой-либо другой метод машинного обучения, это был алгоритм «классического компьютерного зрения». Этот алгоритм один из первых и при этом самых коммерчески успешных. В начале 1990‑х OCR-алгоритм Зенкина-Петрова массово предустанавливается для распознавания печатного текста на большинство промышленных и бытовых сканеров компаний Hewlett-­Packard, Canon, Samsung. До сих пор он успешно применяется для распознавания автомобильных номеров, номеров транспортных контейнеров, маркировки промышленного оборудования.
Амбициозные современные коммерческие проекты в области КЗ, например, беспилотные автомобили или надежная биометрия, пока ждут реализации и выхода из стадии пилотных. Так, несмотря на ежегодные обещания и колоссальные вложения за последние 15 лет со стороны крупнейших ИТ-гигантов (Uber Technologies, Google, Apple), на рынке до сих пор не появился беспилотный личный автомобиль, управляемый «одной кнопкой».

Основная причина неуспеха большинства коммерческих проектов в области КЗ — ​непонимание исполнителем и заказчиком работ границ применимости модных методов КЗ на основе так называемого «глубокого обучения». До сих пор остаются огромным тормозом обнаруженные еще в 1960‑х годах ограничения возможностей нейронных сетей, например, в обучении признакам, инвариантным к повороту и изменению масштаба.
Компьютерное зрение в мире
Оценки объема мирового рынка систем КЗ, опубликованные различными аналитическими компаниями, сильно разнятся в зависимости от методологии исследования, таксономии и классификации технологий компьютерного зрения. Статистические и рейтинговые агентства (Allied Market Research, Statista, Mordor Intelligence) оценивают общемировой рынок компьютерного зрения в 2023 году в $ 15−18 млрд, при этом прогнозируемый рост рынка — ​12−18 % в год. Крупнейшим региональным рынком по КЗ считается Северная Америка. Ключевыми игроками названы Intel, National Instruments, Keyence Corporation, Texas Instruments, SAS Institute Source, Microsoft, Omron, Sony, Cadence Design Systems.

Однако в такие отчеты, возможно, включены повсеместно распространенные технологии и приборы, например, кассовые аппараты продуктовых магазинов с 1D- и 2D-сканерами. Поставщиков планшетных офисных сканеров и даже ковриков для оптической мыши тоже включают в список поставщиков систем КЗ!
  • $ 15–18 млрд

    глобальный рынок компьютерного зрения (2023 г.)
  • 12–18%

    прогнозируемый рост (ежегодно)
Привычная оптическая мышь — ​это система КЗ. Она хорошо демонстрирует, насколько эксплуатационные характеристики зависят от изменения условий. Например, мышь плохо работает на полированном столе; ситуацию спасает резиновый коврик.
Крупнейший сегмент в разделе распознавания изображений КЗ — ​это системы распознавания лиц: 30 % рынка по этому разделу.

Согласно отчетам, около 20 % совокупных затрат пользователей систем компьютерного зрения — ​это программное обеспечение (ПО), примерно 6 % — ​сервисы, оставшаяся основная часть затрат (около 64 %) приходится на оборудование (компьютеры, камеры, осветители, оптику, лидары и пр.). На мировом рынке сенсоров (видеокамер) для систем КЗ доминируют Sony (~40 %), Samsung (~20 %), Omnivision (~12 %).

Однако при создании новой промышленной системы КЗ соотношение затрат на разработку нового ПО и оборудования, скорее всего, окажется далеко не в пользу оборудования, причем с большим отрывом. Причина в том, что внедрение системы КЗ в производство на современном этапе не будет покупкой готовой системы — ​потребуется выполнить дорогостоящие НИОКР.

Аналитические агентства приводят следующие сдерживающие факторы рынка:
  • высокая стоимость;
  • недостаток профессионалов в области сложных алгоритмов и медленные темпы внедрения машинного, глубокого обучения и нейронных сетей;
  • некомпетентность отраслевых специалистов в области КЗ, а также многочисленные и избирательные требования конечных пользователей.

Российские компании и технологии успешно выходят на мировой рынок КЗ. Например, ABBYY — ​признанный мировой лидер распознавания символов (OCR) с самой большой долей глобального рынка (12−13 %, при этом объем мирового рынка OCR оценивается в $ 10,5 млрд). А поставщик номер один в мире на рынке роботизированных сельскохозяйственных машин — ​российская компания Cognitive Technologies, также поставляющая системы автоматизации ж/д транспорта на основе КЗ. Технологии распознавания лиц от российской компании VisionLabs используются более чем в 35 странах мира, в том числе в биометрической системе безопасности в парижском аэропорту им. Шарля де Голля, для удаленной верификации клиентов в банке Emirates NBD и т. д. Система интеллектуальной видеоаналитики российской компании ISS распознает номера грузовых контейнеров (на основе OCR-алгоритма Зенкина-Петрова) в портах по всему миру. (Система предназначена для автоматизации процесса регистрации морских контейнеров и ж/д вагонов, проверки соответствия их номеров данным перевозочных документов и учета.)

Один из мировых лидеров по применению КЗ среди открытых программных библиотек — ​созданная энтузиастами из Нижнего Новгорода библиотека OpenCV — ​фактически отраслевой стандарт в КЗ. Более 80 % систем КЗ в мире используют тот или иной модуль OpenC V.
Российский рынок промышленных систем КЗ
Оценить российский рынок компьютерного зрения непросто, в том числе в силу неопределенности таксономии: что именно следует относить к компьютерному зрению? Решения с использованием технологий КЗ в большинстве случаев являются органической частью других, более широких решений.

Российский рынок КЗ стремительно развивается и даже опережает по темпам роста мировой. На это положительно повлияли курс на импортозамещение и государственная поддержка сферы компьютерных технологий.
Количество программ КЗ, внесенных в Реестр П О РФ, по годам
Применение систем компьютерного зрения в России
По данным РБК, наибольшую долю рынка КЗ в России составляют решения в области видеонаблюдения и безопасности (32 %), промышленности (17 %), медицины (14 %) и торговли (10 %). Спрос со стороны бизнеса растет. Например, число запросов на использование компьютерного зрения в кассах самообслуживания выросло за 2022 год на 580 %. Генеральный директор компании VisionLabs Дмитрий Марков отмечает: в последнее время количество заказчиков, заинтересованных во внедрении компьютерного зрения на производстве, увеличилось на порядок. Задача непростая: типовых решений нет, каждый проект ­уникален.

Согласно аналитическим отчетам, 64 % стоимости системы КЗ приходится на оборудование. Благодаря импортозамещению на российском рынке КЗ присутствует видеооборудование отечественного производства, в том числе видеокамеры видимого и УФ-диапазонов, тепловизоры, скоростные камеры (до 4 тыс. кадров в секунду), видеосерверы и пр.

На российском рынке легко можно найти исполнителей НИОКР и поставщиков готовых систем практически всего спектра задач КЗ для промышленных производств.

Перечислим некоторые значимые и успешные НИОКР в области промышленных систем КЗ, выполненные по заказу крупнейших российских корпораций.

«Газпром нефть» разработала цифровую систему видеоаналитики, в онлайн-­режиме оценивающую состояние зимников — ​временных дорог из снега и льда, создаваемых при минусовой температуре для доставки грузов на труднодоступные территории. Технология получила свидетельство «Роспатента» и внедряется на месторождениях компании в Восточной и Западной Сибири. Транспорт оснащается видеокамерами и лидарами для воздушно-­лазерного сканирования объектов трассы.
Ученые аналитической лаборатории в Университете Ньяла (Сьерра-Леоне) с помощью оборудования, предоставленного МАГАТЭ, измеряют содержание питательных микроэлементов в рисе и маниоке. Радиометрические инструменты используют также для обнаружения, мониторинга и отслеживания загрязняющих веществ в пищевых продуктах
«Северсталь» первой среди российских металлургических компаний реализует масштабный проект, направленный на автоматизацию контроля качества продукции, в том числе с использованием нейросетей и компьютерного зрения. С их помощью уже контролируется выпуск порядка половины объема производимой металлопродукции, в результате чего обеспечено снижение среднего уровня претензий в цехе на 55 %. Проекту уже семь лет, его завершение ожидается в 2026−2028 годах. Инвестиции составили 1,28 млрд руб., в будущем в развитие проекта планируется вложить не менее 2 млрд руб.

«АЛРОСА» использует автоматические системы сортировки алмазов по цвету и форме. В основе решения — ​оптоэлектронный стереоскопический метод контроля, технологии машинного зрения и машинного обучения.

«РЖД» внедрила комплексы Cognitive Rail Pilot, оснащенные системами машинного зрения. Они установлены на маневровых локомотивах ЧМЭЗ. Система инициирует автоторможение локомотивов по светофору, запрещающему положению пошерстной стрелки, подъезду к составу быстрее допуска, а также при обнаружении препятствий на путях; прогнозирует столкновения, рассчитывает траектории объектов, скорость поезда.

«ЕВРАЗ» внедрила систему видеоаналитики для контроля качества стальных заготовок. Камеры помогают проверять каждый сантиметр полуфабрикатов, нейросети исследуют поверхность заготовки на наличие дефектов. Номер некачественного изделия отображается на экране компьютера оператора поста. Такой контроль помогает своевременно отбраковать изделие.

«Росэлектроника» госкорпорации «Ростех» внедрила систему машинного зрения, осуществляющую комплексный контроль ручной работы персонала на производстве, проверяя действия сотрудников на соответствие технологической документации. Это позволяет минимизировать влияние человеческого фактора и вероятность ошибок. Каждое рабочее место оснащается планшетом, видеокамерой с микрофоном.

«Транснефть — ​Верхняя Волга» реализовала проект с применением технологии машинного зрения по автоматизации испытаний различных систем измерений качества, учета и транспортировки нефтепродуктов. Внедрение технологии позволило повысить качество и значительно сократить время испытаний систем и оборудования, исключить человеческий фактор, увеличить производительность труда и автоматизировать анализ результатов.
VizorLabs — ​проект внедрения ИИ-видеоаналитики для повышения безопасности на атомных станциях
В помощь атомщикам
Безопасность — ​основное направление внедрения КЗ в атомной отрасли. Контроль износа и определение остаточного срока службы оборудования и конструкций — ​актуальнейшая задача. Из-за особых условий эксплуатации в атомной промышленности проблемы коррозии, усталости и износа ядерного оборудования требуют самого серьезного внимания. Если проблема не будет вовремя обозначена и учтена, это может привести к ошибкам при строительстве, монтаже и эксплуатации ядерного оборудования, что, в свою очередь, несет серьезные угрозы для безопасности и огромные экономические потери.

В рабочих средах атомной промышленности много труднодоступных зон с высокой радиоактивностью, непрерывная эксплуатация оборудования сильно затрудняет точный осмотр и прогнозирование остаточного срока службы. Поэтому использование технологий КЗ для автоматического обнаружения дефектов оборудования желательно в режиме реального времени.

Примеры применения компьютерного зрения в атомной отрасли России:

  • Считывание и распознавание показаний цифровых и аналоговых приборов в зонах ограниченного доступа в режиме 24/7.
  • Аварийная диагностика оборудования на основе многоканальных систем, например, двухканальной инфракрасной (ИК) и оптической в оттенках серого для улучшения обнаружения аномалий на АЭС.
  • С помощью дронов с системами навигации на основе КЗ по нанесенным на стены меткам выполняется визуальный контроль оборудования АЭС в труднодоступных и опасных зонах.
  • Удаленное автоматическое обнаружение дефектов в стальных компонентах АЭС.
  • Обнаружение и локализация высокоактивных источников гамма-­излучения и зон высокого радиоактивного загрязнения: портативная гамма-­камера «Гамма-визор», портативная спектрометрическая система «Гамма-локатор».
  • В составе мобильных роботов (атомботов). КЗ наделяет робота определенной автономией — ​это облегчает управление им и повышает производительность, например, при обследовании конструкций, осмотре оборудования, мониторинге радиационной обстановки, сборе проб, очистке от радиационного загрязнения и разборе легких завалов, открывании и закрывании клапанов, демонтаже, ремонте.
Отраслевые решения КЗ
  • VizorLabs (АО Концерн «Росэнергоатом»): контроль опоры на поручни при движении по лестничным пролетам; контроль применения СИЗ и промышленной безопасности. Применяется на предприятиях «Атомстройэкспорта», ТВЭЛа, Кольской АЭС.
  • NordClan (Композитный дивизион «Росатома»): дефектоскопия на производстве волокон.
  • Совместная разработка Конструкторско-­технологического института научного приборостроения СО РАН и АО "ТВЭЛ": автоматическое обнаружение дефектов на поверхности топливных таблеток. Контроль качества сварных соединений тепловыделяющих элементов.
  • «Атоминтелмаш» (ФГУП «РАДОН»): промышленный манипулятор KUKA оснащен системой КЗ и захватом, позволяющим удерживать бочки из-под РАО массой до 300 кг, не деформируя корпус. КЗ обеспечивает точное позиционирование брикетов, в которые прессуются бочки, в подлежащем окончательному захоронению контейнере, а также дистанционно измеряет высоту бочек и брикетов. Минимизировано взаимодействие персонала с РАО, сокращен объем подлежащих захоронению отходов.
Как внедрять?
Внедрение новой системы компьютерного зрения на предприятии может происходить по трем основным сценариям.

Первый — ​покупка готовой системы КЗ: развертывание проверенного на других предприятиях программно-­аппаратного комплекса с применением КЗ. Изготовитель системы не участвует в работах, не нужно писать код программ и собирать обучающую выборку. Это самый дешевый и надежный способ. На рынке есть много готовых систем КЗ для решения различных узких промышленных задач, например, охранные системы видеоаналитики, биометрического контроля доступа, маркировки и идентификации. Готовые решения не требуют больших затрат на внедрение и сопровождение. Это хороший выбор для типовых сценариев и небольших проектов. Но следует помнить, что даже простейшая и слабоинтеллектуальная система КЗ, например, система маркировки и идентификации продукции при помощи наклеек QR-кодов (или штрих-кодов), будет работать неудовлетворительно при несоблюдении технических требований эксплуатации.

Второй сценарий — ​внедрение продуктовой заготовки системы КЗ. Он требует проведения ОКР. Некоторые производители в ходе НИОКР разрабатывают систему КЗ для конкретного предприятия. Затем компания-­разработчик выходит на рынок со своей разработкой — ​по сути, готовым программно-­аппаратным комплексом. Однако при развертывании такой системы на производстве все же необходимо участие в работах предприятия-­исполнителя системы КЗ. Также часто предполагается написание дополнительного программного кода или выполнение нового цикла обучения системы.

Чем «интеллектуальнее» система КЗ, тем жестче требования к стандартизации условий ее функционирования. Часто недопустимы отклонения от рекомендованных, очень претенциозных условий освещения, использования конкретной видеокамеры.

С особым вниманием следует относиться к ОКР по внедрению систем КЗ на основе нейросетей. Нейросеть — ​это «черный ящик»: надежно прогнозировать и анализировать ее работу на чуть изменившемся массиве данных нельзя. Нейросеть показывает отличный результат распознавания, но, как правило, только на той выборке, на которой ее обучали (или на очень близкой к ней). Так, точность распознавания лиц на проходной предприятия может оказаться сильно хуже, если зимой сотрудники придут на работу в шапках. При внедрении системы КЗ с нейросетью лучше добавить требование постоянного сопровождения специалистами-­разработчиками, которые будут дообучать нейросеть и обеспечивать ее устойчивую работу.
Промышленная площадка Машиностроительного завода, «Росатом»
Третий сценарий — ​проведение НИОКР, то есть разработка новой системы КЗ, ориентированной на решение уникальной задачи, например, контроль дефектов при конвейерном изготовлении продукции или отслеживание перемещения конкретного оборудования. Выполнение таких НИОКР критично зависит от опыта специалистов КЗ и налаженного взаимодействия с экспертами предметной области. Из-за разнообразия задач КЗ на производстве и сложности оценки реализуемости и экономического эффекта к таким работам рекомендуется подключать третью сторону — ​независимую службу технического надзора (СТН).

Этапы НИОКР по КЗ, в которых участие СТН необходимо:
  • выбор направлений внедрения КЗ на предприятии, анализ всех производственных процессов для генерации идей повышения эффективности и надежности с помощью КЗ;
  • аудит инновационных предложений внедрения КЗ в части выполнимости, окупаемости и устойчивости предлагаемых решений;
  • разработка технического предложения (ТП, аванпроекта);
  • разработка технического задания (ТЗ), разбивка работы на этапы;
  • сбор базы примеров входной информации, ее анализ на полноту и сбалансированность;
  • аудит привлекаемого набора инструментов;
  • организация поиска исполнителя НИОКР;
  • приемка этапов НИОКР;
  • участие в тестировании (на удовлетворение требованиям ТЗ) промежуточных решений и финальной приемке работы;
  • организация авторского сопровождения и контроль качества работы системы КЗ в процессе эксплуатации на некоторый период после приемки работ;
  • организация ведения документации по проекту, обучения пользователей и сопровождающего персонала.

Перед внедрением технологий компьютерного зрения специалисты проводят аудит всего предприятия и определяют участки, на которых внедрение, во‑первых, возможно, во‑вторых, либо принесет значительный экономический эффект, либо существенно повысит безопасность.
В помощь, но не на замену
Системы компьютерного зрения широко используются в быту и на производстве, однако создание новой уникальной системы и ее внедрение на предприятии носит исследовательский характер. Нужно помнить, что эта новая система может так и не достичь уровня эксплуатационных характеристик, установленных техническим заданием.

Применение современных нейросетевых библиотек в НИОКР по КЗ за последние 10 лет позволило достичь некоторого прогресса. Однако использование нейросетей не гарантирует успех проекта, а иногда приводит к бессмысленной трате ресурсов, крайне неустойчивой работе системы КЗ в производственном процессе и разочарованию инициаторов проекта. Определяющие факторы успеха проектов КЗ — ​опыт сотрудников, тщательный предварительный анализ проектов на реализуемость и экономическую целесообразность.

В России есть специалисты высокого уровня в области КЗ и компании, предлагающие услуги по созданию таких систем. Внедрение некоторых систем КЗ на промышленных предприятиях дает огромный экономический эффект. Однако общий уровень «науки о зрении» пока еще далек от человеческих способностей: зрительного восприятия, анализа и классификации.

В 2023 году знаменитый ChatGPT прошел тест Тьюринга на искусственный интеллект. Однако он ориентирован на "понимание" текста. А вот тесты на зрительное распознавание образов (например, Бонгарда, Шолле) системы КЗ с использованием нейросетевых методов машинного обучения пока пройти не могут, как и решить многие практические задачи.

На работниках атомной отрасли лежит большая ответственность за безопасность, и внедрять новые методы автоматизации нужно чрезвычайно осторожно. Приведем слова сотрудника департамента безопасности МАГАТЭ Митчелла Хьюза: «Даже с учетом последних достижений в технологии искусственного интеллекта использовать его в качестве замены человека не представляется целесообразным. Физическая защита, учет и контроль материалов, непосредственные измерения — ​все эти важнейшие направления работы для обеспечения физической ядерной безопасности требуют участия человека».

Использование человеческого труда с каждым годом становится все дороже, особенно на предприятиях с повышенной опасностью. Атомный энергетический комплекс России мог бы выступить инициатором и организатором академических исследований в области зрительного искусственного интеллекта. Необходимо четко сформулировать практически проверяемые ориентиры теоретических исследований в этой области, как это сделал Алан Тьюринг больше 70 лет назад в части текстового искусственного интеллекта.
ДРУГИЕ МАТЕРИАЛЫ