АННОТАЦИИ К СТАТЬЯМ (ЖУРНАЛ ``ИНФОРМАТИЗАЦИЯ И СВЯЗЬ`` №4, 2021)
Нормализация данных для обучения и анализа моделью MaskRCNN методом k-means для компьютерного зрения умного холодильника
Резюме: В данной работе предлагается использовать метод k-средних для контролируемой настройки учебной выборки для семантической сегментации изображений в искусственном зрении умного холодильника. Для решения этой задачи предлагается новая двухэтапная архитектура компьютерного зрения. В предлагаемой архитектуре используются различные наборы настроек оптимизации контрастирования изображений по показателю точной классификации пикселей по их принадлежности к фрагментам исследуемого изображения. Обширная экспериментальная оценка показывает, что предлагаемый метод имеет ключевые преимущества по сравнению с существующими работами. Во-первых, полученные классы пикселей можно напрямую кластеризовать в семантические группы с помощью k-средних, во-вторых, метод может использоваться при дообучении искусственного интеллекта решению задачисемантической сегментации. Разработчики предлагают подход правильного выбора числа k центроидов для получения хорошего качества кластеров, которое трудно определить при высоком значении k. Для преодоления проблемы инициализации метода k-средних предлагается метод инкрементной кластеризации k-средних, который улучшает качество кластеров с точки зрения уменьшения суммы квадратов ошибок. Проведены всесторонние эксперименты по сравнению с традиционным алгоритмом k-средних и его новыми версиями для оценки производительности предлагаемого метода на синтетически сгенерированных наборах данных и некоторых наборах данных реального мира.
Ключевые слова: MaskRCNN, метод k-средних, нормализация данных, OPENCV, python 3.8
M.G. Dorrer, A.E. Alekhina
Data normalization for training and analysis of the MaskRCNN model using the k-means method for computer vision of smart refrigerator
Summary: This paper proposes using the k-means method for the controlled adjustment of the training sample for semantic image segmentation in the artificial vision of a smart refrigerator. To solve this problem, a new two-stage architecture for computer vision is proposed. In the proposed architecture, various sets of settings for optimizing the contrast of images are used to classify pixels according to their belonging to fragments of the studied image. Extensive experimental evaluation shows that the proposed method has critical advantages over existing work. Firstly, the obtained pixel classes can be directly clustered into semantic groups using k-means. Secondly, the method can be used for additional training of artificial intelligence in solving the semantic segmentation problem. The developers propose an approach to the correct choice of the number k of centroids to obtain good quality clusters, which is difficult to determine at a high k value. To overcome the problem of initializing the k-means method, an incremental k-means clustering method is proposed, which improves the quality of clusters to reduce the sum of squared errors. Comprehensive experiments have been carried out compared to the traditional k-means algorithm and its new versions to evaluate the performance of the proposed method on synthetically generated datasets and some real-world datasets.
Keywords: MaskRCNN, k-means method, data normalization, OPENCV, python 3.8
DOI:10.34219/2078-8320-2021-12-4-74-80
ИНФОРМАЦИЯ ОБ АВТОРАХ
Dorrer M. G. – Candidate of Science (Engineering), Associate Professor, Department of Information Control Systems, Reshetnev Siberian State University of Science and Technology; e-mail: mdorrer@mail.ru
Алёхина А. Е. – специалист компании «Фабрика решений»; e-mail: vkarmeo@mail.ru
Alekhina A.E. – employee of the company «Solution Factory»; e-mail: vkarmeo@mail.ru