АННОТАЦИИ К СТАТЬЯМ (ЖУРНАЛ ``ИНФОРМАТИЗАЦИЯ И СВЯЗЬ`` №3, 2021)
Модифицированный алгоритм поиска закономерностей в данных большой размерности на основе генетической оптимизации
Резюме: Предложен метод поиска закономерностей в последовательностях событий для обнаружения скрытых закономерностей в данных большой размерности при выполнении задач информационного поиска, основанный на теории последовательных паттернов. Поиск последовательных паттернов является сложной вычислительной задачей, цель которой состоит в извлечении всех частых последовательностей, отражающих потенциальные связи внутри элементов из транзакционной базы данных последовательностей событий поисковой активности при заданной минимальной поддержке. Для повышения вычислительной эффективности метода разработан модифицированный алгоритм генерации последовательных паттернов, на первом этапе которого выполняется AprioriAll, формирующий частые последовательности-кандидаты всевозможных длин, а на втором – генетический алгоритм оптимизации входных параметров признакового пространства сгенерированного множества для поиска максимальных паттернов.
Ключевые слова: генетический алгоритм, поиск последовательных паттернов, секвенциальный анализ, информационный поиск.
V.V. Bova, D.V. Leshchanov
Modified algor ithm for searching regularities in large dimensional data based on genetic optimization
Summary: A method of searching for patterns in sequences of events is proposed for detecting hidden patterns in largedimensional data when performing information retrieval tasks, based on the theory of sequential patterns. Searching for sequential patterns is a complex computational task whose goal is to retrieve all frequent sequences representing potential relationships within elements from a transactional database of sequences of search activity events with a given minimum support. To increase the computational efficiency of the method, a modified algorithm for generating sequential patterns has been developed, at the first stage of which AprioriAll is performed, which forms frequent candidate sequences of all possible lengths, and at the second stage, a genetic algorithm for optimizing the input parameters of the feature space of the generated set to search for maximum patterns.
Keywords: genetic algorithm, search for sequential patterns, sequential analysis, information search.
DOI:10.34219/2078-8320-2021-12-3-67-72
ИНФОРМАЦИЯ ОБ АВТОРАХ
Bova V.V. – associate professor the department of Computer Aided Design Southern Federal University: e-mail: vvbova@sfedu.ru
Лещанов Д. В. – аспирант кафедры систем автоматизированного проектирования Южного федерального университета: e-mail: leshanovv2011@yandex.ru
Leshchanov D.V. – graduate student the department of Computer Aided Design Southern Federal University: e-mail: leshanovv2011@yandex.ru