АННОТАЦИИ К СТАТЬЯМ (ЖУРНАЛ ``ИНФОРМАТИЗАЦИЯ И СВЯЗЬ`` №5, 2024)
КОНТЕНТ-АНАЛИЗ КНИЖНЫХ АННОТАЦИЙ ДЛЯ ОПРЕДЕЛЕНИЯ ЖАНРОВОЙ ПРИНАДЛЕЖНОСТИ КНИГ НА ОСНОВЕ ТРАНСФОРМЕРОВ
Резюме: В рамках исследования рассмотрены модели глубокой нейронной сети, которые построены на основе особого вида сетей – трансформеров. Они наиболее эффективно решают задачи, связанные с обработкой естественного языка, в частности, задачи по контент-анализу текста, осуществляемого путем его классификации. Рассматриваемые в статье трансформеры обучены классифицировать книги по жанрам, основываясь на их аннотациях. Приводятся структуры данных моделей, а также результаты обучения и тестирования на собранном наборе данных. По результатам можно сделать вывод, что сети-трансформеры показывают более высокие результаты при контент-анализе текстовых данных по сравнению с обычными глубокими нейросетями.
Ключевые слова: искусственные нейронные сети, машинное обучение, глубокое обучение, трансформеры, контент-анализ, классификация текста
P.L. Nikolaev
CONTENT ANALYSIS OF BOOK ANNOTATIONS TO DETERMINE THE GENRE OF BOOKS BASED ON TRANSFORMERS
Summary: The study examines deep neural network models built on a special type of network – transformers. They most effectively solve problems related to natural language processing, in particular, problems of content analysis of text carried out by classifying it. The transformers considered in the article are trained to classify books by genre based on their annotations. The architectures of these models, the results of training and testing on the author›s data set are given. Based on the results, it can be concluded that transformers are more accurate compared to conventional deep neural networks.
Keywords: Artificial neural networks, machine learning, deep learning, transformers, content analysis, text classification.
DOI: 10.34219/2078-8320-2024-15-5-108-111
ИНФОРМАЦИЯ ОБ АВТОРАХ
Nikolaev Pavel Leonidovich – Senior lecturer, Moscow Aviation Institute (National Research University),
e-mail: npavel89@gmail.com