000 08189nlm1a2200505 4500
001 666530
005 20231030042040.0
035 _a(RuTPU)RU\TPU\network\37734
035 _aRU\TPU\network\37704
090 _a666530
100 _a20211230a2020 k y0rusy50 ca
101 0 _arus
_deng
102 _aRU
135 _adrcn ---uucaa
181 0 _ai
182 0 _ab
200 1 _aСовременные подходы к мультиклассовой классификации интентов на основе предобученных трансформеров
_dModern approaches to multiclass intent classification based on pre-trained transformers
_fА. А. Соломин, Ю. А. Иванова
203 _aТекст
_cэлектронный
300 _aЗаглавие с экрана
320 _a[Библиогр.: 11 назв.]
330 _aПредмет исследования. Рассмотрены современные подходы к решению задачи мультиклассовой классификации намерений. Под намерением пользователя понимаются входящие пользовательские запросы при взаимодействии с голосовыми помощниками и чат-ботами. Алгоритм должен определить, к какому классу относится обращение. Современные технологии, такие как трансферное обучение и трансформеры, значительно улучшают результаты мультиклассовой классификации. Метод. В исследовании использован метод сравнительного анализа моделей. В свою очередь, каждая модель встроена в общий конвейер для подготовки, очистки данных и обучения модели, но с учетом ее конкретных требований. Для сравнения были выбраны современные модели, которые используются в реальных проектах: логистическая регрессия + TF-IDF; логистическая регрессия + FastText; LSTM + FastText; Conv1D + FastText; BERT; XLM. Последовательность моделей соответствует их историческому происхождению, но на практике эти модели используются независимо от времени их появления, а в зависимости от эффективности решаемой проблемы. Основные результаты. Выполнено исследование эффективности моделей мультиклассовой классификации на реальных данных. Представлены результаты сравнения современных практических подходов. В частности, XLM подтверждает превосходство трансформеров над другими подходами. Выдвинуто предположение, по какой причине трансформеры показывают такой отрыв. Описаны преимущества и недостатки современных подходов. Практическая значимость. С практической точки зрения результаты этого исследования могут быть использованы для проектов, которые требуют автоматической классификации намерений, как части сложной системы (голосового помощника, чат-бота или другой системы), а также как самостоятельной системы. Пайплайн, разработанный во время исследования, можно использовать для сравнения и выбора наиболее эффективной модели для конкретных наборов данных как в научных исследованиях, так и в производстве.
330 _aSubject of Research. The paper considers modern approaches to the multiclass intention classification problem. The user intention is the incoming user requests when interacting with voice assistants and chatbots. The algorithm is meant for determination what class the call belongs to. Modern technologies such as transfer learning and transformers can improve significantly the multiclass classification results. Method. This study uses a comparative model analysis technique. In turn, each model is inlined into a common pipeline for data preparing and clearing, and the model training but with regard to its specific requirements. The following models applied in real projects have been selected for comparison: Logistic Regression + TF-IDF, Logistic Regression + FastText, LSTM + FastText, Conv1D + FastText, BERT, and XLM. The sequence of models corresponds to their historical origin, but in practice these models are used without regard to the time period of their creation but depending on the effectiveness of the problem being solved. Main Results. The effectiveness of the multiclass classification models on real data is studied. Comparison results of modern practical approaches are described. In particular, XLM confirms the superiority of transformers over other approaches. An assumption is made considering the reason why the transformers show such a gap. The advantages and disadvantages of modern approaches are described. Practical Relevance. From a practical point of view, the results of this study can be used for projects that require automatic classification of intentions, as part of a complex system (voice assistant, chatbot or other system), as well as an independent system. The pipeline designed during the study can be applied for comparison and selection of the most effective model for specific data sets, both in scientific research and production.
461 _tНаучно-технический вестник информационных технологий, механики и оптики
463 _tТ. 20, № 4
_v[С. 532-538]
_d2020
510 1 _aModern approaches to multiclass intent classification based on pre-trained transformers
_zeng
610 1 _aэлектронный ресурс
610 1 _aтруды учёных ТПУ
610 1 _aобработка
610 1 _aестественные языки
610 1 _aклассификация
610 1 _aтексты
610 1 _aобучение
610 1 _aтрансформеры
610 1 _anatural language processing
610 1 _atext classification
610 1 _atransformers
610 1 _atransfer learning
700 1 _aСоломин
_bА. А.
_gАртем Алексеевич
701 1 _aИванова
_bЮ. А.
_cспециалист в области информатики и вычислительной техники
_cдоцент Томского политехнического университета, кандидат технических наук
_f1986-
_gЮлия Александровна
_2stltpush
_3(RuTPU)RU\TPU\pers\45858
712 0 2 _aНациональный исследовательский Томский политехнический университет
_bИнженерная школа информационных технологий и робототехники
_bОтделение информационных технологий
_h7951
_2stltpush
_3(RuTPU)RU\TPU\col\23515
801 2 _aRU
_b63413507
_c20221026
_gRCR
856 4 _uhttp://earchive.tpu.ru/handle/11683/73250
856 4 _uhttps://doi.org/10.17586/2226-1494-2020-20-4-532-538
856 4 _uhttps://www.elibrary.ru/item.asp?id=43808115
942 _cCF