АВТОМАТИЧНЕ РЕЗЮМУВАННЯ НАУКОВИХ ДОКУМЕНТІВ НА ОСНОВІ МОДЕЛЕЙ-ТРАНСФОРМЕРІВ

Authors: О. М. ШУШУРА, К. В. НОВИЦЬКИЙ, В. О. ІВАНОВ

Publication: Вісник Херсонського національного технічного університету

Published: Apr 30, 2026

Source: Crossref

Back to Search View Original Cite This Article

Abstract

<jats:p>Зростання обсягів наукової літератури актуалізує розробку ефективних методів автоматичної генерації стислих резюме. Традиційні підходи стикаються з обмеженням контекстного вікна, що робить неможливим безпосередню обробку документів довжиною понад кілька тисяч токенів. Метою даної роботи є розробка гібридного методу автоматичного резюмування для узагальнення документів, які перевищують стандартні обмеження розміру контекстного вікна моделей-трансформерів. Розроблений гібридний метод поєднує екстрактивні та абстрактивні методи резюмування для ефективної обробки документів довільної довжини. Для екстрактивної фази була використана модель Sentence-BERT, з метою отримати семантичні векторні представлення речень, що дозволило ідентифікувати найбільш важливі частини тексту. На відміну від статистичних методів, Sentence-BERT захоплює глибинний семантичний зміст незалежно від лексичного складу. Наступна фаза методу видаляє семантичні дублікати за допомогою косинусної подібності, що забезпечує компактність проміжного представлення. Метод ідентифікує як точні дублікати, так і перефразування, створюючи компактне резюме. Фаза абстрактивної генерації виконується з використанням моделі BART-large-CNN, що поєднує двонаправлене кодування та авторегресивну генерацію. Це забезпечує створення зв’язних резюме з власними формулюваннями моделі, здатність до перефразування та об’єднання інформації з різних частин документу. Розроблено програмне забезпечення для реалізації методу згідно з SOLID принципами, забезпечуючи модульність та можливість розширення системи. Проведено порівняльне дослідження розробленого методу з чотирма категоріями базових підходів і спеціалізованою моделлю яка має розширене вікно контексту LongT5. Оцінка на вибірці з наукових статей з arXiv показала, що запропонований метод краще показує себе аніж традиційні методи та працює на рівні з LongT5, використовуючи при цьому стандартну модель BART-large-CNN. Метод був застосований без додаткового перед-навчання, що знижує обчислювальні вимоги.</jats:p>

Keywords

що та методу резюме документів

АВТОМАТИЧНЕ РЕЗЮМУВАННЯ НАУКОВИХ ДОКУМЕНТІВ НА ОСНОВІ МОДЕЛЕЙ-ТРАНСФОРМЕРІВ

Abstract

Keywords

Related Articles

МОДЕЛЮВАННЯ НАУКОВОГО ПОШУКУ ЧЕРЕЗ ГРАНТРАЙТИНГ У КУРСІ «МЕТОДОЛОГІЯ НАУКОВИХ ДОСЛІДЖЕНЬ», MODELING SCIENTIFIC INQUIRY THROUGH GRANT WRITING IN THE COURSE “METHODOLOGY OF SCIENTIFIC RESEARCH”

ТРАВМОІНФОРМОВАНИЙ І ТРАВМОЧУТЛИВИЙ ПІДХІД В УКРАЇНСЬКОМУ ОСВІТНЬОМУ ПРОСТОРІ: АНАЛІЗ НАУКОВИХ ПРАЦЬ

ЗАСТОСУВАННЯ ШТУЧНОГО ІНТЕЛЕКТУ В НАУКОВИХ ДОСЛІДЖЕННЯХ У ГАЛУЗІ ТЕПЛОЕНЕРГЕТИКИ: МОЖЛИВОСТІ, ВИКЛИКИ ТА ЕТИЧНІ АСПЕКТИ