TY - JOUR AU - Савчук, Тамара Олександрівна AU - Горобець, Юрій Володимирович PY - 2018/12/21 Y2 - 2024/03/29 TI - УДОСКОНАЛЕНИЙ МЕТОД ВИЯВЛЕННЯ КЛЮЧОВИХ СЛІВ У WEB-ТЕКСТІ JF - Інформаційні технології та комп'ютерна інженерія JA - ІТКІ VL - 43 IS - 3 SE - Інформаційні технології та теорія кодування DO - 10.31649/1999-9941-2018-43-3-43-47 UR - https://itce.vntu.edu.ua/index.php/itce/article/view/719 SP - 43-47 AB - <p>У роботі запропоновано удосконалення методу виявлення ключових слів і словосполучень у web-тексті. Розглянуто такі&nbsp;основні етапи формування множини ключових слів та словосполучень з метою&nbsp; знайти шляхи підвищення швидкодії індексації та&nbsp;реферування web-текстів, як токенізація вихідного тексту, виключення стоп-слів, відсікання основ і закінчень із тексту, формування ключових слів та словосполучень з вихідного тексту. Запропоноване удосконалення базується на використанні словника предметної області, складеного експертом. Словник формується з урахуванням частоти повторень ключових слів та словосполучень у&nbsp;web-тексті, що покращить їх релевантність. Було виконано порівняння якості виявлених ключових слів та словосполучень в україномовних та англомовних web-текстах системами «Експертні КС», «OpenCalais», «Extractor», а також системою, що базується на&nbsp;запропонованому методі з використанням словника, за такими метриками як повнота, точність та F-міра. Аналіз показав, що запропонований удосконалений метод виявлення ключових слів та словосполучень в україномовних і англомовних web-текстах, надасть&nbsp;можливість виявляти релевантні слова та словосполучення з підвищенням їх F-міри на 9.5%, а повноти та точності - на 15%&nbsp;.</p> ER -