МЕТОД РЕКУРСИВНОЇ РЕДУКЦІЇ ЯК СКЛАДОВА ЛІНГВІСТИЧНОГО ЗАБЕЗПЕЧЕННЯ ІНФОРМАЦІЙНО-АНАЛІТИЧНИХ СИСТЕМ
PDF

Ключові слова

прикладна лінгвістика, лінгвістичне забезпечення, інформаційно-аналітична система, онтологія, лексикографічна система. applied linguistics, linguistic support, information-analytical system, ontology, lexicographic system.

Як цитувати

ПРИХОДНЮК, В. В., & ГОРБОРКУОВ, В. В. (2022). МЕТОД РЕКУРСИВНОЇ РЕДУКЦІЇ ЯК СКЛАДОВА ЛІНГВІСТИЧНОГО ЗАБЕЗПЕЧЕННЯ ІНФОРМАЦІЙНО-АНАЛІТИЧНИХ СИСТЕМ. АКАДЕМІЧНІ СТУДІЇ. СЕРІЯ «ГУМАНІТАРНІ НАУКИ», (2), 98-103. https://doi.org/10.52726/as.humanities/2022.2.14

Анотація

Наш час характеризується стрімким ростом кількості наявної інформації, що призводить до створення великих за обсягом масивів тематично та просторово розподіленої інформації. Обробка таких масивів вручну є надзвичайно складним процесом, що потребує значних трудозатрат. Такі масиви можуть бути оброблені з допомогою сучасних інформаційно-аналітичних систем, зокрема – лексикографічних. Однак значна частина інформації в таких масивах може бути слабко і неструктурованою (зокрема – в формі природномовних текстів), що створює потребу в якісному лінгвістичному забезпеченні таких систем, як елементу прикладної лінгвістики. Існує велика кількість методів та засобів для обробки природномовних текстів – на основі словників, машинного навчання, статистичних показників тощо. Однак результати роботи всіх цих методів потребують подальшої обробки і перетворення в формат, передбачений системою, що використовується. Саме для такої обробки пропонується метод рекурсивної редукції, що може використовуватись як складова лінгвістичного забезпечення інформаційно-аналітичних систем. Метод передбачає створення формалізованого опису потрібного системі формату даних, на основі якого відбувається перетворення результатів аналізу вхідного природномовного тексту, з подальшим формуванням онтології. Результуюча онтологія може бути використана для формування онтологокерованої лексикографічної системи.

https://doi.org/10.52726/as.humanities/2022.2.14
PDF

Посилання

Stryzhak O., Prykhodniuk V., Popova M., Nadutenko M., Haiko S., Chepkov R. Development of an Oceanographic Databank Based on Ontological Interactive Documents. Lecture Notes in Networks and Systems. Cham : Springer. 2021. С. 97–114. DOI: https://doi.org/10.1007/978-3-030-80126-7_8

Hartmann J., Huppertz J., Schamp C., Heitmann M. Comparing automated text classification methods. International Journal of Research in Marketing. 2019. вип. 36. № 1. С. 20–38. DOI: https://doi.org/10.1016/j.ijresmar.2018.09.009

Berardi G. Semi-automated text classification. ACM SIGIR Forum. 2014. вип. 48. № 1. С. 42–42. DOI: https://doi. org/10.1145/2641383.2641392

Humphreys A., Wang R. J.-H. Automated Text Analysis for Consumer Research. Journal of Consumer Research. 2018. вип. 44. № 6. С. 1274–1306. DOI: https://doi.org/10.1093/jcr/ucx104

Aggarwal C. C., Zhai C. A Survey of Text Classification Algorithms. Mining Text Data. Boston, MA : Springer US. 2012. С. 163–222. ISBN: 978-1-4614-3223-4 DOI: https://doi.org/10.1007/978-1-4614-3223-4_6

Sebastiani F. Machine learning in automated text categorization. ACM Computing Surveys. 2002. вип. 34. № 1. С. 1–47. DOI: https://doi.org/10.1145/505282.505283

Perkins M. Approaches to Text Analysis. Global Language Review. 2019. вип. IV. № I. С. 1–7. DOI: https://doi. org/10.31703/glr.2019(IV-I).01

Pennebaker J. W., Boyd R. L., Jordan K., Blackburn K. The Development and Psychometric Properties of LIWC2015. University of Texas at Austin. 2015. С. 1–26. DOI: https://doi.org/10.15781/T29G6Z

Nadutenko M., Prykhodniuk V., Shyrokov V., Stryzhak O. Ontology-Driven Lexicographic Systems. Advances in Information and Communication. FICC 2022. Lecture Notes in Networks and Systems. Cham : Springer. 2022. С. 204–215. DOI: https://doi.org/10.1007/978-3-030-98012-2_16