АЛГОРИТМЫ СИНТАКСИЧЕСКОГО И СЕМАНТИЧЕСКОГО АНАЛИЗА ТЕКСТА
Keywords:
синтаксический анализ, семантический анализ, компьютерная лингвистика, обработка естественного языка, нейросетевые модели, трансформеры, парсинг, представление смысла.Abstract
В данной статье рассматриваются современные алгоритмы, применяемые для синтаксического и семантического анализа текстов в рамках задач автоматической обработки естественного языка. Особое внимание уделено сравнению традиционных формальных методов синтаксического анализа (таких как нисходящий и восходящий парсинг) с нейросетевыми моделями нового поколения. Также исследуются подходы к семантическому интерпретированию текста, включая метод распределённых представлений слов и трансформерные архитектуры. Проанализированы сильные и слабые стороны различных алгоритмических решений, а также их применимость в задачах машинного перевода, извлечения информации и диалоговых систем. Статья поднимает вопросы эффективности, интерпретируемости и вычислительной сложности алгоритмов, что актуально в контексте стремительно растущих объёмов текстовой информации.
Downloads
References
1. Iomdin L., Petrochenkov V., Sizov V., Tsinman L. ETAP parser: state of the art // Papers from the Annual International Conference "Dialogue" (2012). — 2012. — С. 830–853.
2. Anisimovich K. V., Druzhkin K. Ju., Minlos F. R. и др. Syntactic and semantic parser based on ABBYY Compreno linguistic technologies // Papers from the Annual International Conference "Dialogue". — 2012. — Т. 2. — С. 91–103.
3. Chomsky N. Three models for the description of language // IRE Transactions on Information Theory. — 1956. — Т. 2, № 3. — С. 113–124.
4. Tesnière L. Elements de syntaxe structurale. — Paris: Editions Klincksieck, 1959.
5. Mel’cuk I. A. Dependency syntax: theory and practice. — Albany: SUNY Press, 1988. — 428 p.
6. Jurafsky D., Martin J. H. Speech and Language Processing. — 3rd ed. — Draft, Stanford University, 2023. — 1250 p. — [Электронный ресурс]. — Режим доступа: https://web.stanford.edu/~jurafsky/slp3/.
7. Manning C. D., Schütze H. Foundations of Statistical Natural Language Processing. — Cambridge: MIT Press, 1999. — 680 p.
8. Goldberg Y. Neural Network Methods for Natural Language Processing. — Morgan & Claypool, 2017. — 309 p.
9. Klein D., Manning C. D. Accurate unlexicalized parsing // Proceedings of the 41st Annual Meeting on Association for Computational Linguistics (ACL). — 2003. — P. 423–430.
10. Vaswani A. et al. Attention is all you need // Advances in Neural Information Processing Systems. — 2017. — Vol. 30. — P. 5998–6008.
11. Mikolov T. et al. Distributed representations of words and phrases and their compositionality // Advances in Neural Information Processing Systems. — 2013. — Vol. 26. — P. 3111–3119.
12. Devlin J. et al. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding // arXiv preprint arXiv:1810.04805. — 2018. — 15 p. — [Электронный ресурс]. — Режим доступа: https://arxiv.org/abs/1810.04805.
13. Bojar O., Chatterjee R., Federmann C. et al. Findings of the 2017 Conference on Machine Translation (WMT17) // Proceedings of the Second
Conference on Machine Translation. — 2017. — Vol. 2. — P. 169–214.
Downloads
Published
Issue
Section
License

This work is licensed under a Creative Commons Attribution 4.0 International License.
License Terms of our Journal