Аннотация:
Аннотация: В работе приводится расширенная векторно-пространственная модель текстовой коллекции в пространстве нечётких факторов. Рассматривается понятие нечёткой коллокации, как семантически значимого элемента текстовой коллекции. Показано, что при определённом значении параметров расширенной векторно-пространственной модели в качестве нечётких факторов допустимо совместное использование термов и коллокаций. На основе данной возможности предложен подход к повышению семантической значимости нечётких коллокаций посредством уточнения вида их функций принадлежности. Данный подход базируется на решении оптимизационной задачи поиска вида функции принадлежности, посредством модернизированного алгоритма дифференциальной эволюции. Приведены результаты исследований в области модернизации алгоритма дифференциальной эволюции, в том числе гипотезы повышения сходимости алгоритма, постановка вычислительных экспериментов и их результаты. В качестве целевой функции Fitness эволюционного алгоритма выбрана оценка семантической значимости нечётких коллокаций на основе латентно-семантического анализа. Ключевой особенностью данного анализа является SVD-разложение матрицы расширенной векторно-пространственной модели, которое позволяет оценить семантическую значимость нечётких коллокаций в сравнении с наиболее значимыми термами. В заключение рассматриваются направления дальнейших исследований в области построения нечётких коллокаций, уточнения их функций принадлежности, а также применения нечётких коллокаций для решения прикладных задач, связанных с семантическим анализом текстовых коллекций.