Статья 'Определение семантической близости понятий на основе использования ссылок Википедии' - журнал 'Программные системы и вычислительные методы' - NotaBene.ru
по
Меню журнала
> Архив номеров > Рубрики > О журнале > Авторы > О журнале > Требования к статьям > Редсовет > Редакция > Порядок рецензирования статей > Политика издания > Ретракция статей > Этические принципы > Политика открытого доступа > Оплата за публикации в открытом доступе > Online First Pre-Publication > Политика авторских прав и лицензий > Политика цифрового хранения публикации > Политика идентификации статей > Политика проверки на плагиат
Журналы индексируются
Реквизиты журнала

ГЛАВНАЯ > Вернуться к содержанию
Программные системы и вычислительные методы
Правильная ссылка на статью:

Определение семантической близости понятий на основе использования ссылок Википедии

Найханов Николай Владимирович

аспирант, кафедра Системы информатики, Восточно-Сибирский государственный университет технологий и управления

670013, Россия, Республика Бурятия, г. Улан-Удэ, ул. Ключевская, 40В

Naikhanov Nikolai Vladimirovich

graduate student, Department of Informatics Systems of the East-Siberian State University of Technology and Management

670013, Russia, Buryatiya, g. Ulan-Ude, ul. Klyuchevskaya, 40V

naikhan2021@gmail.com
Другие публикации этого автора
 

 
Дышенов Бато Александрович

аспирант, кафедра Системы информатики, Восточно-Сибирский государственный университет технологий и управления

670013, Россия, г. Улан-Удэ, ул. Ключевская, 40В

Dyshenov Bato Aleksandrovich

graduate student, Department of Informatics Systems of the East-Siberian State University of Technology and Management

670013, Russia, g. Ulan-Ude, ul. Ul. Klyuchevskaya, 40V

dyshenov@gmail.com

DOI:

10.7256/2454-0714.2016.3.19560

Дата направления статьи в редакцию:

24-06-2016


Дата публикации:

20-09-2016


Аннотация: Предметом исследования является семантическая близость понятий. Объектом исследования меры семантической близости понятий. Авторы рассматривают такие аспекты темы как обоснование выбора фоновых знаний, построение ссылочного графа и измерение связанности между понятиями. В более ранних работах авторов семантическая близость вычислялась на основе статистических характеристик с применением различных методов контекстного анализа, например, латентно-семантического анализа. Данная работа является первым опытом работы со ссылочными методами определения семантической близости. Поэтому фокус сделан на простоту вычисления меры. В статье определение семантической близости основывается на методе WLM (Wikipedia Link-based Measure) и меры близости по отдельным типам ссылок М.И. Варламова, А.В. Коршунова. В отличие от известных мер семантической близости, основанных на использовании базы данных Википедии, предложенная в работе мера использует простые ссылки статей базы данных Википедии типа "См. также" (See also) и "Ссылки" (Links, External links). Такой подход позволяет повысить производительность алгоритма и применять в задачах, требующих не высокой точности результата, а большей производительности алгоритма. К таким задачам можно отнести установление соответствия между компетенциями образовательного стандарта и аннотациями дисциплин учебного плана или задачу анализа ответов студентов на открытые по форме вопросы. Разработанная мера является дешевой, достаточно точной и доступной.


Ключевые слова:

понятие, семантическая близость понятий, фоновые знания, база данных Википедии, структура статьи Википедии, ссылка, ссылочный граф, расстояние между понятиями, индексация графа, мера,основанная на ссылках

УДК:

004.8

Abstract: The research question is the semantic similarity of terms. The object of the research is the measures of the semantic similarity of terms. The authors consider such aspects as the rationale for the choice of the theme of background knowledge, the construction of a graph of links and measurement of the similarity between concepts. In earlier researches the semantic similarity was calculated based on the statistical characteristics using different contextual analysis methods such as the latent semantic analysis. The given research is the first experience with the reference methods for determining the semantic similarity. Therefore, the focus is made on the ease of calculation steps. Within the framework of the researc determinatino of the semantic similarity is based on the WLM (Wikipedia Link-based Measure) method and similarity measures for separate types of references offered by M. Varlamov and A. Korshunov. In contrast to the well-known measures of the semantic similarity based on the use of Wikipedia database, the measure offered by the authors of the given research uses simple links to Wikipedia articles such as "See also" and "Links" or "External links". This approach allows to improve the performance of the algorithm and is designed for use in applications requiring not a high accuracy of the result but a better performance of the algorithm. These tasks include establishing the correspondence between the competencies of the educational standard and abstracts of curriculum disciplines or the task of analyzing the students' answers to the open questions in the form. The developed measure is cheap, reasonably accurate and accessible.


Keywords:

concept, semantic similarity of concepts, background knowledge, Wikipedia database, structure of a Wikipedia article, link, link graph, distance between concepts, count indexing, link-based measure

Библиография
1. Английская Википедия [Электронный ресурс]. – URL: https://ru.wikipedia.org/wiki/Английская_Википедия (дата обращения: 20.06.2016).
2. Анисимов А.В. Метод вычисления семантической близости-связности между словами естественного языка / А.В. Анисимов, А.А. Марченко, В.К. Кисенко // Кибернетика и системный анализ. 2011. № 4. С.18-27.
3. Варламов М.И. Расчет семантической близости концептов на основе кратчайших путей в графе ссылок Википедии / М.И. Варламов, А.В. Коршунов // Машинное обучение и анализ данных. 2014. Т. 1. № 8. С. 1107-1125.
4. Варламов М.И. Расчет семантической близости концептов на основе кратчайших путей в графе ссылок Википедии [Электронный ресурс]: презентация / М.И. Варламов, А.В. Коршунов // URL: www.machinelearning.ru/wiki/images/f/fd/Varlamov2014iip.pdf (дата обращения: 20.06.2016).
5. Русская Википедия [Электронный ресурс]. – URL: https://ru.wikipedia.org/wiki/Русская_Википедия (дата обращения: 20.06.2016).
6. Турдаков Д.Ю. Texterra: инфраструктура для анализа текстов / Д.Ю. Трудаков и др. // Труды Института системного программирования РАН. 2014. Т. 26. Вып. 1. С. 421-438.
7. Witten I., Milne D. An effective, low-cost measure of semantic relatedness obtained from Wikipedia links // Proceeding of AAAI Workshop on Wikipedia and Artificial Intelligence: an Evolving Synergy, AAAI Press, Chicago, USA. 2008. Р. 25-30
References
1. Angliiskaya Vikipediya [Elektronnyi resurs]. – URL: https://ru.wikipedia.org/wiki/Angliiskaya_Vikipediya (data obrashcheniya: 20.06.2016).
2. Anisimov A.V. Metod vychisleniya semanticheskoi blizosti-svyaznosti mezhdu slovami estestvennogo yazyka / A.V. Anisimov, A.A. Marchenko, V.K. Kisenko // Kibernetika i sistemnyi analiz. 2011. № 4. S.18-27.
3. Varlamov M.I. Raschet semanticheskoi blizosti kontseptov na osnove kratchaishikh putei v grafe ssylok Vikipedii / M.I. Varlamov, A.V. Korshunov // Mashinnoe obuchenie i analiz dannykh. 2014. T. 1. № 8. S. 1107-1125.
4. Varlamov M.I. Raschet semanticheskoi blizosti kontseptov na osnove kratchaishikh putei v grafe ssylok Vikipedii [Elektronnyi resurs]: prezentatsiya / M.I. Varlamov, A.V. Korshunov // URL: www.machinelearning.ru/wiki/images/f/fd/Varlamov2014iip.pdf (data obrashcheniya: 20.06.2016).
5. Russkaya Vikipediya [Elektronnyi resurs]. – URL: https://ru.wikipedia.org/wiki/Russkaya_Vikipediya (data obrashcheniya: 20.06.2016).
6. Turdakov D.Yu. Texterra: infrastruktura dlya analiza tekstov / D.Yu. Trudakov i dr. // Trudy Instituta sistemnogo programmirovaniya RAN. 2014. T. 26. Vyp. 1. S. 421-438.
7. Witten I., Milne D. An effective, low-cost measure of semantic relatedness obtained from Wikipedia links // Proceeding of AAAI Workshop on Wikipedia and Artificial Intelligence: an Evolving Synergy, AAAI Press, Chicago, USA. 2008. R. 25-30
Ссылка на эту статью

Просто выделите и скопируйте ссылку на эту статью в буфер обмена. Вы можете также попробовать найти похожие статьи


Другие сайты издательства:
Официальный сайт издательства NotaBene / Aurora Group s.r.o.