
QR code of document
>
П 42
Повышение качества автоматического патентного поиска уровня техники на основе дистрибутивной семантики и библиографических данных [Текст] / А. В. Горбунов, Б. Л. Генин, Д. С. Золкин, И. В. Некрасов> // Научные и технические библиотеки. - 2026. - №2. - С. 122-137
Рубрики: Библиотечное дело
Кл.слова (ненормированные):
автоматический патентный поиск -- дистрибутивная семантика -- квазисинонимы -- патентные семейства -- информационный поиск -- машинное обучение
Аннотация: В статье описан подход к повышению качества автоматического патентного поиска уровня техники, решающий проблему недостаточной эффективности существующих систем. Подход основан на автоматическом формировании терминологического вектора запроса из текста заявки с последующим его расширением квазисинонимами из дистрибутивного тезауруса, построенного на корпусе патентных документов, и обогащением библиографическими данными – кодами Международной патентной классификации (МПК). Дана математическая формализация формирования и расширения вектора запроса, описано построение дистрибутивного тезауруса патентной лексики. Предложены оригинальные показатели оценки качества поиска, учитывающие специфику патентных документов – наличие так называемых «патентных семейств», что позволяет оценивать способность системы находить релевантные изобретения, а не только совпадающие номера документов. Эксперименты на русскоязычной и англоязычной коллекциях показали повышение показателя S@20 на 10% по сравнению с базовым поиском по ключевым словам, продемонстрировано влияние учета патентных семейств на оценку успешности результатов поиска. Независимая экспертная оценка поисков в русскоязычной коллекции патентных документов подтвердила, что система находит хотя бы один релевантный документ в 96,25% случаев. Разработанные алгоритмы внедрены в поисковую платформу Роспатента.
Держатели документа:
ЗКУ
Доп.точки доступа:
Горбунов, А.В.
Генин, Б.Л.
Золкин, Д.С.
Некрасов, И.В.
Similar publications by classification