Эволюция патентно-информационных ресурсов и роль поискового эксперта в современных реалиях
29 ноября 2024Потребность в оказании патентно-информационных услуг появилась еще в эпоху, когда провести патентный поиск означало физически просмотреть множество патентных публикаций в специализированных библиотечных фондах. Поэтому эксперты, которые непосредственно имели дело с постоянно растущим объемом документов, были больше всех заинтересованы в совершенствовании поисковых инструментов и искали способы облегчить свою работу.
Так, г-н Монти Хаямс (Monty Hyams), ученый-химик, впоследствии ставший патентным экспертом, в 1948 г. начал издавать в Великобритании еженедельный бюллетень British Chemical Patents Report, содержавший подборку наиболее интересных патентов в области химии. Каждый из патентов сопровождался кратким описанием его сути — рефератом, написанным самим Монти. Это позволяло быстрее найти нужный документ.
Облегченный поиск по достоинству оценили предприятия химической промышленности, что привело, в частности, к созданию таких систем, как Derwent World Patents Index.
С увеличением объемов обрабатываемой информации отдельных экспертов-энтузиастов заменили специализированные компании, нередко основанные этими же экспертами. К концу XX в. наметилась следующая тенденция: небольшие, но успешные компании, специализирующиеся на предоставлении отдельных видов патентно-информационных услуг, стали поглощаться большими компаниями, ориентированными на предоставление целого комплекса информационных услуг. Это произошло, например, с компанией Derwent, которая сначала была приобретена Thompson Reuters, а потом стала частью американской компании Clarivate.
Крупные информационно-поисковые компании были ориентированы на то, чтобы получить максимальную выгоду от продажи подписки (пользовательских лицензий) на патентно-информационную поддержку как можно большему количеству пользователей. Каждый из поставщиков таких услуг старался предложить потенциальным клиентам особый бонус, недоступный конкурентам. Основным способом значительного увеличения круга потребителей информационных услуг, в том числе за счет включения в него компаний, в штате которых нет квалифицированного патентно-поискового эксперта, стало упрощение процедуры поиска с перспективой полного отказа от привлечения эксперта, поскольку потенциал аналитической поисковой системы превосходил возможности человека. Это стало основным трендом начала XXI в.
Основным признаком эволюции автоматизированных поисковых возможностей стало появление так называемого умного поиска, который не только сделал возможным выявление точных совпадений ключевых слов в запросе и искомых патентных документах, но и учел употребление этих слов в разных грамматических формах (во множественном числе, в прошедшем и будущем времени и т. д.). Этот поиск в первых его версиях был реализован с помощью некоего интерпретатора — прослойки между интерфейсом пользователя и поисковыми базами данных, который воспринимал вводимые пользователем критерии, автоматически расширял их, добавлял новые формы ключевых слов и направлял автоматически скорректированный поисковый запрос в базу данных. Такие действия интерпретатора приводили к так называемому эффекту черного ящика, когда происходящие с запросом пользователя дополнительные манипуляции были скрыты от самого пользователя, в результате чего он терял возможность оценивать или корректировать результаты работы поисковой системы.
Функционал поисково-информационных систем значительно расширился в связи с созданием операторов, которые можно назвать квазианалитическими. Примером может служить оператор установления максимального расстояния между искомыми словами в тексте патента или патентной заявки. Логика его действий проста: если мы ищем патентный документ, содержащий два ключевых слова одновременно, то в списке найденных более релевантным, скорее всего, окажется тот документ, где эти два слова стоят рядом, а не тот, в котором искомые слова расположены в разных частях текста.
Логическим развитием этого инструмента стало появление полноценного контекстного поиска, который учитывает смысл стоящих рядом слов и анализирует их взаимосвязь. Например, смысл термина «ключ» будет определен по-разному, если рядом с ним в тесте стоит слово «гайка» (тогда ключ — это инструмент) и если он соседствует со словами «дверь» и «замок» (тогда ключ — средство открывания дверного замка).
После того как компании — поставщики поисковых продуктов задумались об адаптации своих ресурсов к потребностям самого широкого круга пользователей, а техническая мысль оказалась в состоянии реализовать это желание бизнеса, возник новый вектор в развитии указанных инструментов. Проявилось это в использовании искусственного интеллекта, в частности, так называемых нейронных сетей, когда самообучающиеся алгоритмы стали получать результаты, оценив релевантность выявляемых документов на основе анализа их содержания. В настоящее время подобные возможности используют не только коммерческие ресурсы, но и общедоступный сервис Google Patents. Его функционал максимально приближен к возможностям веб-поисковика Google, отображающего все самые релевантные результаты запроса на первой странице, в результате чего пользователям редко приходится обращаться к ссылкам, расположенным далее второй-третьей страницы списка.
Другой важной задачей стало представление результатов поиска в виде, понятном широкому кругу пользователей без погружения в детали выявленных патентных документов. Как один из инструментов решения этой задачи стали использовать так называемые патентные ландшафты, которые позволяют визуализировать результаты поиска прежде всего для нетехнических специалистов, таких как маркетологи или управленцы самых разных уровней. Патентные ландшафты представляют собой автоматически сгенерированные статистические данные в виде графиков и диаграмм, по которым можно визуально оценить, например, динамику патентования по различным областям техники, направления и юрисдикции патентования компании-конкурента, связи портфелей патентов тех или иных компаний и многое другое в зависимости от поставленной задачи.
По сути, использование патентных ландшафтов — это попытка подняться над проблемой и посмотреть на ситуацию в целом, без изучения технической сути отобранных решений. Безусловно, такой подход не может претендовать на роль исчерпывающего источника информации об исследуемой в рамках поиска теме, а иногда, в частности в случае использования ландшафтов в качестве основного источника данных, и вовсе может привести к некорректным выводам.
Такое возможное искажение реальной картины связано со спецификой основного источника построения патентных ландшафтов — патентных публикаций, когда при автоматической генерации статистических данных система ориентируется на указанные в выявленных патентных документах индексы международной патентной классификации. Учет или неучет не только основных, но и дополнительных классификационных индексов, которые могут прямо не относиться к исследуемой области, порой существенно искажает реальную картину.
На волне успешного использования новых технологий в поисковых патентно-информационных ресурсах возник вопрос: можно ли полностью обойтись без эксперта при проведении поиска? Ведь если поисковые алгоритмы в состоянии верно воспринять запрос, написанный естественным языком, и выдать отсортированные по релевантности результаты в наглядной форме, то так ли необходим специалист? Ответ на этот вопрос может показаться парадоксальным: с развитием поисковых инструментов роль эксперта не только не уменьшилась, но даже возросла.
Во-первых, использование современных поисковых ресурсов с заложенными в них сложными поисковыми алгоритмами, давая быстрые результаты, не позволяет получить на выходе готовые ответы на поставленные перед поиском вопросы, а предлагает лишь документы, которые важно критически оценить и правильно интерпретировать, приняв во внимание множество дополнительных факторов. Подобная оценка должна даваться экспертом в ходе всего поиска, а он, как правило, выдает большое количество документов, выявленных в рамках нескольких или даже множества поисковых запросов. Очевидно, что подобные задачи неразрешимы для неподготовленного пользователя, тем более в вопросах, связанных с оценкой потенциальных рисков нарушения патентных прав, проводимой в рамках экспертизы на патентную чистоту.
Во-вторых, эффективно использовать весь поисковый инструментарий, включенный в современные ресурсы, способен только эксперт, обладающий как соответствующими знаниями, так и опытом. Его навыки будут иметь решающее значение в том числе при комбинированном поиске, который проводится с одновременным использованием индексов классификационной системы и ключевых слов, ограничением периода поиска, указанием отдельных юрисдикций и, например, заявителя.
Наконец, в-третьих, обратной стороной умного поискового алгоритма, учитывающего морфологию и возможные синонимы ключевых слов, является увеличение массива выявляемых документов, грамотно разобраться в котором способен только специалист.
Сказанное можно отнести и к патентным ландшафтам. Безусловно, они способны визуализировать сложившуюся ситуацию в сфере патентования в той или иной области. Однако чтобы на основе данных, представленных в патентных ландшафтах, принимать какие-либо значимые управленческие или маркетинговые решения, базовые поиски для построения этих ландшафтов должны сопровождаться квалифицированным экспертом, иначе результаты с высокой степенью вероятности будут недостоверными.
Выделяя важную роль человека в процессе поиска патентной информации, нужно принять во внимание и обратную сторону — безусловную зависимость даже самого квалифицированного эксперта от современного поисково-информационного ресурса. Эта зависимость имеет объективный характер и связана с постоянным ростом объемов данных. Патентно-поисковые ресурсы таких передовых разработчиков, как Minesoft и Questel, уже позволяют проводить поиски среди 150 млн патентных публикаций. Чтобы переработать такой объем информации без умного помощника, необходимо затратить много времени и усилий. Учитывая особенность патентной информации, для которой характерно то, что новые источники не заменяют и не упраздняют предшествующие, а только дополняют их, такая зависимость человека от поисковой машины будет только увеличиваться.
В настоящее время каждый год в разные патентные ведомства мира подается около 3,5 млн новых патентных заявок на изобретения. Данные заявки, а также соответствующие патенты в случае их выдачи при успешном прохождении экспертизы публикуются и пополняют общий массив патентно-информационных фондов. Добавим, что ежегодно в мире поступает примерно 2,9 млн заявок на полезные модели. В условиях такого постоянного прироста патентно-информационных данных использование современных автоматизированных ресурсов для поиска патентной информации стало практически безальтернативной необходимостью.
В заключение отметим, что эволюционирующие патентно-информационные ресурсы, обрабатывая огромные массивы данных, позволяют эффективно осуществлять поиск патентной информации. Однако важнейшим условием обеспечения качества результатов этого поиска является участие квалифицированного поискового эксперта на всех этапах процесса — от составления регламента поиска в соответствии с поставленными задачами до анализа выявленных результатов и подготовки соответствующих выводов.