вернуться на главную

УДК 004.8

МАШИННОЕ ОБУЧЕНИЕ И ИЗОБРЕТЕНИЯ

       В статье патентного поверенного И.И. Липатовой (Санкт-Петербург, ilyana.lipatova@yandex.ru) речь пойдет не о том, может ли компьютер создать изобретение, а о том, является ли изобретением то, что создает человек для исполнения компьютером.
       Ключевые слова: изобретение, патент, искусственный интеллект, машинное обучение, нейросеть.

       MACHINE LEARNING AND INVENTIONS
       In the article of I.I. Lipatova, Eurasian patent attorney (St. Petersburg, ilyana.lipatova@yandex.ru), it will not be a question of whether a computer can create an invention, but whether something that a person creates for execution by a computer is an invention.
       Key words: invention, patent, artificial intelligence, machine learning, neural network.


       Точное содержание терминов «искусственный интеллект», «машинное обучение» и «нейросеть» не имеет значения, когда мы встречаем их в новостях. Ясно, что это делает компьютер, и ясно, что это ново и круто. Но когда мы хотим применить патентное право к этой области знаний, хорошо бы понять, что именно это за область и что означают эти слова. Нам не слишком поможет здесь Википедия и вообще поиск в сети, поскольку определения этих терминов разнообразны и часто даются в контексте содержимого сайта или конкретного учебного материала. Что же мы можем понять относительно этих терминов в контексте патентного права?
       Начиная издалека, скажем, что искусственный интеллект – это обобщенное название компьютерных технологий, когда с использованием разнообразных алгоритмов за счет быстродействия компьютера возможно выполнение множества расчетов, которые в итоге приводят к результату, похожему на разумное решение человека. К такому же результату человек может прийти, не обратив внимания на расчеты, которые совершил его мозг: выбрать ход в игре, представить погоду на завтра, понять, что на фотографии изображено животное породы кошачьих, написать рифмованное четверостишие.
       Если говорить с нужной нам конкретикой, искусственный интеллект – это компьютерная программа. И ничего более. Ее поведение имитирует мыслительную функцию человека. Но это ничего не говорит об особенностях такой программы. Чтобы осуществить такую имитацию, используются различные алгоритмы, совершенно не связанные между собой и выбираемые в зависимости от типа задачи, которую требуется решить (например, просчитать лучший ход в игре или порядок поисковой выдачи). Поэтому, когда мы видим в формуле изобретения словосочетание «искусственный интеллект», его смело можно заменить на «компьютерную программу», не теряя ничего.
       Что же представляет собой такая компьютерная программа? Это решение некой проблемы: есть данные на входе и выходе, а посередине черный ящик, решающий нашу проблему. Очень важно: на входе и выходе – информация. Компьютерная программа получает на входе информацию и на выходе выдает информацию. Поэтому мы и говорим об имитации искусственным интеллектом именно когнитивных функций человека. Я могу принять решение о том, какой сделать ход в игре. Но это не значит, что я его сделала. Это следующий этап. И большая часть задач, которые решаются с помощью систем искусственного интеллекта, состоит именно в выдаче ответа типа да/нет либо другого рода ответов, но имеющих чисто информационный характер.
       В перечне технологических задач, на реализацию которых может быть направлен проект в сфере искусственного интеллекта1, перечислено около 90 задач, и почти каждая из них подразумевает получение логического результата: классификация, детекция, идентификация, анализ, поиск. Особо хочется обратить внимание на то, что в Национальной стратегии развития искусственного интеллекта на период до 2030 года2 искусственный интеллект в общем рассматривается как системы, которые помогают принимать человеку решения.
       1 Приказ Министерства экономического развития Российской Федерации от 29 июня 2021 г. № 392 «Об утверждении критериев определения принадлежности проектов к проектам в сфере искусственного интеллекта».
       2 Указ Президента Российской Федерации от 10 октября 2019 г. № 490 «О развитии искусственного интеллекта в Российской Федерации».

       Таким образом, искусственный интеллект предназначен для имитации мышления, а не деятельности, и решения в области искусственного интеллекта – это решения, обеспечивающие имитацию логики, но не действий. Действия могут осуществляться потом, после того, как некое логическое умозаключение сделано человеком либо сымитировано компьютерной программой.
       Перейдем теперь от очень широкого и отчасти научно-фантастического термина «искусственный интеллект» к терминологии реальных разработчиков. Один из этих терминов – машинное обучение. Что это такое? Машинное обучение – это совокупность методов, которые позволяют создать компьютерную программу. Да, просто программу для решения определенного класса задач. И это будет как раз программа, которая имитирует мыслительную функцию человека (например, определяет, есть ли на фотографии котик).
       Методы машинного обучения – это лишь часть технологий, которые могут быть причислены к технологиям искусственного интеллекта. Если совсем коротко, то одной из задач машинного обучения является восстановление функциональной зависимости между некоторой информацией на основании большого количества данных. При этом практическую ценность представляет продукт этого обучения – та самая восстановленная функция. Например, есть данные о поведении покупателей в интернет-магазине (время захода на сайт, число переходов по страницам, день недели и еще десяток параметров) и информация о том, совершена ли покупка. На основании этих данных восстанавливается некая функция, которую затем можно применить к новым данным (новому покупателю) с получением на выходе нужной информации (предсказание вероятности совершения им покупки).
       Применительно к машинному обучению используют слово «модель», которое несет несколько разных смыслов, причем для специалистов каждый раз ясно, в каком из них оно употреблено. Но для потенциальной формулы изобретения такая интуитивная ясность не очень хороша. Поэтому предпримем очередную попытку коротко рассказать про этот предмет.
       Особенность методов машинного обучения – использование для создания нужной программы очень большого количества готовых данных. С них все начинается. В одном из самых распространенных случаев сама программа представляет собой функцию, в своей основе похожую на ту, которая была у нас в школе (у = ах + bx3, где х – данные на входе, у – данные на выходе). Задача разработчика программы – определить вид этой функции. Имея в виду поставленную задачу и рассмотрев, что представляет собой доступное ему большое количество готовых данных, специалист начинает создание такой программы. Сначала нужно собрать ее каркас (слагаемые в правой части уравнения). Его собирают из уже готовых программ, которые выполняют некие известные базовые преобразования. Каркасы могут быть удачными и неудачными. Приходится перебирать разные варианты каркасов, тестируя их пригодность на некотором количестве имеющихся данных. Для улучшения каркаса следует пользоваться опытом и интуицией.
       Когда каркас создан, переходят к следующему шагу. Берут очень большое количество данных, которые нужны: фотографии, тексты, таблицы значений, и дают возможность созданной программе-каркасу многократно выполняться, получая на входе эти данные. Важно, что в начале этого процесса программе-каркасу предлагают также некоторый набор чисел. С каждым новым раундом выполнения программы этот набор меняется по определенному алгоритму средствами самой программы. Когда он почти перестает меняться, выполнение программы завершается. В результате каркас остался тем же, но получен новый набор чисел – те самые а и b в формуле. Это и есть процесс машинного обучения. Каркас – это модель, то есть программа, которая должна, но пока еще не может решать свою задачу. Каркас вместе с полученным набором чисел – это готовая программа, ее называют обученная модель, она свою задачу решает. Теперь эту программу можно применять согласно ее назначению. Она будет принимать на входе данные (или информацию) и на выходе выдавать другую информацию. Для математика такая программа – просто функция над информацией либо извлечение информации из данных.
       Существуют разные типы моделей машинного обучения. Приведенный выше пример машинного обучения относится к типу нейросети. То есть нейросеть – это частный случай модели машинного обучения. Разумеется, вышеприведенный текст не может охватить всю глубину и широту области машинного обучения. Но нам нужно лишь оценить возможность применения к этой технологии принципов патентного права. А точнее, требований, предъявляемых к идеям, чтобы считать их изобретениями.
       Вернемся к нашей программе: пусть это будет нейросеть, созданная и обученная по технологии машинного обучения. Программа готова к работе: есть каркас и набор чисел. Теперь она может выполнить свою функцию: получить что-то на входе и выдать что-то на выходе. И там, и там – информацию. Фотография на входе – ответ про котиков на выходе, текст на входе – ответ относительно принадлежности к определенному жанру. Как минимум мы видим, что речь идет только о манипуляции информацией. Иногда наша программа способна что-то генерировать (тексты, информацию). Тогда на выходе мы получаем не просто классификацию, а новый графический или текстовый файл.
       И мы хотим получить на наше решение вожделенную патентную охрану. Сразу исключим из рассмотрения случай приложения этой программы к какому-то устройству: сканеру, томографу и т.д. Такое устройство для патентных специалистов представляется спасательным кругом, реальным материальным объектом. Однако на самом деле это лишь маскирует нашу проблему: мы создаем именно компьютерные программы, у нас есть компьютерная программа, и мы собираемся продавать ее в виде прикладного программного обеспечения. Последнее означает, что наша программа может обрасти еще какими-то деталями в виде пользовательского интерфейса и дополнительными функциональностями (например, в созданном на ее основе прикладном программном обеспечении (приложении) будет возможно обращение по ссылке к интернет-ресурсам). Но суть нашего решения заключается именно в нашей нейросети: каркасе-алгоритме, записанном на каком-то языке программирования и обученном на большом количестве данных, что выражается в полученном файле с числами, необходимом для функционирования нашей программы.
       Как все это приложить к патентам на изобретения? У нас есть выбор из двух объектов: продукт и способ. Продуктом может быть устройство самой нейросети: разработчики технично назвали фрагменты каркаса слоями и даже изображают связку элементов каркаса графически. Способом может быть способ обучения этой нейросети либо выполнение нейросетью своей функции с получением результата в виде ответа да/нет, какого-либо списка значений, файла.
       Кстати, поскольку дальше мы будем пытаться найти в нашей нейросети что-то материальное, то, возможно, именно файл станет нашим спасительным кругом вместо вполне осязаемых сканера и томографа. По определению файл – именованная область данных на носителе информации. Именно носитель данных придает файлу некоторую материальность.
       Так вот, мы очень хотим приобрести исключительные права на наш каркас с числами, причем концептуально. Сам по себе он и так имеет охрану как литературное произведение. Мы же хотим, чтобы нам принадлежали права именно на его устройство.
       Каковы наши возможности в рамках патентного права? Первый вариант: кажется, это именно устройство. И тогда придется приводить его схему, рассказывать про число элементов (слоев) и давать их описание. Это, наверное, возможно, но пока непривычно. С набором чисел тоже возникают сложности, поскольку на самом деле он может состоять из миллионов значений. И тут возникает вопрос не только с включением их в формулу изобретения, но и с раскрытием их непосредственно в описании изобретения, если мы хотим дать специалисту возможность воспроизводить наше изобретение. Это тоже не совсем безнадежный случай, поскольку схожая проблема возникала для такого объекта изобретения как вещество. В патентное законодательство были введены требования и условия предоставления перечня нуклеотидных и аминокислотных последовательностей для белков и полинуклеотидов, длина которых измеряется страницами текста. Кстати, сегодня эти данные предоставляются только в электронном виде, что уже приближает нас к решению проблемы с числовыми данными для нейросети.
       Помимо требований к характеристике объекта изобретения и раскрытию его признаков, мы неизбежно находим в патентном законодательстве требования о наличии технического результата. Одно из них: «не считаются техническими результаты, которые заключаются только в получении информации и достигаются только благодаря применению математического метода, программы для электронной вычислительной машины или используемого в ней алгоритма» (п. 42 Требований к документам заявки на выдачу патента на изобретение3 (далее – Требования № 107), п. 6.1.3 Руководства4).
       3 Требования к документам заявки на выдачу патента на изобретение, утв. приказом Министерства экономического развития Российской Федерации от 21 февраля 2023 г. № 107.
       4 Руководство по экспертизе заявок на выдачу евразийских патентов на изобретения.

       Придется признать, что результат выполнения нашей программы – получение информации. Именно этого мы от нее и хотели. Дальше мы будем решать, что с ней делать, а также, что делать с нормативными документами в области патентования изобретений, то есть как именно их читать в этом случае. Но сначала давайте согласимся, что и искусственный интеллект, и модель машинного обучения, и нейросеть – это компьютерные программы, служащие для и только для получения информации.
       И это даже не так страшно, как кажется, потому что все способы диагностики тоже заключаются только в получении информации, однако патенты на изобретения на них выдаются. В таких способах иногда присутствует этап забора материала для анализов, который выглядит как процессы осуществления действий над материальным объектом с помощью материальных средств. Но зачастую такого признака нет, поскольку он не является существенным. От того, что мы возьмем кровь у пациента, ничего в диагностике не меняется. Диагностика осуществляется ментально, на основе количественных данных и какого-то правила их обработки («определяют уровни содержания аутоантител и уровень содержания циркулирующих иммунных комплексов и при значениях уровня аутоантител выше 0,7 усл. ед. и значении уровня циркулирующих иммунных комплексов выше 33,0 усл. ед. диагностируют начальную стадию открытоугольной глаукомы»). И это ни у кого не вызывает возражений относительно наличия технического результата. Так что все это дело привычки. Не зря одним из первых применений методов искусственного интеллекта была медицинская диагностика. Там только их и ждали.
        Другой вариант возможной охраны нейросети можно рассмотреть как объект изобретения – способ получения рабочего варианта нейросети, и тогда сама нейросеть будет иметь косвенную охрану.
       Каковы же признаки способа получения нейросети? Опять нужно описание каркаса, а также описание данных, на которых прошло обучение, и описание способов предварительной обработки этих данных, что чаще всего имеет место. Затем необходимо описание методики обучения. Такая информация предположительно позволит создать аналогичную нейросеть похожего качества. Проблема только в том, что: а) мы пока не договорились, как описывать каркас, б) большие данные не так просто найти, а уж тем более описать в формуле изобретения, в) непонятно, в каких терминах описывать обработку и обучение. Причем все эти признаки предположительно необходимы для реализации нейросетью своего назначения. Поэтому без их полноценного указания не может идти речи не только о раскрытии изобретения, но и о нормальной характеристике его сущности.
       Еще один попутный вопрос: играет ли какую-то роль в решении о патентоспособности способа обучения нейросети тип используемых для обучения данных? С технической стороны, видимо, нет. Но патентное ведомство высказывало ничем пока не обоснованную идею о том, что нейросеть должна быть обучена на данных о физических или химических параметрах объекта, а не на административных действиях, что возвращает нас к вопросу о техническом результате способа обучения.
       Как-то не вписывается никакой естественный результат, связанный с так необходимым нам машинным обучением, в известные патентным специалистам рамки. Хотя субъективно, что, как не компьютерную программу, считать имеющей технический характер?
       Одним из требований нормативных документов к способу является «осуществление действий над материальным объектом с помощью материальных средств» (п. 42 Требований № 107). Изначально мы этого ни в работе, ни в способе обучения нашей нейросети не видим. Но если представим вместо компьютера из миллиона транзисторов аппарат из тумблеров и реле, который обеспечит функцию преобразования информации, нейросеть сразу «заземлится», и там проявятся материальные объекты и средства (тумблеры и реле). Поэтому почему бы и не представлять себе компьютер именно так?
       В данной области есть также решения, связанные с дообучением нейросети. В этом случае каркас и пригодный для решения задачи набор чисел кем-то любезно раскрыт, но у нас несколько иная задача. И мы используем такую кем-то предварительно обученную нейросеть для решения своей задачи на своем наборе данных. Эта ситуация решает вопрос с обладанием очень большими данными, позволяя довольствоваться меньшими. Что касается возможности патентования такой дообученной нейросети, то, помимо описанных выше вариантов ее характеристики и связанных с ними вопросов, встает еще вопрос, как идентифицировать первичную, предварительно обученную нейросеть.
       Если мы отказываемся от охраны нейросети как таковой, пусть даже через косвенную охрану, у нас остается шанс использовать ее как признак изобретения. Мы уходим от одной проблемы, но остаемся с другой. Как мы должны этот признак характеризовать? То есть мы избежали риторики относительно проблемы с техническим результатом, но пока так и не решили, как мы все же характеризуем нейросеть.
       Здесь нужно отдельно устранить недопонимание, которое часто встречается в быту: нейросеть сначала обучают, а потом уже используют. То есть нейросети в общем не обучаются во время их применения. Поэтому если мы используем способ получения нейросети как ее косвенную характеристику в случае, когда она выступает только как признак какого-то другого изобретения, наша конструкция становится чрезвычайно сложной и даже запутанной, что можно, однако, встретить в выданных патентах.
       Внесены изменения в Требования к документам заявки на выдачу патента на изобретение5, в которых отдельно выделен объект «изобретения в области информационных технологий». Там несколько откорректировано требование к техническому результату для таких объектов: теперь он может заключаться в получении данных о параметрах материального объекта с помощью компьютерной программы, а также информации путем семантической обработки текста (п. 42 Требований № 107). Как видим, получение информации все же пробило себе путь в технические результаты, хотя пока только в области смыслового анализа текста. В Требования № 107 также включается новый п. 50(1), в котором перечислены признаки, которые могут быть использованы для характеристики объекта в области информационных технологий. Но даны они в общем виде, например: «действия по обучению искусственного интеллекта», хотя вопрос и заключается в том, как должны быть охарактеризованы эти действия, чтобы быть необходимыми и достаточными для реализации изобретения.
       5 Приказ Министерства экономического развития Российской Федерации от 15 марта 2024 г. № 148 «О внесении изменений в некоторые приказы Минэкономразвития России по вопросам государственной регистрации изобретения и полезной модели, а также проведения предварительного информационного поиска изобретения и полезной модели».
       Не будем забывать и о Сцилле с Харибдой, которые ожидают объекты из области машинного обучения: столкновение утверждений об очевидности со стороны экспертизы и заявителя. Вполне возможно утверждение заявителя о том, что специалист в области техники способен реализовать нейросеть по указанным характеристикам. Его может ждать отказ экспертизы в изобретательском уровне, поскольку изобретение основано «на выборе оптимальных или рабочих значений параметров, если подтверждена известность влияния этих параметров на технический результат, а выбор может быть осуществлен обычным методом проб и ошибок или применением обычных технологических методов или методов конструирования». Этот текст из п. 83 Правил6 напрямую описывает технологию машинного обучения.
       6 Правила составления, подачи и рассмотрения документов, являющихся основанием для совершения юридически значимых действий по государственной регистрации изобретений, утв. приказом Министерства экономического развития Российской Федерации от 21 февраля 2023 № 107.
       Невзирая на установку Роспатента 2022 г. о том, что ключевым аспектом в определении способа защиты становится поиск материального объекта, на который IT-решение непосредственно воздействует, новейшие (март 2024 г.) изменения в российских нормативных документах допустили ранжирование текстов, где материального объекта не видно. И тут мы вспоминаем про файл: можно ли его считать материальным объектом? Это хороший вариант, просто нужно это внятно произнести. Тогда обработка файла с получением измененного файла или просто получение файла могут на полном основании считаться удовлетворяющими требованиям материальности способа.
       Вот пример патента, на который Евразийское патентное ведомство ссылается как на выданный после всестороннего обдумывания: ЕА № 45294 (способ с использованием вычислительной техники для определения степени тяжести кожного заболевания). Понятно, какие непростые задачи решают эксперты патентного ведомства. Однако им приходится иметь дело с тем и только с тем, что уже написано заявителем. Основное патентное творчество в этой области находится в руках заявителей. И сейчас от грамотного подхода патентных специалистов к составлению заявок будет зависеть стиль патентования в этой области.
       С другой стороны, ясные комментарии патентного ведомства об охраноспособности соответствующих решений и непротиворечивая практика выдачи патентов позволит и заявителям формулировать свои притязания яснее и раскрывать решения с нужной полнотой.
       Ну, а в завершение – еще ряд примеров выданных патентов РФ для самостоятельного анализа с учетом вышесказанного, а также момента выдачи:
       № 2649792 («Яндекс», способ обучения алгоритма машинного обучения),
       № 2711717 («Хэдхантер», рекомендательная система подбора персонала),
       № 2720363 («Интеллоджик», способ формирования математических моделей пациента),
       № 2730449 (МФТИ, способ создания модели анализа диалогов),
       № 2772835 (иностранный заявитель, система для агрегации метаданных событий поведения потребителя в магазине),
       № 2777611 (СЗГМУ им. И.И. Мечникова, способ дифференциальной диагностики болезни Крона)
       № 2779281 («Вега», способ обработки изображения обученными нейросетями),
       № 2802533 (Сбербанк, способ анализа диалога во время аудиовызовов),
       № 2814079 («Яндекс», способ для обучения алгоритма машинного обучения).

Список литературы

       1. Алексеева О.Л., Зайцев Ю.С. Компьютерные изобретения: развитие методологии патентования//Патенты и лицензии. Интеллектуальные права. 2023. № 2.
       2. Бледнов К. Патентование изобретений, включающих в себя системы искусственного интеллекта//Инженер. 2024. № 6.