Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Искусственный интеллект и нейронные модели
Искусственный интеллект и нейронные модели
Споры продолжают окружать мир изображений, сгенерированных нейросетями, и даже в то время, как изображения, сгенерированные искусственным интеллектом, используемые на выборах, стали источником тревоги на этой неделе на Всемирном экономическом форуме, стартапы продолжают разрабатывать новые инструменты искусственного интеллекта для творческих работников.
Последней стала компания Recraft — генератор графического дизайна с искусственным интеллектом, ориентированный на профессионалов, которая привлекла $12 млн в рамках серии А под руководством Khosla Ventures в Кремниевой долине, а также бывшего генерального директора GitHub Ната Фридмана. В проекте также участвовали RTP Global, Abstract VC, Basis Set Ventures, Элад Гил и другие инвесторы-ангелы.
Безусловно, в настоящее время существует огромное количество инструментов генеративного ИИ-дизайна, таких как Jasper, Adobe Sensei, Let’s Enhance и многие другие. Однако Recraft утверждает, что является одним из первых «основополагающих» инструментов в том смысле, что он создает собственную модель Foundation Model — предварительно обученный алгоритм глубокого обучения — для генерации последовательных элементов дизайна, таких как иконки и изображения, которые можно настраивать и использовать в рамках определенного стиля бренда. Компания также утверждает, что с момента своего запуска восемь месяцев назад она собрала более 300 000 пользователей.
Но это не инструмент для создания забавных изображений собак-ковбоев, скачущих на лошадях, или чего-то подобного. Помимо возможности создания подобных «растровых изображений», он также может генерировать векторные изображения, которые можно бесконечно масштабировать и использовать в профессиональных сферах графического дизайна, в отличие от платформ, где качество изображений часто может быть ограничено.
Возможно, этого и следовало ожидать, ведь основательница компании Анна Вероника Дорогуш точно не является представителем нетехнического направления. Например, она создала CatBoost, высокопроизводительную библиотеку с открытым исходным кодом для градиентного усиления деревьев.
В ходе беседы она рассказала о том, что сбор средств будет способствовать попыткам создания собственной фундаментальной модели: «Вы должны обеспечить пользователям большой контроль над результатами… над стилем, чтобы вы могли получить последовательные изображения, и контроль над такими вещами, как фирменные цвета или уровень детализации, а также возможность итерации полученного изображения».
«Но если модель изначально не может сгенерировать игрока в бильярд или балетного танцора, это означает, что простого использования тонкой настройки недостаточно, чтобы обеспечить качественную генерацию. Поэтому нам нужно создать собственную модель, и мы работаем над этим прямо сейчас», — добавила Анна Вероника Дорогуш.
Она говорит, что Recraft в значительной степени ориентирован на профессионалов: «Уникальность нашей работы заключается в том, что мы не только генерируем изображения. Мы также обеспечиваем контроль стиля: возможность создавать свой собственный стиль и затем генерировать изображения в своем стиле… Это важно, если вы хотите создать бренд и развивать его, создавать маркетинговые материалы, последовательную рекламу».
Тогда мы спросили ее, какова вероятность того, что на них может подать в суд художник, чей стиль был использован на платформе Recraft.
«Мы указываем в наших условиях, что если художник загружает в систему что-то в качестве референса — например, изображение, по которому он будет генерировать новые изображения, — мы не будем использовать это для обучения нашей модели», — говорит Дорогуш.
Она добавила, что Recraft эффективно добавляет общие стили к изображениям, загруженным художниками: «Вы предоставляете стиль модели. Таким образом, у вас есть эталон стиля. А затем вы генерируете изображения, используя этот эталонный стиль. Так что это действие пользователя — предоставить стиль».
Дорогуш также говорит, что инструменты вроде Recraft не вытеснят графических дизайнеров, а, скорее всего, просто сделают графический дизайн более доступным в тех областях, где в настоящее время могли использоваться непривлекательные стоковые изображения: «Год назад, если вы писали детскую книгу, вы получали стоковые изображения. Теперь те же самые люди могут использовать гораздо более красивые иллюстрации и изображения в тех же самых книгах».
Конечно, Recraft — не единственный стартап, играющий в этом направлении. В прошлом году берлинская компания Kittl привлекла 10,8 млн евро (11,6 млн долларов) в рамках серии А для своей дизайнерской платформы, позволяющей пользователям быстро превращать идеи в графические продукты для создания дизайна профессионального уровня.
На этой неделе генеральный директор компании Николас Хейманн рассказал, что такие продукты, как Recraft, являются частью все более сложного набора инструментов, предоставляющих альтернативу дизайнерам: «Я думаю, если Recraft сможет успешно создавать дизайнерские активы — подобно тому, как модели генерации изображений могут стать хорошей заменой библиотекам стоковых фотографий — тогда они определенно смогут отнять [некоторую долю рынка] у библиотек иконок».
Дорогуш говорит, что сейчас есть место сразу для нескольких игроков, и что у Kittl другой сценарий использования, чем у Recraft: «У нас действительно есть уникальная технология для создания стилистически согласованных изображений, и это наш основной фокус. Мы ориентируемся на графических дизайнеров и маркетологов, которым нужно единство стиля, в то время как Kittl занимается товарами, и я очень уважаю их. Это отличная компания».
Как бы то ни было, похоже, что инвесторы воодушевлены возможностью избежать споров, которые вызвали некоторые нейросети и визуализации дизайна, в пользу поддержки этих инструментов ИИ, ориентированных на бизнес.
В своем заявлении Никита Шамгунов, партнер Khosla Ventures, сказал: «Мы наблюдаем быструю и значительную трансформацию дизайнерского пространства под влиянием генеративного ИИ. Однако на сегодняшний день многие решения в области генеративного ИИ ориентированы на потребителей, а не на профессионалов, которым требуется высокая степень контроля. Recraft обеспечивает профессиональные рабочие процессы, такие как векторные изображения, управление стилями и сквозное производство контента, и все это на основе собственных базовых моделей».