Технологии

Маск признал то, о чём в AI-индустрии давно говорили шёпотом

© whitehouse.gov

Илон Маск в суде подтвердил, что его компания xAI частично использовала модели OpenAI для обучения чат-бота Grok. Речь идёт о так называемой дистилляции — методе, при котором разработчики обращаются к уже доступным чат-ботам или API, чтобы на основе их ответов обучать новые AI-модели.

Эта тема в последние месяцы стала особенно чувствительной для крупных AI-компаний. OpenAI и Anthropic активно выступают против сторонних попыток обучать новые модели через массовые запросы к их публичным сервисам. До сих пор внимание в основном было сосредоточено на китайских компаниях, которые, как указывалось в статье, используют дистилляцию для создания открытых моделей, близких по возможностям к американским разработкам, но более дешёвых в эксплуатации.

Теперь стало известно, что такая практика применялась как минимум и в одном американском случае. На заседании федерального суда Калифорнии Маска спросили, использовала ли xAI дистилляцию моделей OpenAI для обучения Grok. В ответ он заявил, что подобные методы в целом распространены среди AI-компаний, а затем подтвердил, что в случае xAI это происходило частично.

Судебный процесс связан с иском Маска против OpenAI, Сэма Альтмана и Грега Брокмана. Он обвиняет их в отходе от изначальной некоммерческой миссии OpenAI и переходе к коммерческой модели. Разбирательство началось на этой неделе, и показания Маска стали одной из заметных частей процесса.

Отдельный вес этому признанию придаёт сама природа дистилляции. Для лидеров AI-рынка она представляет угрозу, потому что снижает значение их дорогостоящих вложений в вычислительную инфраструктуру. Если другие разработчики могут создавать почти сопоставимые модели с меньшими затратами, конкурентное преимущество крупных лабораторий становится менее устойчивым.

Эксперты отмечают и иронию ситуации: ведущие AI-компании сами сталкивались с претензиями из-за использования больших массивов данных для обучения моделей, включая вопросы авторского права. На этом фоне борьба с дистилляцией выглядит особенно напряжённой.

Для xAI такой подход не выглядит неожиданным. Компания Маска появилась в 2023 году, то есть значительно позже OpenAI, которая к тому моменту уже была одним из лидеров рынка. При этом в статье подчёркивается, что дистилляция не обязательно прямо незаконна, но может нарушать условия использования сервисов, установленные самими компаниями.

OpenAI, Anthropic и Google, по данным Bloomberg, запустили инициативу в рамках Frontier Model Forum, чтобы обмениваться информацией о борьбе с дистилляцией со стороны Китая. Такие попытки обычно строятся на систематических запросах к моделям, через которые разработчики пытаются понять их внутреннюю логику. В ответ крупные AI-лаборатории стараются выявлять и блокировать подозрительно массовые запросы.

Позже во время показаний Маска спросили о его прошлогоднем заявлении, что xAI вскоре сможет серьёзно опередить почти всех конкурентов, кроме Google. На этот раз он оценил расстановку сил иначе: лидером он назвал Anthropic, затем поставил OpenAI, Google и китайские open source-модели. Саму xAI Маск охарактеризовал как гораздо меньшую компанию, где работают всего несколько сотен сотрудников.