Обучать ИИ на постах мастодонтов? Идея отпала после обновления условий

Важные новости

Training AI on Mastodon posts? The idea's extinct after terms updated

Mastodon — это новейшая платформа для противодействия обучению ИИ, обновляющая свои правила и условия, чтобы запретить использование пользовательского контента для больших языковых моделей (LLM).

«Мы хотим внести ясность». федеративная платформа сообщила в электронном письме пользователям, «что обучение магистров на основе данных пользователей-мастодонтов в наших инстансах запрещено».

Это объявление может показаться похожим на захлопывание двери конюшни после того, как лошадь убежала, но все равно приятно осознавать, что пользователи’ разглагольствования на платформе, теоретически, не повлияют на работу LLM, создающих сервисы генеративного искусственного интеллекта.Справедливости ради, соблюдение таких ограничений на платформе, которая гордится своей децентрализацией и открытостью, может оказаться сложной задачей. Условия применимы только к собственным экземплярам Mastodon, а не к более широкому кругу пользователей. Можно развернуть файл robots.txt, чтобы заблокировать поисковые роботы с ИИ, но это зависит от того, что те, кто стоит за ботами, уважают его, а не от добросовестного использования.

Mastodon — не единственная платформа, обеспокоенная тем, что ее контент используется для обучения ИИ. Другая платформа социальных сетей, Bluesky, недавно заявила: «Мы не используем ваш контент для обучения генеративного ИИ и не собираемся этого делать», но, как признала служба, соблюдение такого правила за пределами ее систем является сложной задачей.

Когда 2024 год подошел к концу, в обучающем наборе появилось миллион публичных сообщений из firehose API Bluesky.

Ранее в июне дискуссионный форум Reddit подал в суд на компанию Anthropic, занимающуюся искусственным интеллектом, из–за обвинений [жалоба здесь — PDF] этот контент, созданный его пользователями, был удален в нарушение договорных условий и технических барьеров. В иске не приводились примеры каких-либо предполагаемых robots.txt нарушения со стороны Anthropic после июля 2024 года.

В 2024 году Reddit подписал соглашение об обмене данными с OpenAI. Ранее в том же году компания подписала соглашение об обучении ИИ с Google, начав взимать плату с компаний за использование своего API для загрузки данных в 2023 году.

Изменение Mastodon подчеркивает обеспокоенность пользователей тем, как могут использоваться их данные, особенно на платформах, которые по своей природе являются максимально бесплатно и открыто.

Обновления, включая повышение минимального возраста с 13 до 16 лет, вступают в силу с 1 июля. ®

Новости сегодня

Последние новости