Нейросети: запретить нельзя развивать
Алексей Коржебин, 05/06/23
Перифраз известной игры слов, предполагающей взаимоисключающие возможности, как нельзя точно описывает дискуссии, развернувшиеся на тему нейросетей. Опасны ли они? Приведут ли к безработице? Станут ли они решающим конкурентным преимуществом?
Изменения, которые принес миру ChatGPT, поистине революционные, сопоставимые с появлением Интернета или изобретением двигателя внутреннего сгорания. Сейчас фактически каждый день выходят новости о новых языковых моделях, о новых методах их применения. Естественно, подобные изменения вызвали значительный экспертный и общественный резонанс.
Нашумевшее письмо
Особенно ярко подогрел дискуссию Илон Маск. Он инициировал открытое письмо с требованием ввести мораторий на дальнейшие разработки в области ИИ на шесть месяцев.
Письмо подписали более тысячи ученых, бизнесменов и исследователей.
Авторы письма задаются вопросами: должны ли мы позволять машинам наводнять наши информационные каналы пропагандой? Должны ли мы автоматизировать все рабочие места? Должны ли мы развивать нечеловеческие умы, которые в конечном итоге могут превзойти нас численностью, перехитрить, сделать нас ненужными и заменить нас? Должны ли мы рисковать потерей контроля над нашей цивилизацией?
Изюминку этому письму придает то, что сам Илон Маск был основателем OpenAI, разработавшей ChatGPT, но затем вышел из числа акционеров. Является ли это "ответкой" за то, что он теперь не участвует в этом проекте? По рынку пошли слухи, что компании Маска закупают в огромных количествах графические карты, более 10 тыс. штук, на которых можно обучать большие языковые модели, а также он оказался генеральным директором новой компании с говорящим названием X.AI.
"Мы все умрем"
Градус истерии взвинтил известный эксперт по ИИ Элиезер Юдковский: "Если мы и правда сделаем сильный ИИ, мы все умрем". Он предложил наносить ракетные удары по лабораториям и дата-центрам, которые будут нарушать запрет. Неизвестно, действительно ли так сильно испугался эксперт или элиты западного мира ищут повод для вторжения в другие страны и уничтожения конкурентов, а смыслом подобного заявления было зондирование общественного мнения.
Решения на Open Source
Вернемся к технологическим новостям. Важным трендом стало появление языковых моделей Open Source, основанных на модели LLaMA, которая утекла из Facebook (Meta Platforms Inc. признана экстремистской организацией на территории РФ). Участники сообщества Open Source создали целый "зоопарк" моделей (для названия моделей были использованы названия различных пород лам) разного объема, доработанных под конкретные задачи.
Важно отметить две особенности: их можно дообучать на пользовательских данных и второе – их можно запускать не в облаке, а локально. Для маленьких моделей подойдут даже пользовательские устройства – смартфоны и контроллеры Raspberry PI. Представляете, у вас есть личный помощник, настроенный исключительно под вас, при этом ваши данные не передаются ни в какое облако. Помощник легко ответит на вопросы, связанные с вашими личными данными, например напишет ответ на сообщение или резюмирует результаты переписки. При добавлении функции text2speech он сможет стать вашим секретарем-автоответчиком, блокирующим спам-звонки.
Большие перспективы
Интересно, когда производители телефонов интегрируют подобные модели в свои устройства? Ведь это тот редкий случай, когда можно получить революционные функции для своих устройств, практически ничего не разработав, а лишь оптимизировав их под свое железо, как говорится, plug and play (подключи и играй).
Для бизнеса данные модели тоже представляют большую ценность. Их можно натренировать под конкретные задачи, от создания программного кода до оптимизации службы поддержки и электронного документооборота.
Представьте, что локальная нейросеть будет на лету писать скрипты на python или другом языке, перепрограммировать промышленные контроллеры, получив техническое задание, написанное в свободной форме, а при обнаружении ошибок тут же изменит код и снова запустит его на выполнение.
Среди современных языковых моделей появились так называемые мультимодальные модели, которые на вход могут принимать не только текст, но и картинки, аудио- и видеопотоки, а также другие форматы данных. При таких характеристиках мы сможем дообучать локальную нейросеть на данных от датчиков, например, умного дома. Нейросеть будет чувствовать управляемый дом как свое тело и реагировать как на "боль" на различные изменения и аварии на управляемом объекте, программируя в реальном времени устройства и контроллеры. Для таких сетей появился специальный термин Embodied. Это потенциально может стать революцией в робототехнике: робота не нужно программировать, достаточно будет давать ему голосовые команды. Скорее всего, подобные нейросети станут основой самостоятельных и полезных роботов, которые смогут заменить многие профессии, связанные с физическим трудом.
Российские разработки: нам есть чем гордиться
В конце статьи я бы хотел поздравить наших российских разработчиков из Сбера, которые выпустили новую версию нейросетевого генератора изображений – "Кандинский 2.1", а также GigaСhat, аналог ChatGPT. Оба продукта будут доступны под лицензией Open Source, они поддерживают возможность дообучения пользователем, и, самое главное, их можно запустить даже из дома, хотя при этом потребуется достаточно мощный компьютер или ноутбук.
К сожалению, GigaСhat пока находится в закрытой бете, поэтому протестировать его не получается, но появляющаяся информация говорит о сервисе как о серьезном конкуренте ChatGPT. Как мы понимаем, на русском языке он окажется вне конкуренции.
А вот генератор "Кандинский 2.1" доступен всем. По метрике FID, обозначающей, насколько точно нейросеть рендерит картинку по описанию, Кандинский 2.1 занимает третье место в мировом рейтинге, уступая только нейросетям от NVidia и Google, но из сетей Open Source он на первом месте.
Интересно, что главный разработчик нейросети "Кандинский 2.1" – одиннадцатиклассник из Челябинска Арсений Шахматов. Кандинский 2.1 побил рекорд ChatGPT, став самым быстрорастущим сервисом и достигнув 1 млн уникальных пользователей всего за четыре дня, затем 2 млн пользователей за шесть дней. Это быстрее результата сервиса ChatGPT от OpenAI, которому потребовалось пять дней, чтобы набрать 1 млн пользователей.
Опубликовано в журнале "Системы безопасности" № 2/2023
Все статьи журнала "Системы безопасности"
доступны для скачивания в iMag >>
Фото: ru.freepik.com