Российские ИТ-специалисты и технологии LLM: как внедрять инструмент в современную ИТ-компанию

В 2024 году некоторые эксперты сравнивают появление Chat GPT с поисковой системой Google в 90-е годы. Когда люди получили новый механизм доступа к информации и большим массивам данных и знаний. Разберемся, что это за технология, как она помогает разработчикам российской ИТ-компании значительно снижать стоимость работы на проектах и издержки на решение рутинных и трудоемких задач. Не нарушая при этом принципов информационной безопасности и конфиденциальности кода и разработок.

Основой материала стало реальное аналитическое исследование “Девелоники” (ГК Softline) на базе опросов сотрудников о применении ими нейросетей, а также – практики использования ChatGPT, RuGPT-3/GigaChat и YandexGPT-2 для решения типовых задач. (Количество платных аккаунтов было ограничено кругом специалистов, работающих на внутренних проектах компании.)

Начнем с базы:

GPT (Generative Pre-trained Transformer) – прорыв в мире искусственного интеллекта. LLM (Большая языковая модель, состоящая из нейронной сети со множеством параметров, обученная на большом количестве неразмеченного текста с использованием обучения без учителя) – часть нашей жизни, благодаря компании OpenAI. В 2018 году она запустили разработку ChatGPT и за несколько лет достигла невероятных результатов.

Публичный доступ к модели появился в ноябре 2022 года с выходом GPT-3, которая имела около 175 млрд параметров (для сравнения: GPT-1 – 117 млн параметров, GPT-2 – 1,5 млрд параметров). В 2023 году нейросеть обновили до следующего варианта: GPT-4. Ее способности впечатляют и стали основой тысяч новых приложений и сервисов. На сегодняшний день аудитория GPT-4 составляет более 100 млн пользователей. И по всем прогнозам, пятая версия позволит применять еще больше возможностей за счет в разы улучшенных алгоритмов и механик использования.

Крупные российские ИТ-компании не остались в стороне

🔹 В 2023 году Яндекс запустил собственную нейросеть YandexGPT. Она также может создавать и перерабатывать текстовые материалы, придумывать идеи. А главное – она тоже полностью учитывает контекст беседы с пользователем. В декабре прошлого года специалисты отечественной компании сравнили качество ответов YandexGPT-2 и GPT 3.5 на русском языке. Так, в 63 процентах случаев результат российской нейросети превосходит оригинальный продукт OpenAI. Факт обучения ее в родной нам среде делает технологию весьма конкурентной по применению в России.
🔹 Еще одна диалоговая AI-модель, которая может говорить как на русском, так и английском, отвечать на вопросы, сочинять тексты, писать код и генерировать картинки, была представлена Сбером. Первая версия вышла в 2021, а вторая — в 2023 году. GigaChat, в каком-то смысле, помогает уйти от однополярного развития ИИ на отечественном рынке. Нейросеть (в текстовой части) работает на языковых моделях ruGPT-3 и FRED-TP, она обучена, по словам разработчиков на 18 миллиардах параметров.

Мультимодальные модели искусственного интеллекта (которые оперируют текстом, картинками и звуком) оперативно обучаются и способны генерировать данные в разы быстрее, чем самый знающий и образованный специалист. То, что человек учит месяцами, нейросеть поглощает и запоминает за минуты.

Для примера – вот несколько интересных фактов,
ярко демонстрирующих успехи развития технологии на текущий момент:

В сети можно найти истории, как GPT собрал код рабочего сайта на html/css/javascript просканировав фотографию рисунка на салфетке.
Один из сервисов по изучению языков уже использует ИИ-репетитора на основе GPT-4, чтобы помогать ученикам осваивать новые языки. Как говорится, вкалывают роботы, а не человек.
Яндекс уже тестирует новую Алису на базе YandexGPT 2. Получается ИИ будет всегда под рукой. И есть все основания полагать, что мы увидим реальный диалог с учетом предыдущих ответов и выходом в режим Поиска.
Нейросеть GigaChat от Сбера успешно сдала экзамен по медицинским знаниям, требуемым для получения квалификации «врач-лечебник»

Практика применения

По данным «Нейростата» (первой регулярной оценки знания и использования генеративных нейросетей, запущенной Яндексом в 2023 году), 31% россиян используют нейросети для создания текстового и графического контента.
Дизайн, фотография, аналитика, работа с визуальным и аудио-контентом, чат-боты – инструмент нашел применение в самых разных областях. И есть ощущение, что ему под силу даже слишком много задач: перевод, генерация текста, генерация кода программ, тестирование на NLP-задачах (вопросно-ответные задачи, машинный перевод и формирование текста).

Правительство России продвигает реализацию федерального проекта «Искусственный интеллект». Благодаря такой инициативе за 2023 год уже удалось привлечь 2,5 млрд руб. частного финансирования от ведущих российских компаний. Кроме того, более 100 ВУЗов страны запустили программы обучения для подготовки специалистов в области ИИ. А на рынке труда все чаще в ИТ-вакансиях мелькает требования: “опыт работы с нейросетями”.

ИТ-профессии и GPT: Снижение трудоемкости рутинных задач

Разработчики, тестировщики и аналитики Девелоники входят в число интересующихся новыми способами оптимизации работы и технологиями ИИ. Поэтому мы обеспечили ряд специалистов доступом ко всем возможностям GPT, чтобы оценить эффект внедрения ИИ в процессы разработки ПО. Мы находимся в стадии точной оценки экономического эффекта от эксперимента. Но, по совокупности большинства субъективных мнений и опросам по регулярному использованию LLM, выводы уже довольно позитивные.

Исследование изнутри: как специалисты ИТ-компании относятся к нейросетям в рабочих задачах?

Мы провели свободный опрос, который состоял из 6 вопросов с открытыми и закрытыми формами ответа. В нем участвовали представители разных отделов и команд из трех хабов разработки: в Москве, Костроме и Ижевске.

Основной тезис, который удалось подтвердить — применение GPT в качестве инструмента приводит к экономии

20-30% времени у программистов, тестировщиков и аналитиков.
До 50% времени у непроизводственного персонала.

1. Применение нейросетей

🔹 Результаты такие: 50% респондентов готовы начать применять или уже используют ИИ, против 50% тех, кто совсем не применяет GPT.
Обычно в своем отношении к новому, люди предпочитают формировать мнение коллективно: и это либо приоритетное “за”, либо “против”. GPT – тема, которая в борьбе за внимание специалистов оказалась в уверенной середине.

Мы не можем раскрыть данные полностью, но с обеих сторон почти равное соотношение производственных и непроизводственных сотрудников. Помимо этого, нет явного перевеса “хейта” или приверженности, выраженной у какой-то конкретной ИТ-специализации. Разработчики, тестировщики, аналитики с большим пониманием (и иногда с грустью) принимают для себя недостатки и риски ИИ.
Об этом мы еще поговорим позже. Переходим к следующему вопросу.

2. Частота использования

🔹 Как мы видим, уровень использования на данные момент достаточно низкий, что обусловлено:

Нейросети допускают ошибки, что смущает разработчиков.
Не всегда легко найти кейс для применения ИИ.
Нет готовых методологий по применению ИИ для различных ИТ-специальностей.

3. Влияние на производительность

🔹 В большинстве своем, мы видим увеличение эффективности сотрудников. Среди ответивших сотрудников более половины замечают выгоду от применения технологий. Зачастую это выражено в сокращении трудозатрат. То есть, сотрудник тратит меньше времени на то, что раньше делал полностью вручную.

С чем может быть связана устойчивость или снижение показателей?

неумение обращаться с промтами, когда время их постановки в итоге не компенсируется ускоренной работой нейросети
невозможность передать данные проекта непосредственно сети, время на дополнительные анализы документации и фактчекинг.
и как мы отметили выше, методологии использования еще не сформированы и не проработаны.

Что вам и сотрудникам с этим делать? Рассказываем в блоке советы для бизнеса в конце материала.

4. Направление задач

🔹 Для чего можно и полезно применять GPT?
Если перевести ответы в направления и тезисы, мы получим следующую картину:

оптимизация кода, устранение ошибок и работа с шаблонными задачами.
анализ информации и прогнозирование оптимальных действий, выбор пути решений.
создание разнообразных учебных материалов и руководств, формирование текстовые объяснений, примеров использования различных технологий или инструментов.
быстрая обработка большого количества информации, генерация идей.
обеспечение эффективного и непрерывного обучения, возможность глубже понимать изучаемую тему и быстрее приступить к ее непосредственному применению.
Актуально тестировщикам: использование нейросети для наиболее частой задачи в QA: генерация тест-кейсов.

Чем хорош столь быстрый помощник разработчику или сотруднику в смежном направлении ИТ-отрасли?

Вот ТОП-3 направлений работ, которые становится проще выполнять:

Упрощение поиска и структурирования информации.
Есть возможность быстро найти базовую сокращенную информацию о технологии или проблеме.
Делегирование рутинных задач на AI.
Допустим, ускорение работы при рутинных действиях — сгенерировать документацию или методы для перекладывания из одного объекта в другой при создании кода.
Быстрые решения и борьба с боязнью “белого листа”.
Часто, если нет собственных идей, чат подталкивает сотрудников на нужный путь, в том числе, это касается небольших абстрактных сервисов и алгоритмов.

Отсюда и ниже мы представим ответы в виде цитат, на наш взгляд, самых интересных и емких

Конечно, есть целый ряд рисков, опасений и сложностей, ведь у нейросети, как и у любого явления — две стороны. Как бы ИИ стремительно не развивался, это все еще обучаемая людьми технология, которая имеет свои недоработки в сравнении с человеческим подходом.

Можно выделить 2 группы проблем: общего и профессионального характера.

Респонденты единодушно призывают помнить: нейросеть любит придумывать ответы. Вся фактическая информация должна быть обязательно перепроверена! При наличии достаточного опыта в интересующей сфере и внимательной проверке выданной информации эти моменты можно минимизировать или вообще нейтрализовать. Но учитывайте: ответ бывает недостаточно полным, а примеры – не столь подробными. Часто приходится переспрашивать и лучше прорабатывать промт.

Главные “боли” айтишников:

Галлюцинации ИИ – любое чуть более сложное техническое решение надо проверять на соответствие действительности.
Многословие – написано красиво, но текст на абзац можно пересказать одним предложением.
Расплывчатость формулировок – часто получаются слишком общие и расплывчатые ответы.

Что касается применения непосредственно при работе с кодом и документацией, то здесь есть целый ряд наблюдений от наших разработчиков:

Советы по внедрению инструментов ИИ в бизнес

Здесь выделим базовые шаги по знакомству и распространению новых механизмов ИИ. Это реальная инвестиция в будущее вашей компании. Составили список рекомендаций, о которых стоит подумать перед тем, как массово внедрять LLM в свои системы или отдавать их “на откуп” разработчикам:

Создайте программу обучения по применению AI-инструментов, в которой будут собраны оптимальные промпты, плюсы и минусы с учетом задач, языков программирования, версий самого AI-инструмента.
Проведите обучение с практическими примерами, относительно специализации сотрудников (для разработчиков, тестировщиков, непроизводственных сотрудников, HR, маркетинг). В нашей компании мы регулярно организуем встречи и вебинары, которые касаются стремительно развивающихся трендов ИТ.
Предоставьте ссылки на рабочие инструменты AI и информацию с кратким описанием возможностей и их направленности. Предоставьте специалистам мидл+ доступ к платным моделям GPT, так как некоторые из них сейчас сложно оплачивать самостоятельно. Руководству решить этот вопрос значительно проще, чем специалистам по одиночке.

Более узконаправленные и целевые инициативы для ИТ-компаний

Нашим сотрудникам (в результате исследования) оказалось особенно интересны возможности использования AI в QA. При генерации синтетических тестовых данных, анализе данных, анализе больших кусков логов, упрощение рутинных задач. Помимо этого, сформировался запрос на возможность генерации тест-планов/тест-кейсов на основе предыдущих данных. Разработчики и тестировщики видят большие перспективы для использовании ИИ в целом направлении задач. С точки зрения управления, это выполнимо, если запустить AI на внутреннем сервере компании, чтобы не беспокоиться за NDA и безопасность данных заказчиков.

Несколько интересных идей:
– “Было бы неплохо анализировать записи созвонов с заказчиком, и получать в текстовом виде выжимку главного. Кстати, такое решение здорово бы пригодилось для обработки больших объемов информации от заказчика. Когда нужно быстро понять о чем речь в виде тезисов на основе объемного файла с требованиями.”

– “Для программистов было бы очень полезно проверять код перед деплоем в ИИ. Да и старый код, который написан другими перепроверить было бы неплохо на предмет уязвимостей, утечки памяти и прочих ошибок. Для инженеров очень здорово было бы получать быстрые ответы на вопросы, связанные с настройкой оборудования и программ (без долгого гугло-поиска). Получать советы по созданию систем мониторинга. Иметь возможность в простой форме давать задания ИИ на сложные технологические процессы (развертывания серверов, установки ПО, деплоя кода, мониторинга)”

– “Нужно добавлять AI с генерацией текста к базам знаний компании, для ускорения и упрощения поиска.”

ОБЩИЙ ВЫВОД:

Как и любая новая технология, большие языковые модели требуют вдумчивых планов и последовательного внедрения в практику. Сейчас опытом по их эффективному использованию обладают единицы компаний в стране. Российским игрокам необходимо быстро нарабатывать практический опыт и методологии применения. Вопросы безопасности использования сетей очень важны и до конца они еще не решены. Но вопрос внедрения Open Source моделей стоит на повестке дня, и мы как ИТ-компания активно и внимательно смотрим, как это делать. Компании-разработчики, которые сейчас не внедряют использование GPT в повседневную деятельность, будут отставать.

Это отставание будет идти по нескольким фронтам:

Более низкая производительность труда в сравнении с конкурентами, которые уже внедряют использование LLM в производственные процессы.
Люди привыкают к хорошему, скоро кандидаты будут нас спрашивать о политике использования генеративного интеллекта в компании. Многие уже спрашивают!
Заказчики будут выбирать те компании, которые уже имеют опыт использования AI в собственных процессах и могут внедрять системы, опираясь на собственный опыт.

Перспективы и польза ИИ очевидны каждому: специалистам, пользователям, представителям госаппарата и Минцифры. Надеемся, что это исследование поможет оценить ваши силы и ресурсы и встать на путь грамотного внедрения ИИ.

Автор: Роман Смирнов,
коммерческий директор “Девелоники” (ГК Softline)

#ЗаказнаяРазработка #Softline #Девелоника #ИИ #ИТ #нейросети #GPT #аналитика