Машинное обучение (ML) в области обработки естественного языка (NLP) и компьютерного зрения (CV) — ключевые направления, которые активно развиваются в настоящее время и находят применение в различных отраслях.
NLP подразумевает использование машинного обучения для анализа, интерпретации и генерации текстовой информации. Среди решаемых задач:
- Анализ тональности - определение эмоциональной окраски текста (позитивная, негативная, нейтральная). Технология применяется в анализе отзывов, социальных медиа и опросов
- Классификация текста - автоматическая классификация документов на основе их содержания. Например, фильтрация спама или классификация новостных статей по категориям
- Извлечение информации - выделение специфических данных из текста, таких как имена, места, даты и т. д. Полезно для создания баз данных из неструктурированных источников
- Машинный перевод - использование нейронных сетей для автоматического перевода текста с одного языка на другой с высокой точностью
- Генерация текста - создание связного текста на основе заданных параметров (используется в чат-ботах, автоматизированных системах поддержки и контент-менеджменте)
- Сентиментализация - анализ и интерпретация мнений и оценок (полезно для брендов и маркетинга)
CV занимается анализом визуальной информации с помощью машинного обучения, обеспечивая:
- Обнаружение объектов - автоматическое определение и локализация объектов на изображениях или видео
- Распознавание лиц - использование алгоритмов для идентификации и верификации лиц на изображениях
- Сегментация изображений - разделение изображения на несколько сегментов для более детального анализа
- Классификация изображений - определение класса объекта на изображении
- Обработка видео - анализ видеопотока в реальном времени для различных задач, таких как мониторинг, анализ поведения и прогнозирование событий
- Синтез изображений - использование генеративных моделей (например, GAN) для создания новых изображений на основе заданных характеристик
Применение машинного обучения в области NLP и CV открывает широкие горизонты для автоматизации процессов, улучшения оперативности и повышения качества услуг в различных отраслях, позволяя организациям обрабатывать большие объемы данных, извлекать из них ценную информацию и обеспечивать более глубокое взаимодействие с клиентами.
НТЦ «Вулкан» разрабатывает прикладные информационные системы с использованием ML-алгоритмов, а также проводит исследования в области CV, NLP и обработки звука, в том числе осуществляя:
- Решение всего пула задач, связанного с детекцией и сегментацией объектов на изображении: от разметки данных до развертывания модели
- Обеспечение поиска изображений по текстовому описанию
- Реализацию тегирования изображений по различным параметрам
- Исследование мультимодальных моделей для анализа изображений (CLIP, LLaVa, Flamingo и т. п.)
- Построение систем анализа неструктурированных текстовых данных с использованием BERT-, GPT-, T5-подобных языковых моделей
- Тематическое моделирование
- Дообучение языковых моделей (в том числе LLM) под узкоспециализированный домен
- Исследование и разработку диалоговых систем (чат-ботов) на основе LLM
- Исследование безопасности применения LLM в различных контекстах
- Решение задач синтеза (TTS) и распознавания (STT) речи
- Исследование методов диаризации, тегирования, сегментирование речевых аудио данных
- Исследование применимости современных подходов в глубоком обучении для анализа программного кода и его защищенности