Интеграция с нейросетями

ИИ нужен для для обработки больших объёмов данных, анализа информации и принятия решений. Позволяет оптимизировать процессы (экономия ресурсов и снижение затрат), снизить количество ошибок и повысить производительность.

Этапы интеграции

определении цели интеграции
описание предполагаемого результата
- место в бизнес-процессе
описание замысла достижения цели (сбор данных, анализ, визуализация результата)
сбор данных
- набор объектов, список параметров, источники
- форма получения данных из источника (требуется ли преобразование, объединение)
- достоверность
выбор модели нейросети
- LSTM (для анализа последовательности данных и поиска зависимостей)
- ARIMA
- Prophet
подготовка данных для обучения и проверки нейросети
обучение нейросети
форма представления результата
проверка интеграции на точность на тестовых данных
запуск интеграции
коррекция интеграции по результатам применения
- контроль работы интеграции
- увеличение объёма данных
- расширение количества анализируемых объектов и параметров
- обновление модели нейросети
- оптимизация запросов на получение данных

Понятия

Триггер (trigger) - событие, которое запускает автоматическую процедуру.

Автопроцедура (Workflow)- последовательность шагов, которые выполняются автоматически. Состоит из узлов (nodes), каждый из которых выполняет определённое действие. Узлы соединяются между собой, передавая данные от одного узла к другому. Это позволяет создавать сложные цепочки действий.

Данные - набор структурированной информации

Узел (Node) - Отдельный элемент в рабочем процессе, выполняющий определённую задачу.

Действие (Action) - Операция, выполняемая в рамках рабочего процесса

Платформы

n8n, https://docs.n8n.io/api/ https://docs.n8n.io/learning-path/

H2oGPT нейросеть для анализа данных и автоматизации https://h2o.ai/platform/open-source-gpt/

HuggingChat универсальный помощник для текстов и анализа https://huggingface.co/chat/

Kandinsky 3.1: текст в картинках https://www.sberbank.com/promo/kandinsky/

Нейросети в общем

Когда говорят о моделях нейронных сетей, мы имеется в виду конкретные обученные сети (все её веса, конфигурации и функционал). Под архитектурой же подразумевается общий принцип построения сети: сколько слоёв, как они связаны между собой, какие используемые функции активации и т. д. Другими словами, архитектура - это чертёж, модель - это дом, построенный по чертежу.

Рекуррентные нейронные сети с долгой краткосрочной памятью (LSTM). Используются для обработки последовательностей данных. Могут запоминать информацию из предыдущих шагов и использовать её для принятия решений на текущем шаге

Трансформеры. Используют механизм внимания для обработки последовательностей данных. Могут обрабатывать длинные последовательности и учитывать контекст при принятии решений. Часто используются для обработки естественного языка и генерации текста. BERT, GPT, T5, Vision Transformers (ViT), Stable Diffusion

Байесовские нейронные сети. Используют вероятностные методы для принятия решений. Могут учитывать неопределённость и работать с неполными данными. Часто используются для анализа данных и принятия решений в условиях неопределённости.

Пример применения рекуррентной сети

Задача прогнозирования продаж в магазине на основе временных рядов.

Подготовка данных. Собираем историю ежедневных продаж за несколько месяцев или лет. Разбиваем данные на последовательные отрезки (скажем, по 30 дней подряд) и берём итоговые продажи на следующий день как значение для прогноза.
Структура сети. Создаём RNN-модель (часто LSTM или GRU) с одним или несколькими рекуррентными слоями, которые принимают на вход последовательность продаж за предыдущие дни и постепенно «накапливают» информацию во внутреннем состоянии.
Обучение. Подаём куски временного ряда (по 30 дней) и обучаем сеть предсказывать продажи на 31-й день. В процессе обучения веса рекуррентных слоёв настраиваются, чтобы ошибка прогноза минимизировалась.
Проверка. Используем часть данных, отложенных заранее (валидация и тест), чтобы проверить, насколько сеть способна предсказывать продажи на не виденных ранее промежутках времени.
Использование. Когда сеть обучена, берём последние 30 дней продаж (из текущего времени), подаём их на вход модели и получаем прогноз на завтрашний (или более дальний) день.

Так RNN (или её более современную модификацию вроде LSTM/GRU) применяют для анализа последовательных данных, сохраняя информацию о предыдущих шагах и выдавая предсказание на будущее.