Интеграция с нейросетями

ИИ нужен для для обработки больших объёмов данных, анализа информации и принятия решений. Позволяет оптимизировать процессы (экономия ресурсов и снижение затрат), снизить количество ошибок и повысить производительность.

Этапы интеграции 
  • определении цели интеграции
  • описание предполагаемого результата
    • место в бизнес-процессе
  • описание замысла достижения цели (сбор данных, анализ, визуализация результата)
  • сбор данных
    • набор объектов, список параметров, источники
    • форма получения данных из источника (требуется ли преобразование, объединение)
    • достоверность 
  • выбор модели нейросети
    • LSTM (для анализа последовательности данных и поиска зависимостей)
    • ARIMA
    • Prophet
  • подготовка данных для обучения и проверки нейросети
  • обучение нейросети
  • форма представления результата
  • проверка интеграции на точность на тестовых данных
  • запуск интеграции
  • коррекция интеграции по результатам применения
    • контроль работы интеграции
    • увеличение объёма данных
    • расширение количества анализируемых объектов и параметров
    • обновление модели нейросети
    • оптимизация запросов на получение данных
Понятия

Триггер (trigger) - событие, которое запускает автоматическую процедуру.

Автопроцедура (Workflow)- последовательность шагов, которые выполняются автоматически. Состоит из узлов (nodes), каждый из которых выполняет определённое действие. Узлы соединяются между собой, передавая данные от одного узла к другому. Это позволяет создавать сложные цепочки действий.

Данные - набор структурированной информации

Узел (Node) - Отдельный элемент в рабочем процессе, выполняющий определённую задачу.

Действие (Action) - Операция, выполняемая в рамках рабочего процесса

Платформы 

n8n, https://docs.n8n.io/api/ https://docs.n8n.io/learning-path/

H2oGPT нейросеть для анализа данных и автоматизации https://h2o.ai/platform/open-source-gpt/

HuggingChat универсальный помощник для текстов и анализа https://huggingface.co/chat/

Kandinsky 3.1: текст в картинках  https://www.sberbank.com/promo/kandinsky/

Нейросети в общем

Когда говорят о моделях нейронных сетей, мы имеется в виду конкретные обученные сети (все её веса, конфигурации и функционал). Под архитектурой же подразумевается общий принцип построения сети: сколько слоёв, как они связаны между собой, какие используемые функции активации и т. д. Другими словами, архитектура - это чертёж, модель - это дом, построенный по чертежу.

Рекуррентные нейронные сети с долгой краткосрочной памятью (LSTM). Используются для обработки последовательностей данных. Могут запоминать информацию из предыдущих шагов и использовать её для принятия решений на текущем шаге

Трансформеры. Используют механизм внимания для обработки последовательностей данных. Могут обрабатывать длинные последовательности и учитывать контекст при принятии решений. Часто используются для обработки естественного языка и генерации текста. BERT, GPT, T5, Vision Transformers (ViT), Stable Diffusion

Байесовские нейронные сети. Используют вероятностные методы для принятия решений. Могут учитывать неопределённость и работать с неполными данными. Часто используются для анализа данных и принятия решений в условиях неопределённости. 

 

Пример применения рекуррентной сети

Задача прогнозирования продаж в магазине на основе временных рядов.

  1. Подготовка данных. Собираем историю ежедневных продаж за несколько месяцев или лет. Разбиваем данные на последовательные отрезки (скажем, по 30 дней подряд) и берём итоговые продажи на следующий день как значение для прогноза.
  2. Структура сети. Создаём RNN-модель (часто LSTM или GRU) с одним или несколькими рекуррентными слоями, которые принимают на вход последовательность продаж за предыдущие дни и постепенно «накапливают» информацию во внутреннем состоянии.
  3. Обучение. Подаём куски временного ряда (по 30 дней) и обучаем сеть предсказывать продажи на 31-й день. В процессе обучения веса рекуррентных слоёв настраиваются, чтобы ошибка прогноза минимизировалась.
  4. Проверка. Используем часть данных, отложенных заранее (валидация и тест), чтобы проверить, насколько сеть способна предсказывать продажи на не виденных ранее промежутках времени.
  5. Использование. Когда сеть обучена, берём последние 30 дней продаж (из текущего времени), подаём их на вход модели и получаем прогноз на завтрашний (или более дальний) день.

Так RNN (или её более современную модификацию вроде LSTM/GRU) применяют для анализа последовательных данных, сохраняя информацию о предыдущих шагах и выдавая предсказание на будущее.