Блог

Как мы с командой студентов аналитический конвейер для трейдинга создавали

Сегодня хочу рассказать про один наш ML-проект с командой из студентов Финансового университета. Мы разработали аналитический конвейер для инвесторов. Звучит сложно? Сейчас объясню простыми словами.

Шаг 0. Проработка проблемы

Мы поговорили с обычными людьми, которые торгуют акциями через брокерские приложения. Выяснили, что «данных - море, а понятных сигналов «покупать / продавать / держать» - ноль». Люди тонут в графиках, новостях, отчётах. Чтобы понять, что делать с акцией прямо сейчас, нужно или матобразование, или опыт трейдера, или своя программа. А если всего этого нет - человек либо паникует, либо слепо верит телеграм-каналам. И теряет деньги.

Нам стало интересно: а можно сделать такой сервис, который сам переведёт биржевой шум на человеческий язык? Спойлер: да, можно. И вот как мы это сделали.

Шаг 1. Определили, откуда брать данные

Мы взяли платформу RUDATA «Интерфакс», что было ожидаемо, так как я - product в этом проекте по своему основному месту работы. Итак, RUDATA - это «золотой источник», 5,5 терабайт проверенной информации, 46 000 инструментов. Там есть всё: котировки, корпоративные события, отчётность, рейтинги, а главное - удобный REST API, который легко встроить в брокерское приложение.

Шаг 2. Спроектировали «конвейер» из 6 модулей

Мы не стали делать очередного торгового робота. Наша цель - дать чёткий сигнал + простое объяснение. Вот как это работает:

Модуль 1. Загрузка данных. Пользователь вводит тикер (например, SBER) или идентификатор ISIN. Если бумага российская - идём в RUDATA. Если иностранная - подключаем Yahoo Finance. Всё само, без лишних движений.

Модуль 2. Считаем технические индикаторы. Скользящие средние, RSI, полосы Боллинджера - база, но без неё никуда.

Модуль 3. Ищем свечные паттерны. Детектор «Молот» и «Бычье поглощение». Пользователь видит не просто текст, а метку на графике. Доверие растёт.

Модуль 4. Кластеризуем рыночные режимы (K‑means). Обучаем алгоритм определять 4 состояния:

  • сильный рост
  • сильное падение
  • спокойный флэт
  • волатильный флэт

Модуль 5. Размечаем тренд методом LOWESS. Это наш любимый инструмент. Вместо субъективных «глазомерных» линий - автоматическое сглаживание и раскраска графика:

  • зелёный = рост
  • красный = падение
  • серый = флэт

Брокеры, берите на заметку - готовый UI-компонент.

Модуль 6. Генерируем текст (через LLM). Сначала мы использовали Gemini, но для реального внедрения в России переходим на Open Source модели (Llama-3, Qwen). Они работают on‑premise - безопасно и по комплаенсу.

Важный момент: LLM не трогает рыночные данные напрямую. Она получает уже готовый результат кластеризации и тренда и просто переводит его в человекопонятный текст. Так мы боремся с галлюцинациями - когда ИИ начинает придумывать несуществующие тенденции.

Шаг 3. Упаковали в Lean Canvas

Чтобы было понятно и бизнесу, и разработчикам, мы описали продукт в формате Lean Canvas. Вот ключевые пункты.

Проблема и альтернативы

  • Проблема: нет простых торговых сигналов.
  • Сейчас люди сидят в Telegram-каналах (непрозрачно, ангажированно) или пытаются сами интерпретировать индикаторы.

Кому это надо

  • Розничные инвесторы - хотят простоты.
  • Брокеры - хотят повысить лояльность клиентов и снизить отток.

Уникальная ценность

Мы не просто показываем индикаторы, а выдаём один чёткий сигнал + объяснение. Без эмоций, без сложных настроек. Как персональный количественный аналитик в кармане.

Как зарабатываем

Ежемесячная/годовая лицензия для брокера - зависит от числа активных пользователей модуля.

Какие метрики мы смотрим

Для брокера:

  • рост LTV клиента
  • увеличение числа сделок на пользователя
  • снижение жалоб на «непонятные убытки»

Для пользователя:

  • % следующих рекомендациям
  • доля успешных сигналов
  • частота возврата в приложение

Для продукта:

  • точность кластеризации (коэффициент силуэта)
  • галлюцинации LLM → стремимся к нулю
  • время генерации отчёта < 2 секунд

Шаг 4. Посмотрели в будущее (и доработали архитектуру)

Мы сделали прототип в Telegram-боте, но для настоящего enterprise‑решения нужны три важных изменения.

1. Переход на Open Source LLM

Gemini - хорошо для тестов, но в российских финансовых приложениях нужны модели, которые можно поставить на свои сервера. Llama-3 и Qwen отлично подходят.

2. Отказ от Telegram

Из-за нестабильности мессенджера мы не можем тиражировать решение через бота. Делаем API для прямой интеграции в веб-терминал или мобильное приложение брокера.

3. Добавляем продуктовые метрики

  • A/B‑тестирование стратегий
  • бэктестинг с учётом комиссий
  • новостные потоки «Интерфакс»
  • макроэкономические индикаторы

Тогда конвейер станет профессиональным модулем управления рекомендациями.

Заключение

Инвестор сегодня тонет в данных. Ему нужен не ещё один график, а ответ на один вопрос: «что сейчас делает рынок и какое действие рационально предпринять?» Наш аналитический конвейер даёт этот ответ - на основе данных, а не на эмоциях. И он уже готов к тому, чтобы быть встроенным в брокерские приложения через RUDATA.
2026-05-29 18:46