Сегодня хочу рассказать про один наш ML-проект с командой из студентов Финансового университета. Мы разработали аналитический конвейер для инвесторов. Звучит сложно? Сейчас объясню простыми словами.
Шаг 0. Проработка проблемы
Мы поговорили с обычными людьми, которые торгуют акциями через брокерские приложения. Выяснили, что «данных - море, а понятных сигналов «покупать / продавать / держать» - ноль». Люди тонут в графиках, новостях, отчётах. Чтобы понять, что делать с акцией прямо сейчас, нужно или матобразование, или опыт трейдера, или своя программа. А если всего этого нет - человек либо паникует, либо слепо верит телеграм-каналам. И теряет деньги.
Нам стало интересно: а можно сделать такой сервис, который сам переведёт биржевой шум на человеческий язык? Спойлер: да, можно. И вот как мы это сделали.
Шаг 1. Определили, откуда брать данные
Мы взяли платформу RUDATA «Интерфакс», что было ожидаемо, так как я - product в этом проекте по своему основному месту работы. Итак, RUDATA - это «золотой источник», 5,5 терабайт проверенной информации, 46 000 инструментов. Там есть всё: котировки, корпоративные события, отчётность, рейтинги, а главное - удобный REST API, который легко встроить в брокерское приложение.
Шаг 2. Спроектировали «конвейер» из 6 модулей
Мы не стали делать очередного торгового робота. Наша цель - дать чёткий сигнал + простое объяснение. Вот как это работает:
Модуль 1. Загрузка данных. Пользователь вводит тикер (например, SBER) или идентификатор ISIN. Если бумага российская - идём в RUDATA. Если иностранная - подключаем Yahoo Finance. Всё само, без лишних движений.
Модуль 2. Считаем технические индикаторы. Скользящие средние, RSI, полосы Боллинджера - база, но без неё никуда.
Модуль 3. Ищем свечные паттерны. Детектор «Молот» и «Бычье поглощение». Пользователь видит не просто текст, а метку на графике. Доверие растёт.
Модуль 4. Кластеризуем рыночные режимы (K‑means). Обучаем алгоритм определять 4 состояния:
Модуль 5. Размечаем тренд методом LOWESS. Это наш любимый инструмент. Вместо субъективных «глазомерных» линий - автоматическое сглаживание и раскраска графика:
Брокеры, берите на заметку - готовый UI-компонент.
Модуль 6. Генерируем текст (через LLM). Сначала мы использовали Gemini, но для реального внедрения в России переходим на Open Source модели (Llama-3, Qwen). Они работают on‑premise - безопасно и по комплаенсу.
Важный момент: LLM не трогает рыночные данные напрямую. Она получает уже готовый результат кластеризации и тренда и просто переводит его в человекопонятный текст. Так мы боремся с галлюцинациями - когда ИИ начинает придумывать несуществующие тенденции.
Шаг 3. Упаковали в Lean Canvas
Чтобы было понятно и бизнесу, и разработчикам, мы описали продукт в формате Lean Canvas. Вот ключевые пункты.
Проблема и альтернативы
Кому это надо
Уникальная ценность
Мы не просто показываем индикаторы, а выдаём один чёткий сигнал + объяснение. Без эмоций, без сложных настроек. Как персональный количественный аналитик в кармане.
Как зарабатываем
Ежемесячная/годовая лицензия для брокера - зависит от числа активных пользователей модуля.
Какие метрики мы смотрим
Для брокера:
Для пользователя:
Для продукта:
Шаг 4. Посмотрели в будущее (и доработали архитектуру)
Мы сделали прототип в Telegram-боте, но для настоящего enterprise‑решения нужны три важных изменения.
1. Переход на Open Source LLM
Gemini - хорошо для тестов, но в российских финансовых приложениях нужны модели, которые можно поставить на свои сервера. Llama-3 и Qwen отлично подходят.
2. Отказ от Telegram
Из-за нестабильности мессенджера мы не можем тиражировать решение через бота. Делаем API для прямой интеграции в веб-терминал или мобильное приложение брокера.
3. Добавляем продуктовые метрики
Тогда конвейер станет профессиональным модулем управления рекомендациями.
Заключение
Инвестор сегодня тонет в данных. Ему нужен не ещё один график, а ответ на один вопрос: «что сейчас делает рынок и какое действие рационально предпринять?» Наш аналитический конвейер даёт этот ответ - на основе данных, а не на эмоциях. И он уже готов к тому, чтобы быть встроенным в брокерские приложения через RUDATA.
Шаг 0. Проработка проблемы
Мы поговорили с обычными людьми, которые торгуют акциями через брокерские приложения. Выяснили, что «данных - море, а понятных сигналов «покупать / продавать / держать» - ноль». Люди тонут в графиках, новостях, отчётах. Чтобы понять, что делать с акцией прямо сейчас, нужно или матобразование, или опыт трейдера, или своя программа. А если всего этого нет - человек либо паникует, либо слепо верит телеграм-каналам. И теряет деньги.
Нам стало интересно: а можно сделать такой сервис, который сам переведёт биржевой шум на человеческий язык? Спойлер: да, можно. И вот как мы это сделали.
Шаг 1. Определили, откуда брать данные
Мы взяли платформу RUDATA «Интерфакс», что было ожидаемо, так как я - product в этом проекте по своему основному месту работы. Итак, RUDATA - это «золотой источник», 5,5 терабайт проверенной информации, 46 000 инструментов. Там есть всё: котировки, корпоративные события, отчётность, рейтинги, а главное - удобный REST API, который легко встроить в брокерское приложение.
Шаг 2. Спроектировали «конвейер» из 6 модулей
Мы не стали делать очередного торгового робота. Наша цель - дать чёткий сигнал + простое объяснение. Вот как это работает:
Модуль 1. Загрузка данных. Пользователь вводит тикер (например, SBER) или идентификатор ISIN. Если бумага российская - идём в RUDATA. Если иностранная - подключаем Yahoo Finance. Всё само, без лишних движений.
Модуль 2. Считаем технические индикаторы. Скользящие средние, RSI, полосы Боллинджера - база, но без неё никуда.
Модуль 3. Ищем свечные паттерны. Детектор «Молот» и «Бычье поглощение». Пользователь видит не просто текст, а метку на графике. Доверие растёт.
Модуль 4. Кластеризуем рыночные режимы (K‑means). Обучаем алгоритм определять 4 состояния:
- сильный рост
- сильное падение
- спокойный флэт
- волатильный флэт
Модуль 5. Размечаем тренд методом LOWESS. Это наш любимый инструмент. Вместо субъективных «глазомерных» линий - автоматическое сглаживание и раскраска графика:
- зелёный = рост
- красный = падение
- серый = флэт
Брокеры, берите на заметку - готовый UI-компонент.
Модуль 6. Генерируем текст (через LLM). Сначала мы использовали Gemini, но для реального внедрения в России переходим на Open Source модели (Llama-3, Qwen). Они работают on‑premise - безопасно и по комплаенсу.
Важный момент: LLM не трогает рыночные данные напрямую. Она получает уже готовый результат кластеризации и тренда и просто переводит его в человекопонятный текст. Так мы боремся с галлюцинациями - когда ИИ начинает придумывать несуществующие тенденции.
Шаг 3. Упаковали в Lean Canvas
Чтобы было понятно и бизнесу, и разработчикам, мы описали продукт в формате Lean Canvas. Вот ключевые пункты.
Проблема и альтернативы
- Проблема: нет простых торговых сигналов.
- Сейчас люди сидят в Telegram-каналах (непрозрачно, ангажированно) или пытаются сами интерпретировать индикаторы.
Кому это надо
- Розничные инвесторы - хотят простоты.
- Брокеры - хотят повысить лояльность клиентов и снизить отток.
Уникальная ценность
Мы не просто показываем индикаторы, а выдаём один чёткий сигнал + объяснение. Без эмоций, без сложных настроек. Как персональный количественный аналитик в кармане.
Как зарабатываем
Ежемесячная/годовая лицензия для брокера - зависит от числа активных пользователей модуля.
Какие метрики мы смотрим
Для брокера:
- рост LTV клиента
- увеличение числа сделок на пользователя
- снижение жалоб на «непонятные убытки»
Для пользователя:
- % следующих рекомендациям
- доля успешных сигналов
- частота возврата в приложение
Для продукта:
- точность кластеризации (коэффициент силуэта)
- галлюцинации LLM → стремимся к нулю
- время генерации отчёта < 2 секунд
Шаг 4. Посмотрели в будущее (и доработали архитектуру)
Мы сделали прототип в Telegram-боте, но для настоящего enterprise‑решения нужны три важных изменения.
1. Переход на Open Source LLM
Gemini - хорошо для тестов, но в российских финансовых приложениях нужны модели, которые можно поставить на свои сервера. Llama-3 и Qwen отлично подходят.
2. Отказ от Telegram
Из-за нестабильности мессенджера мы не можем тиражировать решение через бота. Делаем API для прямой интеграции в веб-терминал или мобильное приложение брокера.
3. Добавляем продуктовые метрики
- A/B‑тестирование стратегий
- бэктестинг с учётом комиссий
- новостные потоки «Интерфакс»
- макроэкономические индикаторы
Тогда конвейер станет профессиональным модулем управления рекомендациями.
Заключение
Инвестор сегодня тонет в данных. Ему нужен не ещё один график, а ответ на один вопрос: «что сейчас делает рынок и какое действие рационально предпринять?» Наш аналитический конвейер даёт этот ответ - на основе данных, а не на эмоциях. И он уже готов к тому, чтобы быть встроенным в брокерские приложения через RUDATA.
