

Корпоративный интеллект
Кейс
DataBotX — AI-репозиторий для предприятий
Мы сотрудничали с BK Techouse, технологической компанией из Руанды, чтобы спроектировать, разработать и внедрить корпоративный AI-репозиторий — интеллектуальную платформу для объединения данных, обеспечения безопасного доступа и взаимодействия на естественном языке через большие языковые модели (LLM).
Видение
Создать безопасное, интеллектуальное и масштабируемое корпоративное решение для данных, объединяющее информацию с разных платформ, обеспечивающее контроль доступа на уровне пользователя, защищающее персональные данные и позволяющее сотрудникам получать инсайты через AI-интерфейс, делая доступ к данным таким же простым, как чат.
Сценарий
AI-платформа для корпоративных данных: безопасный и умный доступ
BK Techouse стремилась изменить подход к работе с данными, создав централизованный репозиторий, который интеллектуально объединяет данные из разных источников. Цель — обеспечить строгий контроль доступа, автоматическую защиту персональных данных и обработку запросов с помощью LLM — всё это доступно через привычные инструменты, такие как Slack.
BK Techouse стремилась изменить подход к работе с данными, создав централизованный репозиторий, который интеллектуально объединяет данные из разных источников. Цель — обеспечить строгий контроль доступа, автоматическую защиту персональных данных и обработку запросов с помощью LLM — всё это доступно через привычные инструменты, такие как Slack.

Что мы сделали
Мы создали сквозной AI-конвейер данных, который охватывает всё — от извлечения до интеллектуального доступа, с акцентом на безопасность, соответствие и эффективность.

● Извлечение данных: Интеграция Microsoft SharePoint через Azure (Client ID, Tenant ID, Secret) для извлечения структурированных и неструктурированных корпоративных документов.
● Карта прав доступа: Хранение индивидуальных прав пользователей в Elasticsearch для динамического контроля доступа к файлам при каждом запросе.
● Маскирование PII: Автоматизированные пайплайны для обнаружения и маскировки персональных данных до индексации или хранения.
● Векторный поиск с шифрованием: Встраивание документов в FAISS-векторное хранилище с шифрованием данных по AES-256 для быстрого и безопасного семантического поиска.
● Диалоговый интерфейс через Slack: Интеграция LLM с Slack для возможности задавать вопросы и получать персонализированные ответы с учётом прав доступа прямо в чате.
● Автоматизация рабочих процессов: Использование Apache Airflow для оркестрации ежедневного обновления данных, маскирования, встраивания и индексации.
Ключевые особенности опыта
Влияние
Унифицированный доступ к данным
Корпоративная информация объединена на одной платформе, устранены изолированные хранилища и упрощён доступ пользователей.
Конфиденциальность и соответствие по умолчанию
Автоматическое обнаружение и маскирование персональных данных обеспечивает соответствие требованиям по защите информации.
AI-взаимодействие с данными
Пользователи могут работать с корпоративными данными в диалоговом режиме благодаря безопасной интеграции LLM.
Рост продуктивности
Ручной поиск заменён мгновенными ответами, что значительно повысило эффективность команд.
Масштабируемость и гибкость
Решение поддерживает более 300 корпоративных коннекторов, что обеспечивает рост и адаптацию под задачи организации.