Контакты
Подписка
МЕНЮ
Контакты
Подписка

Применение технологий Big Data в банковской сфере

В рубрику "Системы контроля и управления доступом (СКУД)" | К списку рубрик  |  К списку авторов  |  К списку публикаций

НОВЫЕ ТЕХНОЛОГИИ
БОЛЬШИЕ ДАННЫЕ
БАНКИ

Применение технологий Big Data в банковской сфере

Технологии Big Data – это один из способов повысить прибыльность банковского бизнеса за счет аналитически подтвержденной корректировки стратегии продаж продуктов и смещения вектора предоставления услуг от общего к частному, в том числе кастомизированный подход к группам клиентов и своевременный учет их динамически изменяющихся потребностей
Алексей Плешков
Независимый эксперт по информационной безопасности

Технологии Big Data за прошедшие 20 лет уже кардинально изменили бизнес иностранных компаний и позволили одним игрокам рынка получить баснословные прибыли, а других заставили отказаться от бизнеса и принять предложение о слиянии с более технически развитыми и успешными конкурентами. Известный пример – бизнес по продаже мобильных смартфонов компании Apple. Еще каких-то 10–12 лет назад компания считалась потенциальным банкротом, но актуальные идеи, смелый дизайн и востребованные продукты позволили Apple стать лидером в отрасли. Но в чем тут заслуга Big Data? Создание телефона – это только малая часть успеха Apple. Суметь ежегодно его развивать, учитывать все тенденции рынка, своевременно реагировать на самые, казалось бы, незначительные изменения и внешние факторы, быть максимально близко к своему клиенту и знать о нем больше, чем многие родственники, – именно в этом состоит основа подхода Apple к ведению бизнеса и применению современных аналитических моделей на основе Big Data для прогнозирования поведения не только рынка, но и своего реального и потенциального клиента. Не могу с уверенностью сказать, что успех, подобный Apple, будет ждать все российские компании, если они вдруг обратят свое внимание на технологии Big Data, но ощутимая польза и измеримый результат для бизнеса от внедрения продуктов на основе Big Data уже неоднократно были подтверждены официальными референсами крупных отечественных, в том числе финансовых, организаций.

Три составляющих термина

Четкого определения термину Big Data в российских официальных глоссариях по состоянию на июнь 2017 г. эксперты не составили. Вероятнее всего, это связано с отсутствием единого понимания технологических особенностей Big Data у лиц, ответственных за составление нормативных/регламентирующих документов в нашей стране. Кто-то считает, что Big Data – это ситуация, когда данных для обработки у некой системы больше, чем 100 Гбайт, или больше, чем 500 Гбайт, или больше, чем 1 Тбайт, – кому что нравится. Другим обывателям представляется, что Big Data – это такие данные, которые невозможно достаточно долго обрабатывать в MS Excel или в любой реляционной базе данных. А может быть, что Big Data – это такие данные, которые сложно считать и избыточно хранить на компьютере, и для этого нужен целый сервер или два, или стойка серверов. Позиция руководящего состава отечественных компаний сводится к тому, что Big Data – это любые данные, которые обрабатываются внутри их организации.

Скептики вообще не склонны к определению термина Big Data и считают его очередной маркетинговой уловкой, которую придумали на Западе маркетологи, чтобы больше продавать свои продукты технически неграмотным потребителям в России. В известных мне теоретических изысканиях под термином Big Data авторы понимают серию подходов, инструментов и методов обработки структурированных и неструктурированных данных значительного объема и многообразия. С позиций практика я определил для себя термин Big Data как сочетание и объединение (в математическом плане) трех обязательных составляющих:

  1. в первую очередь данных большого или иного объема – неважно, так как информации много не бывает и аналитическая модель и гипотезы могут строиться с определенной долей вероятности;
  2. затем в определении термина Big Data необходимо упомянуть технологии хранения, предоставления оперативного доступа и обработки имеющихся данных, поскольку, даже при наличии штата высококлассных специалистов-аналитиков перешерстить терабайты информации в ручном режиме достаточно проблематично;
  3. третьей составляющей в Big Data выступает аналитика, а именно: составление (программирование) моделей данных, сценариев и фильтров обработки выстраивание прототипов, моделирование признаков и закономерностей.

Только при наличии этих трех компонентов, их имплементации во внутренние и внешние процессы организации можно начинать говорить о применении Big Data.

Использование инструментов и аналитических моделей Big Data позволило существенно упростить такие процессы, как построение стратегии защиты от мошенничества, прогнозирование снижения спроса, оценка влияния на продажи внешних экономических факторов или организация программ лояльности и другие

В чем ценность технической информации?

Не секрет, что в банковском бизнесе все основные процессы частично или полностью оцифрованы. Информация в формате потоков данных непрерывно циркулирует между внутренними и доступными для клиентов извне подсистемами, обрабатывается и видоизменяется в конечных точках (рабочие места операторов, терминалы, серверы), консолидируется и учитывается при принятии решений (автоматически или с участием того же оператора), хранится в удобном для доступа месте и формате до истечения установленных сроков. Каждый шаг при передаче или обработке этой информации фиксируется в журналах регистрации событий соответствующих банковских или иных наложенных контрольных систем. В автоматическом режиме с согласия клиентов и операторов в целях повышения качества обслуживания системы собирают вспомогательную информацию и метаданные, что в конечном итоге формирует дополнительные потоки технической (не бизнес) информации. До сравнительно недавнего времени эта информация не представляла для отечественных банкиров особого интереса и уничтожалась (перезаписывалась) по мере устаревания. О накоплении не бизнес-информации речи не шло, поскольку хранить метаданные – это дорогое и ранее нерентабельное удовольствие. Однако с приходом в банковский сектор России технологий Big Data именно эти метаданные стали представлять особый интерес для бизнес-аналитиков, риск-менеджеров, маркетологов и иных банкиров. Банки стали прозрачно для клиентов в разы больше собирать и обрабатывать на своей стороне (или в облачных порталах) технические метаданные. Использование инструментов и аналитических моделей Big Data позволило существенно упростить такие процессы, как, например, построение стратегии защиты от мошенничества, прогнозирование снижения спроса, оценка влияния на продажи внешних экономических факторов или организация программ лояльности, или проведение акционных программ по наиболее привлекательным для определенной категории клиентов банковским продуктам.

Какие задачи решают технологии Big Data?

Областью моей профессиональной деятельности является комплексное обеспечение информационной безопасности автоматизированных систем. Поэтому приведу несколько примеров решения актуальных задач с использованием технологий Big Data в контексте защиты информации и противодействия высокотехнологическому мошенничеству:

  • сбор и анализ информации об аномалиях во внутренней сети в режиме, приближенном к реальному времени, на основе технических данных оборудования канального и сетевого уровня модели OSI;
  • противодействие мошенничеству в отношении держателей пластиковых банковских карт;
  • контроль и оценка эффективности работы системы обеспечения информационной безопасности с использованием опробованных в смежных организациях аналитических моделей;
  • категоризация работников в соответствии с моделью внутреннего нарушителя и динамическое перераспределение на основе дополнительно полученной информации;
  • оценка рисков информационной безопасности (автоматическое заполнение скоринговых карт по методикам аудиторов или риск-менеджеров).
Сбербанку, как крупнейшему розничному банку в стране, доступны атомарные транзакции всех своих клиентов (как физических, так и юридических лиц), поэтому Big Data от Сбербанка предполагает возможность аналитической обработки и любой группировки сегментов клиентов: по доходам, оборотам, отраслям и т.д. (без указания персональных данных клиентов)

Big Data от Сбербанка

Наглядным примером, иллюстрирующим применение крупными российскими банками технологий Big Data, является проект "Открытые данные Сбербанка" (первоисточник доступен в Интернете по ссылке http://www.sberbank.com/ru/opendata). В сравнении с официальной статистикой, предлагаемой аналитическими агентствами на коммерческой основе и подразделениями Центрального банка ежеквартально, опубликованные в проекте данные позволяют отслеживать ежедневную динамику по многим показателям, предлагают аналитикам детализацию при построении моделей с точностью до города или поселка, во многих случаях до адреса дома или квартиры. Сбербанку, как крупнейшему розничному банку в стране, доступны атомарные транзакции всех своих клиентов (как физических, так и юридических лиц), поэтому Big Data от Сбербанка предполагает возможность аналитической обработки и любой группировки сегментов клиентов: по доходам, оборотам, отраслям и т.д. (без указания персональных данных клиентов).

По состоянию на март 2017 г. уже реализованы интерфейсы для предоставления по запросу следующих рафинированных аналитических отчетов:

  • выручка юридических лиц в разрезе отраслей и регионов;
  • уровень доходов населения – зарплаты, пенсии, стипендии, пособия;
  • склонность к сбережениям и потреблению;
  • уровень закредитованности в разных регионах;
  • мобильность населения внутри страны и за рубежом;
  • доля расходов на еду, ЖКХ, транспорт и другие статьи.

По информации с сайта компании, проект "Большие данные" Сбербанка – это информация о значительной части экономических процессов, происходящих в стране. Впервые эти данные становятся доступны всем желающим по запросу и в консолидированном (рафинированном виде). По тем интерфейсам и атомарной информации, которые Сбербанк разместил в общем доступе, аналитикам остается только догадываться о масштабах применения технологий Big Data в одном из крупнейших банков России.

Сдерживающие факторы развития технологии

Основными факторами, препятствующими массовому применению технологий Big Data в отечественных компаниях, являются:

  1. Высокая стоимость владения и эксплуатации инфраструктуры Big Datа на каждом из этапов, в том числе:
    • аналитическая обработка;
    • нормализация/фильтрация;
    • хранение/предоставление доступа;
    • формализация нечетких задач;
    • создание и корректировка моделей;
    • исследование неявных зависимостей;
    • визуализация результатов;
    • прогнозирование изменений в динамике;
    • прочее.
  2. Сложность технической реализации процесса гарантированного хранения информации из внешних и внутренних источников на протяжении долгого времени.
  3. Критичные требования по производительности и отказоустойчивости источников, агрегаторов, серверов приложений, аналитических и графических модулей и пр.
  4. Нечеткая постановка задачи и негарантированность результатов от применения технологий Big Data для заказчика.
  5. Высокая персональная зависимость, поскольку квалифицированных аналитиков с техническим опытом в настоящее время на HR-рынке найти достаточно сложно и еще сложнее удержать, а развитие аналитических моделей, созданных другими, сравнимо по трудоемкости с повторным созданием модели с нуля.
  6. Комплаенс-риски в контексте территориальных и трансграничных вопросов передачи и хранения данных.
Поскольку большинство банковских клиент-ориентированных систем призваны обеспечить высокий уровень доступности сервиса для клиентов (работают в режиме реального времени), размер файлов с технической информацией на несколько порядков превышает объемы хранимой бизнес-информации

Big Data как средство снижения издержек

Довольно сложно оценивать экономическую эффективность банковской деятельности, не обладая информацией о всех взаимосвязанных факторах, способных оказать прямое и потенциальное воздействие как в плюс, так и в минус на бизнес-результат. Так или иначе, технологии и инструменты Big Data – это средства, внедрение которых в любой организации должно повлечь снижение издержек при выполнении тех операций, которые ранее считались затратными по времени. Наличие в финансовой организации конвейерной обработки заявок, отлаженных скоринговых карт, типовых опробованных сценариев проверки и динамически изменяющихся алгоритмов принятия решения по стандартным запросам при возрастающих объемах поступающих документов нацелено на высвобождение человеческих ресурсов из процесса, который до внедрения Big Data требовал постоянного участия оператора и был сопряжен с большим количеством технических ошибок.

Опубликовано: Каталог "СКУД. Антитерроризм"-2017
Посещений: 10455

  Автор

Алексей Плешков

Алексей Плешков

Независимый эксперт по информационной безопасности

Всего статей:  3

В рубрику "Системы контроля и управления доступом (СКУД)" | К списку рубрик  |  К списку авторов  |  К списку публикаций