Статьи | Secuteck.Ru

Импортозамещение и российские системы хранения и обработки данных

Written by Максим Субботин | 25/01/23

Данная статья дает понимание того, что такое системы хранения данных (СХД), каких типов они бывают, а также определяет критерии, по которым СХД можно отнести к российскому продукту.

Каждый день современный человек использует блага технологического прогресса для потребления информации. афоризм немецкого банкира Натана Ротшильда "Кто владеет информацией – тот владеет миром" стал неписаным законом крупных организаций, а некоторые построили миллиардные состояния, продавая контент.

Что такое "системы хранения данных"

Все, что мы видим, слышим, читаем и приносим в цифровой мир, характеризуется жесткими словами: показатели или характеристики. Даже текст этой статьи, представленный машиной, будет состоять, согласно таблице ASCI, из набора 0 (нулей) и 1 (единиц), записанных на материальный носитель. Совокупность информационных систем и методов организации хранения с учетом качественного подхода, выраженного посредством аппаратных компонент, смело можно назвать "системы хранения данных" (множественное число).

Сначала записать (запомнить), а впоследствии поделиться с остальными участниками рабочего процесса обращения цифровой информации может простой USB-накопитель. Основными характеристиками подобного рода устройств являются:

  • объем, измеряемый в мегабайтах/гигабайтах (сокращенно Мбайт/Гбайт, или МБ/ГБ);
  • скорость операций записи/чтения, измеряемая в единицах Мбайт/с или Гбайт/с (при использовании сокращения МБ/ГБ не путать с мегабитами/гигабитами);
  • надежность, измеряемая количеством циклов полной перезаписи;
  • стандарт подключения и использования протокола доступа к данным (USB – универсальная последовательная шина);
  • возможности стороннего программного обеспечения работать за счет протокола доступа с самими данными, реализовывая функции "компрессия", "дедупликация", "тонкое выделение объема".

Азбука объемов данных

Нужно помнить, что один символ алфавита занимает 8 бит или 1 байт, для примера: латинский символ "А" будет иметь запись 01000001.

Кадр фильма "Аватар" при показе в кинотеатрах занимает 12 Мбайт, 288 Мбайт/с, 17,28 Гбайт/мин и большой финальный размер в зависимости от хронометража киноленты. 1 килобайт = 1024 байта, 1 мегабайт = 1024 килобайта, 1 гигабайт = 1024 мегабайта, 1 терабайт = 1024 гигабайта и так далее (на основании ГОСТ 8.417–2002 п. 7.1 таблицы 8 и приложению А, таблица А1).

Все вышеупомянутые термины, определения и свойства применимы к понятию "накопитель информации" (единственное число). Операции информационной системы и ОПО/СПО (общего или специального программного обеспечения) будут являться операциями с данными – полезной работой. В свою очередь, АСВТ или ПАК (автоматизированные средства вычислительной техники или программно-аппаратные комплексы) выполняют операции с накопителями информации – системами хранения данных.

Рис. 1. Квадрат Гартнера по СХД (редакция 2021 г.)

Классификация СХД

Системы хранения данных могут быть параметризированы (классифицированы) по ряду реализованных производителями механизмов и инноваций, так как являются сложной системой обработки информации. За основу можно взять классические методы визуального представления СХД в виде квадрата Гартнера (рис. 1, маркетинговый инструмент принятия решения), или детальные выкладки SPC-1 (рис. 2, технический инструмент принятия решения), или статистическую оценку возврата по заявкам на ремонт (рис. 3, сервисный инструмент принятия решения). Третий статический способ является в чистом виде "серфингом" страниц интернета на предмет возврата комплектующих и компонент, произведенного количества и сроков эксплуатации.

Рис. 2. Тесты SPC-1 для систем хранения данных

Рис. 3. Статистическая оценка возврата по заявкам на ремонт

Отмечу, что информации по глубокому техническому анализу СХД в мире пока нет. Для примера можно ознакомиться с графиком задержек при повышении нагрузок с операциями ввода-вывода в секунду (IOPS) http://www.storageperformance.org/specifications#spc-1. Описанные производителем методы аргументированны, просты и понятны. доступ для изучения открыт для всех желающих, без регистрации и СМС.

Как вы уже заметили, мы пока не копаем в глубины зависимостей и состава систем хранения данных (множественное число), разбирая каждую особенность строения под микроскопом с хирургическим скальпелем, но шаг за шагом будем стараться приблизиться к сути.

Строение, методология и философия СХД

"С чувством, с толком и расстановкой" шагов, вооружившись базовыми понятиями, предлагаю погрузиться в глубины Кхазад-Дума (Мория из "Властелина колец"). Вначале для понимания введем параметризацию для оцениваемых продуктов в ключе российской действительности. наложим триаду безопасной ИТ-инфраструктуры (конфиденциальность, целостность, доступность) и проведем параллели с зарубежными аналогами.

Все системы хранения данных можно разделить на три больших класса:

  1. Классические, созданные на основе опыта эксплуатации прошлых десятилетий.
  2. Гибридные, построенные на основе возросшего спроса на процессы обработки случайных информационных структур.
  3. Смешанные, представляющие собой совокупность 1-го и 2-го классов СХД с зависимым влиянием друг на друга.

Тем, кто сталкивается с данной темой не первый раз, могу порекомендовать прочитать ГОСТ 16325-88 "Машины вычислительные электронные. Цифровые. Общего назначения" и ГОСТ Р 59793–2021 "Комплекс стандартов на автоматизированные системы". К сожалению, даже дополнив пазлы знаний документами ГОСТ Р МЭК 60950-23–2011 "Оборудование для хранения больших объемов данных" и ГОСТ 20886-85 "Организация данных в системах обработки данных", мы не получим в точности представления о современных способах организации подобного рода систем хранения информации. Указанные документы вводят лишь точные определения структур, которыми мы должны оперировать. В реальной жизни это не так.

Критерии разделения систем хранения данных на классы описаны в табл. 1.

Таблица 1. Критерии разделения систем хранения данных на классы

Если по первым двум критериям классификации (принцип реализации и наличие единой точки отказа в обслуживании) вопросов возникает меньше, то третий критерий (отношение аппаратных компонент к специальному программному обеспечению) требует пояснения. Приведу пример предложения на рынке вида "облачное хранение фотографий". Речь пока не идет об потребностях энтерпрайз-уровня, как было изложено выше, задача – на простых пошаговых примерах донести суть вещей. По факту, используя облачный сервис, обеспечивающий доступ к чтению/записи полезной информации конечного пользователя (где пользователем может являться информационная система, а не человек), владелец получает лишь гарантированный способ или механизм (сервис), реализующий его потребность.

Классические СХД

Классические системы хранения данных визуально зачастую можно разделить на следующие аппаратные элементы и специальное программное обеспечение (разработанное производителем):

  1. Программное обеспечение управления процессами информационного обмена, то есть все процессы:
    а) процесс чтения/записи на накопитель информации для краткосрочного/долгосрочного хранения; 
    б) процесс организации накопителей в группы (RAID или vRAID) для обеспечения отказоустойчивости структур хранения (stripe – страйпов, chunk – чанков, иных представлений); 
    с) процесс реорганизации или рекламации свободного пространства, высвобождения и замены накопителей; 
    д) процессы сложной организации (тонкое выделение пространства для записи/чтения, компрессия, дедупликация, репликация); 
    е) процессы публикации пространства хранения посредством протоколов доступа с целью реализации выполнения операций чтения/записи пользователем сервиса (SAS, ISCSI, FibreChannel, IB, CIFS, NFS, SMB, NVMeOF); 
    ж) процессы обновления микрокодов внутренних аппаратных компонент, контроль целостности записи, превентивные меры безопасности для авторизации и предупреждении о сбоях.
  2. Аппаратное обеспечение:
    а) основной вычислительный модуль, он же сервер управления дисковыми операциями, также его можно назвать контроллером системы хранения данных (прошу заметить: речь пока не ведется о контроллерах для обеспечения доступности); 
    б) выделенные накопители хранения информации (включая от некоторых производителей), содержащие операционную систему или ее часть; 
    в) выделенные накопители для хранения данных информационной системы, служебных событий, точек монтирования операционной системы для запуска процессов;
    г) адаптеры ввода-вывода, к которым можно отнести карты Ethernet, Fibre Channel, IB, SAS, выполняющие роль подключения потребителей; 
    д) прочие компоненты, к которым можно отнести блоки питания, вентиляционные модули, внутренние кабели подключения контроллеров, внутренние порты подключения накопителей и контроллеров (мезанинкарты, райзерборды, бэкплейны). Корпус шасси. 
    е) полки расширения пространства хранения*.

Я нарочно не поместил трансиверы (приемопередатчики) в состав аппаратных компонент системы хранения данных (единственное число, единый монолитный объект или корпус), а также пометил звездочкой (*) полки расширения пространства хранения ввиду того, что они могут как быть, так и не быть одномоментно частью единого комплекса.

Таблица 2. Классические российские системы хранения данных

В табл. 2 приведены два обезличенных примера СХД российских производителей. на мой взгляд, предлагаемые российскими производителями классические решения далеки от совершенства. И мы видим, что в большинстве своем они построены на импортных компонентах. Однако мы славимся серьезными программистами и разработчиками программных продуктов, а как показывает практика, сердце СХД – это СПО.

Безусловно, в последнее время критерием признания оборудования российским является членство в реестре радиоэлектронной продукции (Минпромторг). Более подробную информацию можно подчерпнуть по ссылке https://gisp.gov.ru/pprf/marketplace/#/products.

Гибридные и смешанные СХД

Тема гибридных решений и систем хранения данных смешанных типов достойна отдельной статьи, с погружением в принципы организации хранимых структур. Забегая немного вперед, скажу, что именно здесь есть полноценные российские решения.

Опубликовано в журнале "Системы безопасности" № 6/2022

Все статьи журнала "Системы безопасности"
доступны для скачивания в iMag >>

Фото обработано нейросетью