31/07/2024
При проектировании систем резервного копирования не редко приходится просчитывать специализированные дисковые аплаинсы от Dell – Data Domain. Несколько лет назад производитель в целях маркетинга поменял имя продукта на PowerPortect DD, но технической сути это нисколько не изменило. В моей личной практике работы IT архитектором приходилось несколько раз сталкиваться с подбором конкретного решения исходя из имеющихся входных данных. Данный процесс не является полностью прозрачным. С моей точки зрения нужно знание определенных нюансов, которые позволят выбрать правильный продукт, а также понимать техническую спецификацию. Опустим за рамками этой статьи выполнение сайзинга Data Domain, что является отдельной большой темой. Предположим, мы знаем сколько нам нужно полезного Usable пространства на Data Domain, давайте посчитаем сколько это будет в цифрах спецификации вендора.
Детали расчета Data Domain
Итак, первым делом определимся с термином Usable space или Usable пространство. Обычно этим термином обозначают полезное место для хранения данных на Data Domain аплаинсе без учета сжатия и дедупликации. То есть, это то дисковое прострнаство для записи данных на Data Domain, которое доступно после форматирования и создания файловой системы на нем. Надо понимать, что уровень сжатия и дедупликации очень сильно может варьироваться в зависимости от типа данных, а также политик резервного копирования, которые будут использоваться в организации. Базой для определения Usable Space является процедура сайзинга, которая подсчитывает необходимое дисковое пространство для хранения требуемых резервных копий.
После того, как будет определен необходимый объем дискового места для хранения бекапов, рекомендуется заложить 25 процентный резерв свободного места для потенциального роста, а также возможному несоответствию источников бекапа выбранным коэффициентам дедупликации. Вдобавок это позволит проводить в будущем ряд модификаций в политиках резервного копирования без страха упереться сразу же в лимит дискового пространства на Data Domain.
Кроме этого, нужно учитывать специфику файловой системы, которая используется на аплаинсах Data Domain. С учетом того, что все файлы разбиваются на отдельные куски разной длины и используются хеш сумы для данных частей файлов, то я обычно закладываю в расчет дополнительные 3 процента дисковой емкости для учета хранения мета данных. Это своеобразная плата, которую надо отдать для использования функций дедупликации на Data Domain.
Следующим важным моментом при расчетах является понимание различия в Терабайтах (TB) и Тебибайтах (TiB). Зачастую эти понятия у пользователей систем и у производителей связанных с хранением информации кардинально отличаются. Здесь нужно понимать, что практически все вендоры считают и лицензируют емкость дискового пространства в десятичном исчислении. То есть, 1 TB = 1 000 GB = 1 000 000 MB. Однако, пользователи дисковых систем в большинстве своем считают объем в двоичном исчислении. То есть в понимании конечных пользователей дисковых систем 1 Терабайт = 1024 Гигабайт или 1024*1024 Мегабайт. Для урегулирования этого непонимания принято использовать специальное обозначение объема данных в двоичном выражении – TiB (Тибибайт), GiB (Гибибайт) и MiB (Мебибайт). То есть, зная необходимое полезное пространство в TiB мы можем перевести эти данные в вендорские десятичные TB, которые используются у Dell для лицензирования PowerProtect DD.
Формула перевода TiB в TB выглядит следующим образом:
TB = 1.099512 * TiB
Аналогичная формула для обратного перевода TB в TiB будет выглядеть так:
TiB = 0.9094947 * TB
После того, как мы перевели двоичные TiB в десятичные TB мы можем посчитать реальные TB лицензируемой емкости на Data Domain, которые нам нужны. Для этого нужно понимать, что компания Dell лицензирует все дисковое пространство на Data Domain, которое будет задействовано на физическом уровне. Сюда входит и дисковое пространство, которое используется под контрольные суммы RAID, а также Hot Spare. Ориентировочно, 20 процентов от общей физической дисковой емкости используется для такой служебной информации. То есть, полученную ранее цифру в TB мы должны разделить на 0.8 (или умножить на 1.25), чтобы получить полную физическую дисковую емкость, которая нам необходима на Data Domain.
После всех проведенных манипуляций необходимо учесть еще 2 момента. Во-первых, это то, что лицензирование дисковой емкости на аппаратных аплаинсах PowerPortect DD (Data Domain) идет с 15 TB шагом. Таким образом, вычислив нужную физическую дисковую емкость, ее нужно будет округлить в верхнюю сторону до ближайшего числа, делящегося на 15. Во-вторых, нужно учитывать максимальный дисковый объем, поддерживыемый конкретной моделью PowerProtect DD, а также необходимый потенциал для расширения в будущем. Бывают случаи, когда приходится выбирать более старшую модель в линейке PowerProtect DD исходя из потенциального роста данных в перспективе.
Дополнительное замечание касается частого отличия лицензируемого дискового пространства на Data Domain и суммарной емкости всех поставляемых физических дисков в системе. Это обсуловлено тем, что физические диски компануются комплектами по 15 штук. Это приводит к тому, что цифра лицензируемого дискового пространства оказывается меньше общей емкости всех дисков, за редким исключениям когда эти цифры полностью сходятся. Такова специфика поставки данных систем хранения, про которую лучше знать, если Вы сталкиваетесь с ними.
Заключение
Выбор и расчет аппаратных устройств для хранения данных резервного копирования Dell Data Domain (Dell PowerProtect DD) требует знания и понимания определенных алгоритмов и методов расчета. К сожалению, этот процесс не является прозрачным для новичков или непосвященных в эту тематику. В этой статье постарался изложить свой личный профессиональный опыт в просчете и подборе данного типа оборудования.