Что такое система хранения данных?
Постоянно растущий объем данных – одна из реалий современного мира. Сегодня речь идет уже о сотнях зеттабайт информации, которые создаются, обрабатываются и хранятся в информационных инфраструктурах всех стран мира.
С постоянным приростом объема данных сталкиваются любые компании. Там, где несколько лет назад хранились пара терабайт данных, в наши дни требуются емкости объемом в несколько десятков терабайт. И эти потребности будут только увеличиваться.
Долгое время с хранением и обработкой данных справлялись сервера. Но постоянный рост объемов информации привел к появлению специализированных устройств – систем хранения данных (СХД). Серверные мощности стали слишком дороги для того, чтобы тратить их для организации хранилищ, – собственные накопители нужны серверам для решения основной задачи, обеспечения работы информационных систем.
Роль СХД в современных инфраструктурах – хранение данных и обеспечение доступа к ним подключенных устройств и информационных систем, которые на них работают. Даже небольшой интернет-магазин, к примеру, должен обеспечить доступ к данным для своего веб-сайта, CRM-системы, платежного шлюза, системы управления логистикой, специализированных приложений для решения отдельных задач (управление товарной матрицей, закупками, программами лояльности и т.п.). И каждая из этих систем имеет свои собственные требования к данным, порядку их хранения, доступности, консистентности.
Решить эти задачи можно только с использованием специализированных устройств – СХД. Они не только способны хранить значительные объемы информации, но и оснащены специальным ПО, которое позволяет грамотно управлять данными.
Как устроены СХД
В составе любой системы хранения данных всегда имеются несколько обязательных элементов. Первый – массив накопителей, в роли которых могут использоваться современные твердотельные диски SSD или «классические» HDD. Отдельные СХД могут работать и на флеш-памяти, не исключено и применение ленточных накопителей.
Управляется дисковый массив контроллером, который имеет оперативную и кэш-память, а подключение контроллера к дискам и самой СХД к внешним устройствам обеспечивается набором интерфейсов.
В большинстве случаев все эти комплектующие устанавливаются в общий корпус. Это могут быть одно- и двухдиновые корпуса, монтируемые в стойку, или отдельно стоящие Tower.
Важную роль в СХД играет еще один компонент системы – программное обеспечение. Именно оно отвечает за организацию работы накопителей, создание из них дисковых массивов и логических томов, взаимодействие СХД с внешними устройствами и облачными средами.
Более того, современные программные решения дают возможность «строить» и программно-определяемые СХД, в которых конфигурация системы целиком и полностью зависит от настроек ПО.
DAS, NAS и SAN
Эти загадочные аббревиатуры – три типа систем хранения данных, которые отличаются по способу подключения и взаимодействия с внешними устройствами.
Хранилища с прямым подключением, DAS (Direct Attached Storage) уместно сравнить с обычным внешним диском или даже картой памяти. Правда, в DAS может использоваться множество носителей, вплоть до нескольких десятков накопителей разных типов. Роль таких устройств ограничена только хранением информации.
Всю работу с нею выполняют внешние устройства, которые подключаются к DAS, – сервера или даже рабочие станции пользователей. Возможности подключения к DAS ограничены числом внешних интерфейсов. Зато DAS легко развернуть, а администрирование таких СХД отличается простотой и не требует специальной подготовки. Иными словами, достаточно подключить DAS к питанию и соединить его интерфейсным кабелем с внешним устройством.
Основное назначение DAS – организация файлового хранилища, доступ к которому осуществляется через корпоративный сервер. Еще одна схема использования такого устройства – подключение к рабочей станции сотрудника, ответственного за дизайн.
В этом случае DAS используется как хранилище объемных мультимедийных материалов, которые используются, в том числе, и при создании сайтов интернет-магазинов.
Возможности использования СХД, подключаемых к сети (NAS, Network Attached System) гораздо шире. Такие системы дают возможность использования их в качестве централизованного хранилища, доступного для множества устройств (их число ограничено только возможностями самого NAS и сети передачи данных). Это дает возможность использовать их в составе комплексов, обеспечивающих работу нескольких информационных систем, бизнес-приложений и корпоративных сервисов.
Кроме того, NAS оснащены достаточно производительными контроллерами, которые позволяют им выполнять отдельные серверные функции, такие как резервное копирование данных, синхронизация файлов или обеспечение видеонаблюдения. При этом и хранение данных, и их обработка выполняются самим устройством, без участия подключенного сервера.
Системы хранения типа SAN (Storage Area Network) – целые комплексы, в которые объединяются несколько СХД, причем в составе одной SAN могут использоваться как NAS, так и DAS-устройства. Они связаны между собой по сети, а роль общего контроллера выполняет сервер, который обеспечивает доступ к SAN для других узлов инфраструктуры. При этом воспринимаются SAN подключаемыми устройствами как единый массив, логика которого определяется на уровне управляющего сервера.
Такая система легко масштабируется и может использоваться для организации масштабных хранилищ, обслуживающих всю инфраструктуру предприятия. Широко применяются SAN и в облачных средах, как частных, так и публичных. Решающую роль в организации SAN играет специализированный софт, предназначенный для создания программно-определяемых хранилищ.
Файлы, блоки и объекты
Классифицируются системы хранения данных и по принципу работы, который в них реализован.
Файловые СХД представляют собой классическую иерархию каталогов из папок и вложенных файлов. Такие системы наиболее применимы для создания хранилищ, к которым не требуется постоянный доступ информационных систем. Здесь хранятся архивные данные, которые не нужны в повседневной работе, но представляют историческую и аналитическую ценность.
СХД блочного типа хранит данные, разделенные на отдельные логические блоки, которые формируются и управляются при помощи специального программного обеспечения. Именно такие системы применимы для создания виртуальных инфраструктур или информационных кластеров.
Работу кластерных систем обеспечивают и объектные СХД. Их структура похожа на структуру баз данных: данные группируются на основе метаданных и идентификаторов в едином пространстве. Такие СХД применимы для обеспечения работы серьезных корпоративных систем, хранения и организации доступа к объемным базам данных. На основе объектных СХД формируются и массивы больших данных, которые сочетают структурированную и неструктурированную информацию.
Как выбрать СХД
Широкая типология систем хранения данных усложняет их выбор. Основными его факторами становятся, конечно, потребности бизнеса. Но важную роль играют и экономические соображения, когда во внимание принимается стоимость оборудования и ПО, а также совокупная стоимость владения.
В тех случаях, когда СХД необходим организации только для хранения архивной информации, оправданным будет приобретение недорогих DAS и NAS начального уровня. Основным критерием выбора в таком случае станут потенциальная емкость хранилища и возможность подключения к нему необходимого числа устройств.
Чаще всего такой выбор доступен только небольшим компаниям, которым необходима система хранения данных для небольших информационных систем и сервисов. Приобрести отдельное хранилище может и средняя компания, – для того, чтобы использовать его для нужд небольших автономных рабочих групп, например, коллектива дизайнеров.
Чаще всего СХД приобретаются для последующего использования в составе обширной инфраструктуры. В них работают серьезные информационные системы (такие, как ERP или веб-сервис торговой площадки), требовательные к производительности систем и скорости обработки данных. Такие СХД не только дорого стоят, но и требуют серьезных затрат на поддержку оборудования и ПО, а также их администрирование.
Более того, организация, в работе которой активно генерируются новые данные (а к таким относится любая компания сегмента электронной коммерции), рано или поздно столкнется с необходимостью объединения нескольких СХД в SAN, что потребует от компании дополнительных (и значительных) инвестиций.
Поэтому оптимальным решением для компаний, не готовых к значительным капитальным затратам на организацию хранения данных, станет использование СХД в составе облачной инфраструктуры. Услуга IaaS (Infrastructure as a Service) позволит без значительных затрат получить СХД необходимой производительности и емкости, с широкими возможностями масштабирования и администрирования.
При этом организация будет оплачивать только те ресурсы, которая она в действительности потребляет, а затраты на инфраструктуру будут не капитальными, а операционными.
Еще одно преимущество IaaS – возможность использования компетенций поставщика услуги. Так, специалисты компании Rusonyx помогут выбрать оптимальную конфигурацию СХД в зависимости от потребностей компании, определят необходимый тип системы (или типы нескольких систем) в соответствии с требованиями используемых информационных систем.
Это особенно для компаний сегмента e-commerce, которые как правило используют несколько отдельных сервисов, отличающихся, в том числе, требованиями к составу, способу хранения и скорости обработки данных.
При этом Rusonyx возьмет на себя все заботы, связанные с поддержкой оборудования и обеспечением его постоянной доступности, особенно актуальной для участников рынка электронной коммерции.