Data Mesh и Microservice: плюсы и минусы каждого подхода

Изображение: ShutterstockAI

Какое отношение Data Mesh имеет к микросервисам, в чем плюсы и особенности подхода?

О востребованности и даже моде на микросервисную архитектуру сказано довольно много. Подход показал себя по-настоящему эффективным при разработке больших ИТ-систем и скромных приложений. Сегодня все чаще заходит речь о закономерном продолжении тренда в мире хранилищ данных. Какое отношение Data Mesh имеет к микросервисам, в чем плюсы и особенности подхода?

Что такое микросервисная архитектура?

Термин Microservice Architecture (микросервисная архитектура, или МСА) описывает способ дизайна приложений в виде набора независимо развертываемых сервисов. Единого точного описания нет, но существует набор общих характеристик: организация сервисов вокруг бизнес-потребностей, модульность, автоматическое развертывание, использование шины данных для обмена и децентрализованный контроль над данными, симметричная архитектура: микросервисы взаимодействуют друг с другом однорангово, а не иерархически.

Монолитные приложения могут быть успешными, но их распространенность заметно падает, особенно в свете популярности облачного развертывания. Любые изменения, даже самые небольшие, требуют пересборки всего монолита. С течением времени становится труднее сохранять хорошую модульную структуру, изменения логики одного модуля влияют на код других. Масштабировать приходится все приложение целиком, даже если это требуется только для одного его модуля.

В целом принципы MCA выросли не на пустом месте. Их можно назвать обобщением накопленного опыта из не-ИТ-сфер. Вот яркие примеры.

Продуктовое/иерархическое управление — как проекция симметричной архитектуры MCA.
Корпорация/франшиза — как пример модульности, делегирования обязанностей и прав на локальный уровень.
Унитарное государство/федерация — как система контрактов внутри сервисного и межсервисного взаимодействия.

MCА в мире хранилищ данных: Data Mesh

Так же, как и другие области ИТ, хранилища данных (ХД) не обошли стороной этап, основанный на принципах построения на базе монолитных архитектур. При появлении в компаниях средних и больших данных монолитное ХД как концепция начинает сбоить и приводит к удорожанию и/или усложнению подобных систем по экспоненте. Логичным этапом эволюции архитектурной мысли стала «адаптация» микросервисной архитектуры под мир хранилищ данных.

Сформулируем общеизвестные принципы Data Mesh.

Децентрализованная архитектура с учетом доменов. Вместо централизованного подхода к управлению данными Data Mesh предлагает организовать ответственность за данные вокруг бизнес-функций или доменов. Это позволяет более эффективно управлять данными в сложных и масштабных средах.
Данные как продукт. Data Mesh рассматривает данные как продукт, который предоставляется пользователям. Это подразумевает, что данные на доменном уровне должны быть высококачественными, документированными и доступными через самообслуживание.
Самообслуживаемая инфраструктура данных. Data Mesh предполагает создание платформы для самообслуживания, где пользователи могут легко находить и использовать данные — без необходимости обращения к централизованным командам. Реализуется через наборы сервисов, именуемые платформой данных.
Федеративные инструменты управления. Data Mesh включает фиксированные политики, которые регулируют доступ к данным и их использование. Это позволяет обеспечить согласованность, прозрачность и безопасность. Реализуется через системы управления данными.

При внимательном взгляде на Data Mesh становится понятно, что это скорее процесс, чем технологический стек или стиль реализации. Другими словами, Data Mesh — это архитектурный подход, при котором ответственность за конкретные наборы данных делегируется тем областям бизнеса, где имеется в них наибольший опыт. Это аналогично децентрализованному управлению данными, которое пропагандируется микросервисами.

И MCA, и Data Mesh придуманы в компании Thoughtworks. Оба подхода исповедуют общие базовые принципы. Иными словами, Data Mesh делает для хранилищ данных то же, что микросервисы сделали для архитектуры решений, — использует распределенную архитектуру и децентрализованное управление.

Учитывая такое внимание к процессам и управлению, Data Mesh не определяется через Data WareHouse, Data Lake или LakeHouse. А также не определяется инструментами, используемыми для запросов, интеграции или каталогизации. Это скорее подход к проектированию данных. Микросервисная архитектура расширяет возможности команд, позволяя им самим решать, как лучше всего реализовать свой сервис. Data Mesh обещает аналогичные свободы, где детали реализации любых конвейеров или процессов имеют второстепенное значение. В мире ячеек данных важны наборы данных и способ их представления.

В обоих случаях ожидается, что команды будут использовать общую инфраструктуру, чтобы организация могла достичь экономии за счет масштаба. Для Data Mesh речь идет в первую очередь о платформе данных самообслуживания, где команда владельцев продуктов и команда платформы совместно задают «векторы движения». При этом грань между инфраструктурой самообслуживания и централизованным внедрением очень тонка. Если настаивать на конкретном стеке технологий и наборе инструментов, инженерные команды могут почувствовать, что их ограничивают, подрывают их чувство собственности. Доведение платформы и связанных с ней стандартов до уровня, когда становится возможным истинное самообслуживание, — непростая организационная задача.

Еще одним местом энтропии является беспорядок между ограниченными контекстами. В случае с МСА это API и capability. Data Mesh зависит от возможности идентифицировать дискретные, независимые области данных, которые могут быть реализованы отдельными частями бизнеса. Концепция «ограниченного контекста» из предметно-ориентированного проектирования (DDD) позволяет этим управлять. DDD признает, что по мере роста организации становится труднее построить единую модель всей области. Вместо этого крупную систему можно разделить на набор связанных и автономных «ограниченных контекстов» (микросервисов), каждый из которых имеет отдельную собственность.

Трудно определить четко разделенный и стабильный набор ограниченных контекстов. Хотя DDD обеспечивает полезную теоретическую основу для определения идеальных границ, многие реализации основаны на практичной эвристике и опыте конкретной организации. Дизайн предметной области часто отражает существующие организационные границы, но он также может определяться техническими требованиями к обработке данных или безопасности. Могут возникнуть и более прагматичные проблемы — с бюджетом и набором навыков. На практике это решается адаптацией канонической отраслевой модели данных и директивным распределением зон ответственности.

Принципы организации Data Mesh: пример из практики

В реальности микросервисный подход для организации хранилищ данных, aka Data Mesh, может существенно различаться в зависимости от контекста, в котором существует организация. Артефактами реализации в данном случае будет набор стратегий и тактик, основанных на общих теоретических принципах Data Mesh и MCA.

Стратегии

Разделение на домены

Речь о большом организационном процессе, когда бизнес разделился на 20 доменов по отраслевой модели. В каждом домене были сформированы собственные дата-команды. Им передали в управление источники данных, соответствующие этому домену, дали право самостоятельной интеграции в платформу данных. При этом команды обязаны следить за SLA и DQ вверенных им источников и не имеют права обращаться с подобными вопросами в платформенную команду, а должны решать их в рамках своих доменов.

Единая инфраструктура самообслуживания

И создание коммунальных сервисов базовых дата-тулзов в виде *aaS. В компании были разработаны схемы автоматизации сервисов: оркестрирования (Airflow aaS), хранения (S3ааS, DBaaS), компьют-ресурсов на базе k8s, созданы соответствующие линии поддержки по каждому сервису. Кроме того, была разработана схема конвейера данных от сырья до витрин данных — жесткий сценарий «проливки» данных по слоям, использования сервисов *aaS, а также коммунального кластера колоночной БД с обязательной изоляцией по ресурсам между источниками данных доменов. От теоретического принципа полностью раздельного хранения наборов данных пришлось отойти, чтобы сэкономить на однородной поддержке коммунальной системы.

Дополнительный бонус — разработанные *aaS-инструменты используются не только в аналитической платформе, но и в продуктах, не связанных с анализом данных.

***

Как и МСА, Data Mesh вобрал в себя идеи, которые витали в воздухе на протяжении долгого времени. Применение продуктового мышления к данным — общая тема среди многих манифестов, авторы которых пытались связать гибкую практику с анализом данных. Демократизация же давно является ключевой темой для организаций, стремящихся расширить возможности своих команд по анализу данных. По сути, новым здесь является только отказ от централизованного владения данными в пользу распределенного подхода.

Data Mesh имеет некоторое сходство с микросервисами — и это повод воспринимать проблемы архитектуры как предупреждение. Монолиты могут быть громоздкими, но распределенные монолиты, вероятно, еще хуже. Расширение прав и возможностей на местном уровне может показаться разумным, но это сопряжено с риском создания множества несовместимых хранилищ данных.

По крайней мере на какое-то время микросервисы стали рассматриваться как панацея, которую можно использовать для атаки на «устаревшие» монолиты, обеспечения легкой масштабируемости и освобождения команд от взаимной зависимости. Реальность же оказалась немного более витиеватой...

Журнал IT Expert [№ 06/2024] Подписка на журналы

Опубликовано 30.05.2024

Об авторах

Роман Рыжих

Технический архитектор «Леруа Мерлен»

Управление данными (Data Management)IT-архитектура

Предыдущая
Стратегическое планирование поддержки ИТ-инфраструктуры. Ключевые аспекты, позволяющие сократить издержки

Следующая
Искусственный интеллект в разработке ПО и управление продуктовыми данными

Новостная лента

Главное за неделю

Нажимая на кнопку, я принимаю условия соглашения.

Соглашение об использовании сайта

Внимательно прочитайте настоящее Соглашение, прежде чем начать пользоваться Сайтом. Вы обязаны соблюдать условия настоящего Соглашения, заходя на Сайт и используя сервисы, предлагаемые на Сайте. В случае, если Вы не согласны с условиями Соглашения, Вы не можете пользоваться Сайтом или использовать любые сервисы, предлагаемые на Сайте, а также посещать страницы, размещенные в доменной зоне Сайта. Начало использования Сайта означает надлежащее заключение настоящего Соглашения и Ваше полное согласие со всеми его условиями.

1. Термины и определения

1.1. Компания - Общество с ограниченной ответственностью «ИТ Медиа» (ООО «ИТ Медиа»).

1.2. Пользователь - лицо, получающее доступ к сервисам и информации, размещенным на Сайте.

1.3. Сайт – веб-сайт Компании, размещенный в сети Интернет по адресу https://www.it-world.ru.

1.4. Соглашение - настоящее Соглашение между Пользователем и Компанией, устанавливающее правила использования Сайта, включая графические изображения, элементы дизайна и средства индивидуализации, текстовую информацию и документацию, программы для ЭВМ и файлы для скачивания, любые иные произведения, объекты и материалы Сайта, а также условия и правила размещения Пользователем информации и материалов в соответствующих открытых разделах Сайта.

2. Общие положения и условия

2.1. Любые материалы, файлы и сервисы, содержащиеся на Сайте, не могут быть воспроизведены в какой-либо форме, каким-либо способом, полностью или частично без предварительного письменного разрешения Компании, за исключением случаев, указанных в настоящем Соглашении. При воспроизведении Пользователем материалов Сайта ссылка на Сайт обязательна, при этом текст указанной ссылки не должен содержать ложную, вводящую в заблуждение, уничижительную или оскорбительную информацию. Перевод, переработка (модификация), любое изменение материалов Сайта, а также любые иные действия, в том числе удаление, изменение малозаметной информации и сведений об авторских правах и правообладателях, не допускается.

2.2. Действующая редакция настоящего Соглашения размещена в сети Интернет на Сайте по адресу: https://www.it-world.ru/about/agreement.php. Компания вправе в любое время в одностороннем порядке изменять условия настоящего Соглашения. Такие изменения вступают в силу по истечении 2 (двух) дней с момента размещения новой версии Соглашения в сети Интернет на Сайте. При несогласии Пользователя с внесенными изменениями он обязан удалить все имеющиеся у него материалы Сайта, после чего прекратить использование материалов и сервисов Сайта. Ваше регулярное посещение данного Сайта считается вашим убедительным принятием измененного соглашения, поэтому Вы обязаны регулярно просматривать настоящее Соглашение и дополнительные условия или уведомления, размещенные на Сайте.

3. Обязательства Пользователя

3.1. Пользователь обязуется не предпринимать действий, которые могут рассматриваться как нарушающие российское законодательство или нормы международного права, в том числе в сфере интеллектуальной собственности, авторских и/или смежных правах, а также любых действий, которые приводят или могут привести к нарушению нормальной работы Сайта и сервисов Сайта.

3.2. Любые средства индивидуализации, в том числе товарные знаки и знаки обслуживания, а равно логотипы и эмблемы, содержащиеся на страницах Сайта, являются интеллектуальной собственностью их правообладателей. Пользователю Сайта запрещено воспроизводить или иным способом использовать указанные средства индивидуализации и/или их элементы без предварительного письменного разрешения соответствующих правообладателей.

3.3. Компания стремится обеспечить, однако не контролирует и не гарантирует конфиденциальность и охрану любой информации, размещенной на Сайте или полученной с Сайта. Компания принимает разумные меры в целях недопущения несанкционированного разглашения размещенной Пользователем на Сайте информации третьим лицам, однако не несет ответственность в случае, если такое разглашение было допущено. В этой связи, передача информации на Сайт означает согласие Пользователя на любое воспроизведение, распространение, раскрытие и иное использование такой информации. Размещая информацию и материалы, включая, фотографии и изображения, Пользователь также гарантирует, что обладает всеми правами и полномочиями, необходимыми для этого, с учетом условий настоящего Соглашения и что такое размещение не нарушает охраняемые законом права и интересы третьих лиц, международные договоры и действующее законодательство Российской Федерации.

3.4. Пользователь самостоятельно несет ответственность за любую информацию и материалы, размещенные им на Сайте. Компания не инициирует размещение указанной информации, не выбирает получателей информации, не влияет на содержание и целостность размещаемой информации, а также в момент размещения Пользователем информации на Сайте не знает и не может знать, нарушает ли такое размещение действующее законодательство Российской Федерации, однако Компания вправе отслеживать, просматривать и/или удалять любую информацию и материалы, размещенные Пользователем на Сайте. При размещении любой информации и материалов Пользователь не становится соавтором Сайта и отказывается от каких-либо претензий на такое авторство в будущем. Компания не выплачивает Пользователю авторского или любого иного вознаграждения, как в период, так и по истечении срока действия настоящего Соглашения.

3.5. В случае предъявления третьими лицами претензий Компании, связанных с нарушением Пользователем условий настоящего Соглашения, а равно с размещенной Пользователем информацией на Сайте, указанный Пользователь обязуется самостоятельно урегулировать такие претензии, а также возместить Компании все понесенные убытки и потери, включая возмещение штрафов, судебных расходов, издержек и компенсаций.

3.6. Компания не несет ответственности за посещение Пользователем, а также любое использование им внешних ресурсов (сайтов третьих лиц), ссылки на которые могут содержаться на Сайте. Компания не несет ответственности за точность, надежность, достоверность и безопасность любой информации, материалов, рекомендаций и сервисов, размещенных на внешних ресурсах. Использование внешних ресурсов осуществляется Пользователем добровольно, исключительно по собственному усмотрению и на свой риск.

3.7. Компания стремится к обеспечению достоверности информации, размещенной на Сайте, однако не несет ответственности за любые неточности и/или недостоверность информации, а равно сбои в работе предоставляемых через Сайт сервисов. Пользователь согласен с тем, что Компания не несет ответственность и не имеет прямых или косвенных обязательств перед Пользователем в связи с любыми возможными или возникшими потерями, или убытками, связанными с любым содержанием Сайта, интеллектуальной собственностью, товарами или услугами, доступными на нем или полученными через внешние сайты или ресурсы либо иные ожидания Пользователя, которые возникли в связи с использованием размещенной на Сайте информации или ссылки на внешние ресурсы. Ни при каких условиях, включая, но не ограничиваясь невнимательностью или небрежностью Пользователя, Компания не несет ответственности за любой ущерб (прямой или косвенный, случайный или закономерный), включая, но не ограничиваясь потерей данных или прибылей, связанной с использованием или невозможностью использования Сайта, информации, файлов или материалов на нем, даже если Компания или ее представители были предупреждены о возможности такой потери. В случае, если использование Сайта приведёт к необходимости дополнительного обслуживания, исправления или ремонта любого оборудования, а равно восстановления данных, все связанные с этим затраты оплачиваются Пользователем самостоятельно.

3.8. Вся представленная на Сайте информация предоставляется «как есть», без каких-либо гарантий, явных или подразумеваемых. Компания полностью, в той мере, в какой это разрешено законом, отказывается от какой-либо ответственности, явной или подразумеваемой, включая, но не ограничиваясь неявными гарантиями пригодности к использованию, а также гарантиями законности любой информации, продукта или услуги, полученной или приобретенной с помощью этого Сайта.

3.9. Пользователь согласен, что все материалы и сервисы Сайта или любая их часть могут сопровождаться рекламой. Пользователь согласен с тем, что Компания не несет какой-либо ответственности и не имеет каких-либо обязательств в связи с такой рекламой.

4. Условия обработки и использования персональных данных. Принимая условия настоящего Соглашения Пользователь выражает свое согласие на:

4.1. Предоставление своих персональных данных, включающих имя, номера контактных телефонов; адреса электронной почты; место работы и занимаемая должность; пользовательские данные (сведения о местоположении; тип и версия ОС; тип и версия Браузера; тип устройства и разрешение его экрана; источник откуда пришел на сайт пользователь; с какого сайта или по какой рекламе; язык ОС и Браузера; какие страницы открывает и на какие кнопки нажимает пользователь; ip-адрес) своей волей и в своем интересе.

4.2. Цель обработки персональных данных:

предоставление Пользователю услуг Сайта;
направление уведомлений, касающихся услуг Сайта;
подготовка и направление ответов на запросы Пользователя;
выполнение регулярной информационной рассылки;
направление информации о продуктах и услугах Компании, а также рекламно-информационных сообщений, касающихся продукции и услуг Компании и ее партнеров.

4.3. Перечень действий с персональными данными, на которые Пользователь выражает свое согласие:

сбор, систематизация, накопление, хранение, уточнение (обновление, изменение), использование, обезличивание, передача третьим лицам для указанных выше целей, а также осуществление любых иных действий, предусмотренных действующим законодательством РФ как неавтоматизированными, так и автоматизированными способами.

4.4. Компания обязуется принимать все необходимые меры для защиты персональных данных Пользователя от неправомерного доступа или раскрытия.

4.5. Настоящее согласие действует до момента его отзыва Пользователем путем направления соответствующего уведомления заказным письмо с уведомлением на адрес Компании.

5. Прочие положения

5.1. Использование материалов и сервисов Сайта, а равно размещение на нем материалов Пользователя, регулируется нормами действующего законодательства Российской Федерации. Все возможные споры, вытекающие из настоящего Соглашения или связанные с ним, подлежат разрешению в соответствии с действующим законодательством Российской Федерации по месту нахождения Компании.

5.2. Признание судом какого-либо положения Соглашения недействительным или не подлежащим принудительному исполнению не влечет недействительности иных положений Соглашения.

5.4. Бездействие со стороны Компании в случае нарушения кем-либо из Пользователей положений Соглашения не лишает Компанию права предпринять соответствующие действия в защиту своих интересов и защиту авторских прав на охраняемые в соответствии с законодательством материалы Сайта позднее.

Пользователь подтверждает, что ознакомлен со всеми пунктами настоящего Соглашения и безоговорочно принимает их.

По всем вопросам, связанным с нарушением авторских прав Компании, незаконного использования материалов Сайта или размещением ложной, вводящей в заблуждение информации о Компании, просим обращаться по  следующим контактным данным:

ООО «ИТ Медиа» ИНН 7802426999, КПП 781301001,
Санкт-Петербург, ул Большая монетная, 16 / К. 30 литера А, пом. 14-Н №30