Итоги форума Informatica Day
24 сентября в московском отеле Холидей Инн Сокольники состоялся форум Informatica Day, посвященный вопросам управления и качества корпоративных данных. В работе конференции приняли активное участие как разработчики, так и заказчики соответствующих программных комплексов, главным образом банки и телеком-операторы. Основная польза от прошедшего мероприятия, по признанию самих участников, заключалась в обмене опытом. При том, что российское банковское сообщество отличается известной долей закрытости, регулярное проведение подобных форумов, безусловно, может способствовать развитию открытых отраслевых стандартов.
Олег Гиацинтов, технический директор компании Data Integration Software, являющейся российским представительством корпорации Informatica, говорил о принципах обеспечения качества данных. К основным проблемам этой области, в первую очередь, относятся следующие: полнота, соответствие стандартам и взаимное соответствие, дублирование, связность и целостность, а также корректность информации. Как подчеркнул докладчик, обеспечение качества данных является цикличной задачей. Ее нельзя решить раз и навсегда. Напротив, требуется регулярно проводить оценку текущей ситуации, определять требуемые результаты, разрабатывать и применять процессы повышения качества данных. После этого следует контролировать соответствие получаемых данных с первоначально поставленными критериями. Гиацинтов рассказал о работе решений Informatica на различных примерах. Пожалуй, наиболее актуальными являются задачи, связанные с синтаксическим разбором такой информации, как имена, адреса, телефоны, наименования товаров, паспортные сведения, банковские реквизиты. В крупных компаниях подобные данные поступают в единую базу из множества источников, поэтому избежать значительного количества ошибок при первоначальном вводе просто невозможно. Вместе с тем средства Informatica Data Quality позволяют очистить и привести, например, адреса к единому формату, проверить их существование и корректность, выявить дубли и т. д. То же самое относится и к другим типам информации.
О практическом использовании программных продуктов Informatica поделился Сергей Вихров, директор департамента технологического развития Бин-банка. Перед ИТ-подразделением этого банка была поставлена задача очистки и стандартизации базы данных. Первичное профилирование показало, что в базе адресов поле «город» пустует в 26% случаев, а поле «улица» – в 35%. Проект по очистке занял около 4-х месяцев, при этом доля записей, удовлетворяющих поставленным параметрам, выросла с 35% до 90%. Также было устранено 13% дублирующих записей.
Ведущий технический менеджер Informatica в региона EMEA Петр Сковронски (Pierre Skowronski) рассказал о повышении эффективности работы приложений благодаря управлению жизненным циклом данных (так называемый Lifecycle Management). Ни для кого не секрет, что рост объема информации носит экспоненциальный, а порой и взрывной характер. Это негативно сказывается не только на производительности приложений, но и на затратах, связанных с хранением файлов. Ведь далеко не вся имеющаяся информация реально востребована. На форуме были представлены решения, направленные на выделение неиспользуемой информации и сохранении ее в специальном архиве. Такой подход позволяет тратить ресурсы на обработку только актуальных данных. Обращение к репозиторию происходит только в том случае, когда в основной базе не найдено интересующей информации.
Интересные решения имеются и в области защиты информации. Сковронски рассказал о технологии маскирования, когда чувствительные данные по определенному алгоритму преобразуется в реалистично выглядящие, но не несущие первоначального смысла. Такой эффект можно достигнуть, замещая символы в именах, названиях улиц и городов, цифры в номерах кредитных карт и т. д.
С докладами на конференции выступили представители компаний HP, Columbus IT, Промсвязьбанк, Вымпелком. Среди иностранных гостей в работе форума приняли участие ведущий ИТ-архитектор телекоммуникационной компании KPN Томас Рейчел (Thomas Reichel), а также вице-президент по разработке корпоративных систем Bank of America Ричард Спинк (Richard Spink).