Строительство прототипа суперкомпьютерной системы нового поколения
Компания «Т-Платформы», Финский суперкомпьютерный центр CSC - IT Center for Science Ltd., Швейцарский Национальный Суперкомпьютерный центр CSCS и Национальный центр высокопроизводительных вычислений и информационных технологий SARA объявили о старте совместного проекта по строительству прототипа суперкомпьютерной системы нового поколения. Система войдет в состав паневропейской суперкомпьютерной инфраструктуры PRACE RI.
Прототип будет применяться для оценки энергоэффективности и управляемости суперкомпьютеров нового поколения, а также для тестирования новых сред программирования. В ходе совместного проекта будет разработано высокомасштабируемое параллельное прикладное ПО, эффективно использующее ускорители с различной архитектурой в составе гибридных вычислительных систем. Прототип системы будет включать новейшие разработки в области конструктива, инфраструктуры охлаждения, интерконнекта и процессорных ускорителей, а также операционных систем и систем управления. Производительность системы будет достаточно велика для изучения масштабируемости параллельных научных и прикладных программных пакетов на суперкомпьютерах нового поколения.
Прототип системы, устанавливаемый в финском суперкомпьютерном центре CSC, будет основан на архитектуре нового поколения с рабочим названием T-REX, разработанной компанией «Т-Платформы». Создание полнофункционального решения с расчетной пиковой производительностью до 400 Тфлопс планируется завершить в 2013 году. Оно будет включать 256 гибридных вычислительных узлов на базе процессоров Intel с ускорителями NVIDIA Tesla и Intel Xeon Phi, ранее известными как Intel MIC, охлаждаемых горячей водой. Межпроцессорный обмен обеспечит системная сеть InfiniBand с усовершенствованным программным обеспечением, реализующим ряд передовых технологий улучшения масштабируемости, такие как адаптивный роутинг. В III квартале 2012 года планируется завершить создание первой очереди прототипа, состоящей из меньшего количества гибридных узлов на базе архитектуры V-Class компании «Т-Платформы».
На прототип будет установлена система управления ClustrX компании «Т-Платформы», обеспечивающая широкие возможности развертывания, мониторинга и управления суперкомпьютерным комплексом. Возможности архитектуры T-Rex и системы Clustrx, а также ряда программных технологий, разработанных российско-европейским консорциумом HOPSA, позволят установить взаимосвязь между реальной производительностью приложений и энергопотреблением суперкомпьютера, а также реализовать новые высокоэффективные методы управления энергопотреблением. В ходе совместного проекта будет создана универсальная платформа для оценки энергоэффективности суперкомпьютерных установок на всех уровнях, от приложений до инженерной инфраструктуры дата-центра, что в перспективе позволит разрабатывать более энергоэффективные суперкомпьютерные ЦОД.
Участники проекта планируют оценить эффективность различных парадигм программирования, таких как CUDA+MPI, OpenMP с MIC, OpenCL, OpenACC, SHMEM и PGAS, с помощью набора бенчмарков, выбранных в сотрудничестве с другими партнерами суперкомпьютерной инфраструктуры PRACE.
Специалисты CSC и «Т-Платформы» осуществят портирование приложений GPAW (DFT) и Elmer (FEM) на архитектуру системы для более эффективного использования ускорителей, оптимизации межузловых коммуникаций и повышения производительности механизма перезапуска расчета с контрольной точки. Сотрудники SARA сфокусируют усилия на оценке энергоэффективности и разработке инструментов ее оптимизации, а также использовании ускорителей для выполнения таких приложений SARA как Crunch и Crunch2 (рентгеновская кристаллография), Voxel 3d (ортопедия) и Rbflow (вычислительная гидродинамика). Швейцарский центр CSCS займется изучением переносимых программных моделей, основанных на применении директив, а также механизмов прямых коммуникаций между сопроцессорами для разработки масштабируемых параллельных программ.