МГУ–2016: Научно-исследовательский вычислительный центр

Общие сведения. НИВЦ состоит из 20 научно-исследовательских лабораторий и двух научно-производственных подразделений, численность сотрудников составляет 229 человек. В выполнении научных исследований и разработок заняты 60 научных сотрудников, в т.ч. 1 академик и 3 члена-корреспондента РАН, 26 докторов наук и профессоров, 32 кандидата наук. Научно-исследовательские работы поддержаны 23 грантами РФФИ, РНФ и РГНФ. Сотрудники принимают участие в работах по ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014–2020 гг.».
 
Наука. Исследования и разработки по государственному заданию проводились по 15 темам НИР в рамках приоритетных направлений:
1. Фундаментальные проблемы высокопроизводительных вычислений и обработки данных.
2. Фундаментальные проблемы построения систем автоматизации, методология, технология и безопасность крупных информационных систем.
3. Математическое моделирование, методы вычислительной и прикладной математики и их применение к фундаментальным исследованиям в различных областях знаний и нанотехнологиям.
4. Современные компьютерные технологии в обучении.
 
«Развитие Суперкомпьютерного комплекса МГУ, подготовка высококвалифицированных кадров в области суперкомпьютерных технологий»
 
Активно продолжается развитие Суперкомпьютерного комплекса МГУ, являющегося в настоящее время самым мощным суперкомпьютерным центром России, включающим суперкомпьютерные системы «Ломоносов» (1.7 Пфлопс) и «Ломоносов-2» (2.9 Пфлопс). Возможностями комплекса для выполнения фундаментальных исследований пользуются более 2200 учёных, специалистов и преподавателей из 20 подразделений университета, более 200 научных и учебных организаций России. Сотрудниками НИВЦ обеспечена эффективная поддержка суперкомпьютерного комплекса МГУ, постоянно проводится технический и системный мониторинг, установка обновлений, ежедневная поддержка пользователей суперкомпьютеров (решение технических вопросов, помощь в освоении суперкомпьютеров, консультации), поддерживается работоспособность оборудования и системного программного обеспечения.
Каждый день на суперкомпьютерах «Ломоносов» и «Ломоносов-2» выполняется около 1000 вычислительно сложных задач, отвечающих всем приоритетным направлениям развития науки, техники и технологий РФ: индустрия наносистем и новые материалы, живые системы, информационно-телекоммуникационные системы, энергетика и энергосбережение, транспортные, авиационные и космические системы, рациональное природопользование, перспективные вооружения, военная и специальная техника, безопасность и противодействие терроризму.
На основе выполнения множества проектов по изучению математических и физических принципов разработки суперкомпьютерных технологий, в т.ч. экзафлопсных с использованием технологий обработки больших объёмов данных, ведётся создание сверхмасштабируемых алгоритмов, пакетов и комплексов программ, реализующих высокоточные вычислительные модели и методы предсказательного моделирования, а также методики их внедрения в технологический цикл российских промышленных и научных организаций.
Исключительно важный результат этой деятельности – подготовка высококвалифицированных кадров, способных использовать, развивать и внедрять суперкомпьютерные технологии нового поколения на практике. В 2016 г. Суперкомпьютерным консорциумом университетов России подготовлен второй выпуск альманаха «Суперкомпьютерное образование в России», показывающий деятельность ведущих российских университетов в данной области.
 
«Развитие информационных систем управления МГУ»
 
Разработанные в НИВЦ информационные системы административного управления МГУ обеспечивают поддержку нового приёма и учебного процесса, учёт педагогической нагрузки, учёт штатного расписания и кадров.
НИВЦ поддерживает работу серверного комплекса обработки данных информационных систем административного управления, созданного в рамках Программы развития МГУ. В настоящий момент комплекс объединяет 28 блейд-серверов, имеет 312 вычислительных ядер, свыше 3 Тб оперативной памяти. Диски объединены в отказоустойчивое общее хранилище NetApp с технологиями кеширования наиболее часто читаемых данных, создания моментальных снимков дисков и возможностью резервного копирования на ленточную библиотеку без остановки предоставления сервисов. Защиту обеспечивают 2 высокопроизводительных аппаратных файрвола Сheckpoint с технологией обнаружения и предотвращения вторжений, работающие в отказоустойчивом кластере. В системе реализовано многократное резервирование блоков питания. Все компоненты системного программного обеспечения имеют сертификаты ФСТЭК. Доступ к расположенным на серверном комплексе информационным системам осуществляется с помощью аппаратных средств идентфикации пользователей.
Расширяется спектр технологий, используемых при разработке и интеграции информационных систем административного управления.
 
«Создание комплекса инструментальных средств для автоматизации процессов разработки и оптимизации параллельных программ»
 
Лаборатория параллельных информационных технологий (зав. чл.-корр. РАН Вл.В. Воеводин). Выполнен ряд взаимодополняющих работ по созданию комплекса инструментальных средств для автоматизации процессов разработки и оптимизации параллельных программ. Разработан способ преобразования и представления данных системного мониторинга, на основании чего подана заявка на изобретение JobDigest, подана также заявка на регистрацию товарного знака JobDigest. Данная разработка, апробированная в работе Суперкомпьютерного комплекса МГУ, направлена на анализ динамики и эффективности выполнения суперкомпьютерных приложений.
 
Открытая энциклопедия свойств алгоритмов: от мобильных платформ до экзафлопсных суперкомпьютерных систем (проект РНФ). Запущен полнофункциональный вариант открытой энциклопедии AlgoWiki в сети Интернет по свойствам алгоритмов и особенностям их реализации на различных программно-аппаратных платформах с возможностью коллективной работы над энциклопедией мирового вычислительного сообщества. Использованная технология MediaWiki поддерживает одновременную работу множества пользователей. Фундаментальная проблема высокопроизводительных вычислений – это необходимость аккуратного согласования структуры алгоритмов и программ с особенностями архитектуры компьютеров. Возможности современных компьютеров велики, но если хотя бы на одном из этапов процесса решения задачи согласования не будет, то и эффективность работы компьютера будет близка к нулю. Серьезнейшая проблема, решение которой ищут во всем мире. Умение эффективно работать со свойствами алгоритмов (выделять, описывать, анализировать, интерпретировать) станет широко востребованным уже через несколько лет. Это будет верно как для экзафлопсных суперкомпьютерных систем высшего диапазона производительности, так и для всех других компьютерных платформ: от серверных до мобильных. Причина такой уверенности – это высокая степень параллелизма, которая уже сейчас присуща всем платформам, и которая со временем только увеличивается. Основная идея, на которую опирается данный проект, состоит в том, что свойства самих алгоритмов никак не зависят от вычислительных систем, существующих сейчас или будущих. И с этой точки зрения детальное описание свойств алгоритмов имеет очень высокую самостоятельную ценность. Каждый раз, когда будет возникать задача эффективной реализации алгоритма на некотором компьютере, ответ на вопрос о потенциальных возможностях самого алгоритма будет содержаться в этом описании. Детальное описание алгоритма будет сделано один раз, после чего оно может быть многократно использовано для реализации данного алгоритма в различных программно-аппаратных средах. Не менее важна и вторая, машинно-зависимая часть данного исследования, которая посвящена описанию особенностей программной реализации алгоритмов с учетом конкретных программно-аппаратных платформ. Подобное деление на две части сознательно сделано для того, чтобы машинно-независимые свойства алгоритмов, которые определяют перспективность их реализации на параллельных вычислительных системах, были бы выделены и описаны отдельно от множества вопросов, связанных с последующими этапами программирования алгоритмов и исполнения результирующих программ в конкретных программно-аппаратных средах.
 
В рамках проекта «Обеспечение эффективности суперкомпьютерных центров будущего на основе технологий обработки больших объёмов данных и экстремальных вычислений» (грант Минобрнауки РФ), завершена программная разработка общего прототипа обеспечения комплекса программных средств, обеспечивающих эффективность больших суперкомпьютерных центров. Выполнена интеграция разработанных компонентов, выполнена реализация общего прототипа программного комплекса системы обеспечения эффективности функционирования суперкомпьютерных центров. На примере суперкомпьютера «Ломоносов» была продемонстрирована возможность применения разработанного прототипа в суперкомпьютерных центрах, предоставляющих доступ к современным системам петафлопсного уровня производительности. Выполнена разработка независимого банка типичных нештатных ситуаций, который предназначен для облегчения процесса создания модели суперкомпьютера при использовании разработанного прототипа на новых вычислительных системах. Успешно проведены экспериментальные исследования прототипа программного комплекса системы обеспечения эффективности функционирования суперкомпьютерных центров. В результате исследований составлен ряд рекомендаций, которые позволяют расширить функциональность прототипа, повысить удобство его применения и оптимизировать процесс его работы.
 
«Создание и развитие информационных систем учебного и административного назначения МГУ»
 
Лаборатории информационных систем и информационных систем математических наук (зав. к.ф.-м.н. О.Д. Авраамова), организации и ведения баз данных (зав. к.ф.-м.н. А.Д. Ковалёв), вычислительных методов (зав. д.ф.-м.н. А.В. Смирнов) и компьютерной визуализации (зав. чл.-корр РАН Г.Г. Рябов). Автоматизированная информационная система «Абитуриент» обеспечивала поддержку нового приёма на все факультеты и во все филиалы МГУ, а также в СУНЦ МГУ, в университетскую гимназию и на подготовительное отделение. АИС «Олимпиада» использовалась при поддержке очного тура проводимых МГУ олимпиад школьников. Шифрование работ на централизованных экзаменах и на олимпиадах обеспечивала система «Экзамен», диспетчеризацию потока абитуриентов, направляемых в поликлинику МГУ – АИС «Медосмотр». В АИС «Абитуриент» реализован модуль обмена данными с системой проверки сочинений. Работала веб-система формирования и печати заявлений абитуриентов всех факультетов и формирования структурированного файла данных для передачи в АИС «Абитуриент».
 
АИС «Студент» обеспечивала учёт контингента и успеваемости на всех факультетах и во всех филиалах МГУ, формирование и передачу в электронном виде в Центральную бухгалтерию МГУ приказов о назначении стипендий и иных выплат студентам, формирование выпускных документов. Сопряжённая с АИС «Студент» автоматизированная система «Учебный план» обеспечивает создание и хранение всех учебных планов, по которым осуществляется обучение студентов в МГУ.
 
Подготовлено техническое задание и разработана пилотная версия программного обеспечения АИС «ФизЛицо», предназначенная для унификации представления данных о студентах, аспирантах и сотрудниках при передаче в АИС «Кампусная карта». Система введена в опытную эксплуатацию.
 
На базе  системы регистрации студентов на межфакультетские учебные курсы – АИС «МФК» – запущена пилотная версия личного кабинета студентов МГУ. Число зарегистрированных пользователей этой системы превышает 20 тыс. человек. Разрабатывается система «Личный кабинет преподавателя».
 
В соответствии с решением ректората в АИС «Педагогическая нагрузка» дополнительно введены более 70 видов педагогических работ. Общее число видов нагрузки, учитываемых системой, достигло 130. Развивались возможности учёта работ общеуниверситетского характера с централизованным контролем объёма нагрузки. Реализован расчёт рейтингов преподавателей по объёму педагогической нагрузки и экспорт данных в ИАС «Наука-МГУ» для расчёта интегрированного рейтинга.
 
Проводилась поддержка и обеспечивались консультации пользователей разработанной НИВЦ АИС «Штатное расписание и кадры МГУ». В системе содержится полная информация о бюджетных позициях МГУ, данные 120 подразделений.
 
Разработана и реализована информационная модель учебных планов аспирантуры. В АИС «Аспирант» реализована печать дипломов государственного образца об окончании ординатуры и собственных дипломов МГУ об окончании аспирантуры.
 
Сотрудники лаборатории организации и ведения баз данных регулярно проводили расчёты заработной платы для сотрудников факультетов, институтов и административных служб МГУ. Углубляется интеграция между системой «Штатное расписание и кадры МГУ» и эксплуатируемой в НИВЦ системой расчёта заработной платы «1С Зарплата и кадры государственного учреждения».
Развивается ряд инфраструктурных проектов, в частности, система учёта и контроля заявок пользователей, система контроля учётных записей пользователей административных систем в связке с данными АИС «Кадры».
 
«Математические модели и эксперимент в электродинамике и магнитной гидродинамике»
 
Лаборатория вычислительного эксперимента и моделирования (зав. проф. А.В. Тихонравов). Научная группа под руководством проф. А.В. Тихонравова начала разработку нового класса алгоритмов решения обратных задач контроля процессов напыления оптических нанопокрытий, основанных на оценке отклонений положений экстремумов измеренных спектральных коэффициентов отражения и пропускания слоистой среды от их теоретически предсказанных положений.
С целью совершенствования алгоритмов контроля технологических процессов напыления оптических покрытий выполнено суперкомпьютерное моделирование современных высокоэнергетических процессов напыления оптических нанопокрытий тугоплавких оксидов кремния, титана и циркония с использованием методов молекулярной динамики. Для расчётов использовались современные силовые поля типа ReaxFF, позволяющие учитывать эффекты образования и разрыва химических связей, что имеет большое значение для адекватного представления физических процессов, происходящих в камере напыления. В результате суперкомпьютерных вычислительных экспериментов исследованы причины возникновения напряжения в напыленных плёнках. Результаты расчётов имеют большое значение для выяснения фундаментальных свойств и структурных особенностей оптических покрытий на наноразмерных уровнях.
 
В рамках тематики, посвящённой изучению природы магнитных полей небесных тел, научной группой под руководством Д.Д. Соколова продолжено исследование солнечного и галактического динамо и высших инвариантов спиральности. Эти магнитные поля создаются механизмом гидромагнитного динамо, а его работа, в свою очередь, оказывает влияние на космическую погоду, распространение радиоволн, возможно, и на климатические изменения. На основании этих исследований развиваются подходы к задаче прогнозирования солнечной активности на временных масштабах солнечного цикла (22 года). Моделирование процесса динамо требует объединения современных методов компьютерного моделирования с последними достижениями асимптотической теории дифференциальных уравнений математической физики. Работы по данной тематике опубликованы в ведущих международных журналах и широко цитируются.
 
Научной группой под руководством вед. специалиста И.В. Кочикова разработан общий подход и создано программное обеспечение, позволяющее анализировать экспериментальные проявления нежёстких молекул (спектры, электронная дифракция, термодинамика) в рамках единой модели молекулы. В отличие от жёстких молекул, которые могут быть с достаточной степенью точности описаны в представлении «гармонический осциллятор – жёсткий ротатор» с последующим учётом ангармоничности колебаний в рамках теории возмущений, нежёсткие молекулы характеризуются значительными деформациями или почти свободным внутренним вращением, а потому требуют разработки особых методов анализа. Такой анализ основывается на представлении динамики молекулы с помощью набора квазиравновесных конфигураций, рассчитываемых методами квантовой химии. Особый интерес в последние годы представляют молекулы, обладающие несколькими нежёсткими степенями свободы (например, внутреннее вращение, сопровождаемое значительными деформациями валентных углов). Современные вычислительные возможности позволяют анализировать молекулы с 2–3 нежёсткими степенями свободы. В рамках разработанного подхода проведено исследование целого ряда таких соединений (в частности, нитросоединений) и молекул, обладающих псевдовращением (таких, как пентафторид мышьяка).
 
«Тензорные методы численного анализа и интегральные уравнения»
 
Лаборатория вычислительных методов (зав. акад. РАН Е.Е. Тыртышников). Получены новые приложения методов тензорных аппроксимаций многомерных массивов и суперкомпьютерная версия метода оптимизации, основанного на ТТ-разложениях. Разработаны новые численные алгоритмы решения многокомпонентного уравнения Смолуховского, возникающего при моделировании коагуляции частиц, позволяющие решать систему в случае большого числа уравнений за счёт малоранговых аппроксимаций правых частей. При теоретическом развитии метода граничных интегральных уравнений в краевых задачах получено обоснование разрешимости краевой задачи для уравнения Лапласа на тонком плоском экране с граничными условиями на «косую производную», возникающей при применении метода снесения граничного условия на тонкую поверхность к краевой задаче Неймана вне тела малой толщины. Осуществлено приложение метода снесения граничного условия на срединную поверхность к задачам обтекания и формообразования планирующих парашютов. Построен основанный на граничных интегральных уравнениях метод численного решения задачи дифракции электромагнитной волны на однородном диэлектрическом теле, часть поверхности которого является идеально-проводящей.
 
«Вычислительно-информационные технологии для математического моделирования естественных и антропогенных изменений климата и природной среды»
 
Лаборатория суперкомпьютерного моделирования природно-климатических процессов (зав. чл.-корр. РАН В.Н. Лыкосов). В 2016 г. продолжены работы по развитию совместно создаваемой с Институтом вычислительной математики РАН модели Земной системы высокого уровня, которая единственная от России участвует в программе Межправительственной группы экспертов по изменениям климата. Для модели системы «тропосфера-стратосфера-мезосфера и D-слой ионосферы» (от поверхности Земли до 90 км) в рамках решения задачи её идентификации разработан отдельный блок расчёта частичного и полного ослабления радиосигнала в коротковолновом диапазоне и усовершенствован плазмохимический блок для воспроизведения возмущённого глобального состояния нижней ионосферы, обусловленного воздействием рентгеновского излучения от солнечной вспышки. Создан программный комплекс новой атмосферной модели (для высот от поверхности Земли до 130 км), включающей блок Е-слоя ионосферы. Построена эффективная численная схема решения системы уравнений для описания фотохимических процессов формирования D- и Е-слоя (7-компонентная плазмохимическая модель), обладающая законом сохранения заряда. Разработана модель химических преобразований нейтральных составляющих в области мезосфера–нижняя термосфера (с учётом трёх долгоживущих химических семейств и циклов преобразований внутри них) и показано удовлетворительное воспроизведение концентраций озона и окиси азота в этой высотной области. Создана новая версия параметризации орографического гравитационно-волнового сопротивления для моделей Земной системы, учитывающая блокирующий эффект гор, их неоднородность и анизотропию геометрии, а также распределённое обрушение волны при насыщении.
 
На основе метода Галёркина-Канторовича построена динамическая система, описывающая нелинейные колебания в стратифицированном замкнутом двумерном бассейне. Сформулированы условия, при которых выполняются конечномерные аналоги законов сохранения кинетической энергии и импульса. Проведены тестовые расчёты, демонстрирующие нелинейные эффекты, не воспроизводимые методом нормальных мод. С помощью разработанной в НИВЦ одномерной модели водоёма успешно воспроизведён заглубленный максимум температуры, наблюдавшийся на оз. Большой Вилюй (Камчатка), и проведена диагностика вклада всех учитываемых в модели механизмов в его величину. Выявлен новый, ранее не упоминавшийся в литературе, механизм увеличения средней величины максимума за счёт сдвига по фазе между суточным ходом толщины зоны, в которой он формируется, и самой величиной максимума (названный «эффектом накачивания»). Для одномерных моделей водоёма построена параметризация сейшевых мод с горизонтальным волновым числом номер 1. Показано, что дисперсионное соотношение для данной параметризации хорошо согласуется с классическими точными решениями для случаев баротропного и двуслойного бароклинного течений в прямоугольной и круговой области. Включение параметризации в модель водоёма НИВЦ показало, что сейшевые течения существенно ослабляют вертикальное перемешивание в отличие от приближения горизонтально однородного пограничного слоя, до сих пор принятого во многих моделях водоёмов.
 
С помощью прямого численного моделирования проведено исследование структуры турбулентного течения Куэтта при сильно устойчивой стратификации. Установлено, что турбулентность в этом режиме может поддерживаться при числах Ричардсона, превышающих известные ранее оценки. Данный режим характеризуется сильной пространственной перемежаемостью и наличием крупномасштабных вторичных циркуляцией. Проведено численное исследование стратифицированного потока под торошенным льдом при задании формы ледяных килей и их характерного пространственного распределения, согласованного с данными наблюдений. Показано, что структура турбулентного потока в перемешанном слое подо льдом, волновые возмущения и величина волновой компоненты силы сопротивления могу в значительной степени определяться пространственным распределением ледяных торосов, что необходимо учитывать при построении параметризаций коэффициента сопротивления для описания динамики морского льда в стратифицированной среде.
 
В рамках внебюджетной темы «Углеродный цикл в системе озеро–атмосфера: наблюдения и моделирование/Суперкомпьютерное моделирование многомасштабного взаимодействия турбулентного пограничного слоя атмосферы с гидрологически неоднородной поверхностью Земли» (грант РФФИ) на основе вихреразрешающей модели исследованы закономерности турбулентного обмена теплом и импульсом пограничного слоя атмосферы с подстилающей поверхностью, включающей лесные озёра. Выявлено, что её неоднородность может приводить к значительной интенсификации турбулентного перемешивания при устойчивой стратификации, что может быть одной из причин занижения интенсивности турбулентного обмена этого рода в современных прогностических и климатических атмосферных моделях. Модель дополнена описанием взаимодействия турбулентного течения со слоем лесной растительности путём учёта дополнительного сопротивления, зависящего от листового индекса, распределения плотности растительности по вертикали и высоты деревьев. Выявлены особенности статистических характеристик турбулентного течения над деревьями. В модель включён также блок расчёта лагранжева переноса трассеров. Модифицированная таким образом модель использована для определения следа потоков скаляров с неоднородной поверхности на примере расчёта турбулентных течений над неоднородными природными ландшафтами (мелкомасштабных озёр, окружённых лесом).
 
«Методы построения информационных систем на основе автоматизированной содержательной обработки слабоструктурированных данных»
 
Лаборатория анализа информационных ресурсов (зав. к.ф.-м.н. Б.В. Добров). В 2016 г. были получены следующие результаты:
– разработаны методы мониторинга данных социальных сетей;
– разработан двухэтапный метод выявления именованных сущностей;
– разработаны методы формирования интерпретируемых вероятностных тематических моделей.
Получены важные результаты в рамках научных коллабораций для коллективного решения сложных научно-технологических проблем:
– организован второй семинар по сравнению систем оценки тональности текстов;
– созданы доступные лингвистические ресурсы для автоматического анализа текстов.
 
Продолжалось развитие технологического решения, интегрирующего в рамках единой информационно-аналитической системы результаты обработки текстов различными алгоритмами. Существенно расширен набор методов сбора информации по социальным сетям, в т.ч. с использованием глобальных поисковых машин. Были подключены результаты выделения именованных сущностей с использованием статистических методов. Улучшены эксплуатационные характеристики обработки, хранения и поиска по большим текстовым коллекциям.
Получен грант РФФИ на проведение ориентированных фундаментальных исследований по теме «Автоматические методы выявления среды распространения терроризма и экстремизма в социальных сетях» (рук. вед.н.с. Н.В.Лукашевич). Поскольку многие современные террористические группы позиционируют себя как исламистские, то важно создать описание основных понятий ислама, известных проповедников ислама, исламских групп и группировок в виде Тезауруса ислама для автоматической обработки текстов, что позволит узнавать фрагменты обсуждения этих вопросов даже в таких коротких сообщениях как посты Твиттера.
 
В 2016 г. был разработан новый двухэтапный метод статистического извлечения именованных сущностей на основе метода условных случайных полей. На первом этапе имена извлекаются на основе метода машинного обучения. Далее собирается статистика по полученной разметке токенов, эта статистика преобразуется в набор признаков, который используется для обучения нового классификатора. Для экспериментов использовались открытые текстовые коллекции на русском языке «Persons-1000» и «Persons-1111-F», созданные в Исследовательском центре искусственного интеллекта ИПС РАН в г. Переславле-Залесском. Проведена дополнительная разметка коллекции «Persons-1000» другими типами именованных сущностей: организации (ORG), медиа организации, имеющие функции информирования (MEDIA), географические объекты (LOC), геополитические объекты (GEOPOLIT) – страны и столицы, выступающие в роли правительства (например, «Москва анонсировала»).
Модифицирована существующая программа извлечения именованных сущностей (имена персона, организаций, персон) для повышения качества извлечения арабских имен.
 
В рамках завершившегося проекта РФФИ «Исследование методов интеграции лингвистических знаний в статистические тематические модели» (рук. к.ф.-м.н. Б.В. Добров) в 2016 г. разработанный в рамках проекта метод для учёта словосочетаний в статистических тематических моделях использован в задаче определения наиболее частотного значения слова на основе сопоставления статистических тем, полученных для текстовой коллекции, и вектора близких по смыслу слов и словосочетаний, описанных в тезаурусе русского языка РуТез. Показано улучшение предсказания наиболее частотного значения слова по сравнению с униграммной моделью. Предложен комплексный подход к нестатистическому тематическому моделированию, который основан на кластеризации слов и словосочетаний текстовой коллекции, на основе учёта совокупности признаков, включая сходство по написанию, смысловое сходство, описанное в тезаурусе, близкое расположение в предложениях текстов, и дистрибутивное сходство. Метод был использован в задаче автоматического аннотирования новостных кластеров и показал улучшение характеристик качества для автоматический аннотация (метод Rouge, метод Пирамид) по сравнению с исходным методом. На основе данных международного семинара по оценке подходов по определению семантической близости пар слов для русского языка (RUSSE, http://russe.nlpub.ru/) было показано, что комбинирование мер встречаемости слов в соседних предложениях с оценкой близости на основе алгоритмов типа word2vec показывает высокое качество предсказания разных типов смысловой близости слов, включая тематическую близость, что может быть использовано в качестве дополнительных признаков в статистических тематических моделях.
 
В рамках завершившегося проекта РФФИ «Исследование методов автоматического анализа тональности текстов по отношению к заданному объекту» (рук. вед.н.с. Н.В. Лукашевич) в 2016 г. был организован второй семинар по тестированию анализа тональности по аспектам в рамках проекта SentiRuEval. Аналогично SentiRuEval-2015 проводилась оценка сообщений Твиттера по репутации банков (8) и телекоммуникационных компаний (7). Обновлена коллекция для тестирования (июль–нояб. 2015). Особое внимание было уделено организации качественной разметке «золотого стандарта» для тестирования. В течение 4 месяцев 112 человек из 25 городов и 7 стран приняли участие в разметке. Для уменьшения влияния субъективности каждое текстовое сообщение было независимо оценено как минимум четыре раза разными людьми.
Проведение цикла научных конкурсов имеет важное значение, так как по сравнению с первым конкурсом участники существенно улучшили свои подходы.
 
В рамках проекта РГНФ «Автоматизированное создание тезауруса русского языка типа WordNet на базе опубликованного тезауруса» (рук. вед.н.с. Н.В. Лукашевич) в 2016 г. был запущен специальный сайт тезауруса RuWordNet (http://ruwordnet.ru/). Уточнена схема выдачи синсетов слова на экран. Произведено установление отношений каузации и следования.
 
«Разработка и применение высокопроизводительных вычислительных методов молекулярного моделирования для решения физических, физико-химических, биофизических и медицинских проблем»
 
Лаборатория вычислительных систем и прикладных технологий программирования (зав. д.ф.-м.н. В.Б. Сулимов). Разработана компьютерная технология применения байесовских сетей для прогнозирования состояния пациентов по их персональным параметрам. В основе технологии лежат целевые базы данных пациентов, создаваемые для определённого заболевания. Эти базы содержат от несколько десятков до нескольких сотен клинических, молекулярно-биологических и генетических параметров. В качестве генетических данных используются одиночные нуклеотидные полиморфизмы, снипы (SNP – Single Nucleotide Polymorphism), а также экспрессия тех или других генов. Базы данных пациентов, как правило, имеют значительную зашумленность, а иногда и заметный процент пропусков некоторых параметров для отдельных пациентов. Для построения прогностических моделей на основе таких баз данных эффективными оказались вероятностные модели на основе байесовских сетей. Байесовская сеть представляет собой направленный ациклический граф, каждой вершине (узлу) которого сопоставлена одна переменная и таблица условных вероятностей. Переменные, соответствующие узлам сети могут представлять собой клинические, молекулярно-биологические и/или генетические параметры пациентов, целевые показатели исследования пациентов и другую информацию. Каждый узел сети может находиться в некотором количестве состояний, соответствующих дискретным значениям переменной, которую этот узел представляет. Таблица условных вероятностей данного узла содержит вероятности наблюдений состояний этого узла при различных состояниях узлов-родителей. В случае применения байесовский сети для прогноза состояния пациента один из узлов сети соответствует переменной, определяющей состояние пациента. В НИВЦ разработаны оригинальные алгоритмы, компьютерные и суперкомпьютерные программы для обучения байесовских сетей, предсказаний на основе обученных сетей, вычисления надёжности предсказаний, программы оптимизации сетей для выявления важнейших прогностических параметров и повышения надёжности предсказаний и ряд программ для работы с базами данных пациентов. Введены гистограммы риска для стратификации пациентов по группам риска. Эта технология и соответствующие программы были успешно применены для предсказания состояния пациентов при ряде заболеваний: для пациентов, испытавших острый коронарный синдром, для прогноза течения рака молочной железы, иммунного ответа привитых детей, для оценки риска инсульта и развития атеросклероза, а также для определения особенностей течения хронического гепатита C.
 
Поиск и разработка новых ингибиторов фактора свёртываемости крови XIa. Цель – разработка нового антикоагулянта на основе новых ингибиторов фактора свёртываемости крови XIa. Антикоагулянты, используемые в клинике сейчас, повышают риск кровотечений. В соответствие с рядом данных, описанных в научной литературе, фактор XIa представляет собой такую мишень для лекарственного воздействия, ингибирование которой может быть способом улучшения соотношения между терапевтическим эффектом и риском антитромботической терапии. При этом в настоящее время не существует низкомолекулярных ингибиторов фактора XIa, применяемых в клинической практике. Выполнена начальная стадия разработки новых ингибиторов. Разработана молекулярная модель фактора свёртываемости крови XIa. Проведено её тестирование и валидация программы докинга SOL, с помощью которой проводился докинг известных ингибиторов фактора XIa. Продемонстрировано хорошее качество докинга по этой мишени. С помощью программы SOL проведён виртуальный скрининг нескольких баз имеющихся в наличии низкомолекулярных соединений, среди которых отобраны для экспериментальной проверки 9. Эксперименты in vitro показали, что 6 из 9 соединений показали конкурентный механизм ингибирования в диапазоне констант ингибирования Ki от 7 до 47 ккал/моль, и из них 4 соединения с Ki ≤ 13 ккал/моль. Продолжается разработка этого и других классов соединений с целью существенного повышения их ингибирующей активности. Работы выполняются совместно с химиками синтетиками кафедры органического синтеза Воронежского государственного университета, а измерения in vitro проводятся биофизиками ННПЦ ДГОИ им. Д.Рогачёва.
 
«Исследование вопросов построения встраиваемых телекоммуникационных приложений повышенной надёжности на базе современных магистрально-модульных систем»
 
Лаборатория мобильных и встраиваемых программных систем (зав. к.т.н. И.В.Починок). Объектом исследования по госзаданию в 2016 г. являлось управление работой шасси в системах AdvancedTCA. Цель работы – на основе анализа спецификаций PICMG 3.Х выработка предложений по реализации управления шасси в системах AdvancedTCA.
В процессе работы проводились экспериментальные исследования аппаратно-программных средств системы.
В результате исследования был: проведён анализ аппаратных средств и даны рекомендации по выбору контроллера, предложен язык описания аппаратной платформы, выработаны предложения по организации поддержки высокоскоростных механизмов передачи данных между модулями, проведён анализ алгоритмов охлаждения и предложен комбинированный алгоритм охлаждения, проведён анализ расширенной модели сенсоров.
По хоздоговорной тематике выполнялась работа «Исследование и разработка библиотеки реализующей протокол HL7 для медицинских устройств». Проведено исследование группы протоколов HL7 для взаимодействия между медицинскими устройствами, проведён выбор оптимальной версии протокола для программной реализации, предложена программная реализация, особенности которой: открытость исходного кода (open source), поддержка нескольких операционных систем (Windows и Linux), поддержка HL7 v2 – кодирование и декодирование сообщений, С/С++ – как основной язык разработки, Python – как вспомогательный (генерация кода по шаблонам и базам данных).
 
«Исследование и разработка методов, алгоритмов и программного обеспечения в области вычислительной математики»
 
Лаборатория автоматизации программных вычислительных комплексов (зав. проф. О.Б. Арушанян). Для обратных задач с фазовыми переходами (в частности, для обратных задачи Стефана) сформулированы и обоснованы постановки этих задач в классах Гёльдера соответствующих математических моделей. Получены достаточные условия единственности их решения в сформулированных постановках. Сформулированы и доказаны теоремы, устанавливающие связь проблемы единственности решений для коэффициентных обратных задач Стефана со свойствами плотности решений соответствующих сопряжённых задач на основе принципа двойственности. Предложен новый численный метод решения дифференциальных гиперболических уравнений с дробными производными порядка ½ со скоростью сходимости h^{1/2}. Выполнен анализ устойчивости явных разностных схем при аппроксимации дробных дифференциальных уравнений в банаховом пространстве. Предложено обобщение приближённого численно-аналитического метода решения задачи Коши для систем обыкновенных дифференциальных уравнений 1-го порядка с использованием рядов Чебышёва на случай уравнений с быстро изменяющимися и быстро растущими решениями. Разработан и программно реализован алгоритм решения обыкновенных дифференциальных уравнений методом рядов Чебышёва с автоматическим выбором разбиения интервала интегрирования на основе нового способа оценки погрешности приближённого решения. Разработаны и включены в состав инструментального комплекса TeConv новые инструментальные программные средства преобразования текстовой информации. Завершено издание т. 17 научного журнала «Вычислительные методы и программирование».
 
«Исследование и разработка решёточных моделей представления и вычислительных методов обработки объектов геометрико-топологической структуры в системах компьютерной визуализации»
 
Лаборатория компьютерной визуализации (зав. чл.-корр. РАН Г.Г. Рябов). Исследованы свойства натуральных чисел на основании композиции инфинитарных структур (кратчайших k-мерных путей в n-кубе, глобального k-арного дерева и множества натуральных N). Рассмотрен вариант классификации натуральных чисел на основе представления множества всех натуральных, как объединения 6 бесконечных арифметических прогрессий. Сами классы (биективные прогрессиям) рассматриваются как члены двух конечных полугрупп по отношению к операциям сложения и умножения. Приведены бинарные отношения между классами и, на их основании, свойства натуральных при такой классификации. Доказана теорема о двух прогрессиях из этих 6, содержащих все простые числа. Введено действие слияния над прогрессиями, а также понятия кольцевая прогрессия и квази-прогрессия, как результат слияния. Рассмотрены бинарные, тернарные и кватернарные слияния.
 
В рамках внебюджетного проекта «Исследования полиморфных свойств генетических пространств, направленные на создание конструктивных методов вычисления характеристик и инвариантов классов эквивалентности в таких пространствах на базе операций символьного процессора» (грант РФФИ) ведутся исследования в следующих направлениях:
– Исследование особенностей архитектуры символьного процессора, ориентированного на универсальность работы с различными позиционными системами счисления и символьными матрицами, как биекциями комплексов полиэдров.
– Развитие инвариантов классов эквивалентности, которые являются результатом действия автоморфных функций для символьных матриц и сводятся к диаграммам Юнга.
– Исследование локальных свойств разностного таблоида, как индикатора симметричности простых в структуре натуральных чисел, на базе операций символьного процессора.
Лаборатория активно участвует в работах по развитию информационных систем административного управления МГУ, информационных систем «Выпускник МГУ» и «Межфакультетские учебные курсы» (МФК). Поддерживается сайт лаборатории: http://vizcom.srcc.msu.ru/
 
«Развитие алгоритмических методов вычисления и их применение в физике элементарных частиц»
 
Лаборатория математического моделирования (зав. д.ф.-м.н. А.В. Смирнов) продолжает разработку методов расчёта взаимодействия элементарных частиц. В 2016 г. аналитически вычислены планарные четырёхпетлевые безмассовые форм-факторы и вклады в четырёхпетлевые аномальные размерности в КХД в пределе большого числа цветов. Это первый пример аналитических вычислений такого рода на четырёхпетлевом уровне. Получен полностью аналитический результат для трёхпетлевой поправки к статическому потенциалу взаимодействия между кварками. В пертурбативной квантовой хромодинамике вплоть до четырёхпетлевого приближения получены формулы, связывающие массы кварков, определённые в рамках перенормировки на массовой оболочке, с одной стороны, и в схеме минимальных вычитаний с другой. Эти соотношения играют существенную роль для высокоточного вычисления кварковых масс в схеме минимальных вычитаний. Вычислен полный электронный вклад в аномальный магнитный момент мюона в четырёхпетлевом приближении. Разработана и опубликована версия программы вычисления мастер-интегралов методом секторного разложения, использующая для ускорения графические процессоры.
На базе научно-вспомогательного состава лаборатории продолжает работу группа поддержки комплекса информационных систем «Штатное расписание и кадры», «Аспирант», «Выпускник». По данным информационным системам проводятся такие работы как составление сопутствующей документации, ответы на присылаемые пользователями задания, установка точек удалённого доступа к информационным системам по подразделениям МГУ, консультации. В 2016 г. силами лаборатории было получено два свидетельства регистрации программных продуктов, составлена техническая документация АИС «Аспирант» (схема IDEF0, техническое задание).
 
«Лингвистическое моделирование нестандартных текстов и проблема выбора адекватной модели описания различных языковых уровней и процессов»
 
Лаборатория автоматизированных лексикографических систем (зав. к.филол.н. О.А. Казакевич). В 2016 г. проводились исследования функционирования языка в нестандартных ситуациях, велись поиски механизмов порождения «нестандартных» текстов», определялось, существует ли связь между нестандартностью ситуации функционирования языка и нестандартностью текстов, порождаемых в подобных ситуациях. Работа шла по 5 направлениям, имеющим в качестве объекта различные типы нестандартных текстов и ситуаций.
1. Документация и исследование исчезающих языков (рук. к.филол.н. О.А. Казакевич, исполнители: вед. спец. Е.М. Будянская, ст. спец. Л.М. Захаров, мл.н.с. М.И. Воронцова, мл.н.с. Ю.Е. Галямина, специалисты – Т.Б. Багаряцкая, Т.Е. Реутт, В.С. Хоружая, С.Ф. Членова, И.В. Шумарина): мультимедийные корпусы текстов селькупских, кетских и эвенкийских говоров пополнены новыми текстами с морфологической разметкой; завершено корпусное исследование грамматических особенностей внутрифразовых кодовых переключений и локальных вариантов падежной системы в селькупском и эвенкийском языках; интернет-сайт «Малые языки Сибири: наше культурное наследие» пополнен новыми материалами и рубриками; англоязычная версия ряда разделов сайта подготовлена к функционированию в тестовом режиме.
В рамках внебюджетной темы «Корпусное исследование синтаксических структур в устной и письменной речи носителей исчезающих языков: на материале селькупских, эвенкийских и кетских говоров бассейнов Среднего Енисея и Среднего и Верхнего Таза» (2014–2016, грант РФФИ) на завершающем этапе проекта было продолжено описание синтаксических структур в устной и письменной речи носителей селькупских, кетских и западных эвенкийских говоров Среднего Енисея и Среднего и Верхнего Таза. Проведено сравнение результатов эмпирического исследования эвенкийского материала с существующими описаниями алтайских языков. Выявлен ряд отклонений эвенкийских говоров от «стандартного» синтаксиса алтайских языков, прежде всего в порядке слов в предложении. Проведено сравнение результатов эмпирического исследования селькупского материала с существующими описаниями уральских языков с целью выявления отклонений современных селькупских говоров от «стандартного» синтаксиса уральских языков. Прежде всего, это касается порядка слов. Завершено сравнение результатов эмпирического исследования кетских материалов с существующими описаниями кетского языка с целью выявления отклонений современных эмпирических данных от описаний. Проанализировано влияние русского языка на синтаксис современных селькупских, эвенкийских и кетских говоров. Исследовано калькирование синтаксических структур носителями селькупского, эвенкийского и кетского языков при порождении текстов на русском языке. Результаты работы представлены на интернет-ресурсах: «Синтаксический проект РФФИ» на сайте «Малые языки Сибири: наше культурное наследие», Синтаксический корпус эвенкийских, кетских и селькупских текстов, Морфологический анализатор для эвенкийского языка.
 
2. Исследование логических и стилистических факторов в лексической семантике (рук. вед.н.с. Е.Э. Разлогова, исполнитель спец. В.С. Хоружая): разработан формальный аппарат оценки степени сходства/различия текстов в условиях переключения кода и апробирован на параллельных корпусах текстов и их переводов (русско-французских).
 
3. Выбор методов и построение и апробация алгоритмов автоматизированной обработки нестандартных текстов (н.с. А.В. Рафаева): разработан автоматизированный алгоритм выделения цветообозначений и проведено сравнение обычного употребления разных способов цветообозначения с их употреблением в фольклорной прозе. Исследованы роли матери и отца в русской волшебной сказке.
 
4. Анализ дневниковых текстов (рук. вед.н.с. М.Ю. Михеев, исполнители В.П. Зайончковская, спец. В.С. Хоружая, при участии спец. Л.И. Эрлиха): пополнен сайт «Universitas personarum» и ИС «Студенты Императорского Московского университета»; усовершенствован интерфейс ИС; продолжено исследование дневников А.Гладкова.
 
5. Развитие и пополнение сайта «Поэзия Московского университета от Ломоносова и до…» (рук. н.с. А.В. Рафаева, исполнители мл.н.с. М.И. Воронцова, вед. спец. Э.К. Лавошникова, специалисты С.Ф. Членова, И.В. Шумарина): опубликованы страницы двух новых авторов – Александра Кизеветтера и Александра Блюменау (Ильинского), добавлены новые материалы на страницы Николая Морозова, Бориса Лавренева и Дмитрия Благого; размещена на сайте (в тестовом режиме) интерактивная карта поэтов Московского университета; изданы составленные Н.Н. Перцовой 7-я и 8-я книги антологии «Поэзия Московского университета: от Ломоносова и до…». Эти книги были удостоены национальной премии «Лучшие книги и издательства – 2016 г.» в номинации «Поэзия». Премия учреждена в 2000 г. Русским биографическим институтом, «Литературной газетой».
 
«Обратные задачи синтеза плоской компьютерной оптики»
 
Лаборатория разработки систем автоматизации обработки изображений (зав. проф. А.В. Гончарский). В рамках темы «Обратные задачи синтеза плоской компьютерной оптики» были разработаны методы синтеза нанооптических элементов с гладкой фазовой функцией. Синтез нанооптических элементов включает в себя решение обратной задачи расчёта фазовой функции плоского фазового оптического элемента и само изготовление микрорельефа дифракционного элемента. Для решения обратной задачи синтеза и математического моделирования использовались модель геометрической оптики и скалярная волновая модель Френеля. Для изготовления микрорельефа использована электроннолучевая технология. С использованием электроннолучевого генератора НИВЦ с разрешением 0,1 мкн были синтезированы нанооптические элементы с гладкой фазовой функцией для оптического диапазона длин волн. Глубина микрорельефа 0,6 мкн, точность изготовления микрорельефа порядка 20 нм. В ходе работ по теме НИР были исследованы возможности использования нанооптических элементов для контроля подлинности документов. Определены основные параметры нанооптических элементов для автоматизированного контроля подлинности как в монохроматическом свете, так и при освещении дневным светом нанооптического элемента. С помощью электроннолучевой технологии изготовлены нанооптические элементы для автоматизированного контроля.
 
Второе направление НИР связано с разработкой алгоритмов решения коэффициентных обратных задач волновой томографии. Обратные задачи волновой томографии рассмотрены в трёхмерной постановке с полным диапазоном данных, когда объект зондируется со всех сторон, и неполным диапазоном данных. Основным применением разрабатываемых методов являются задачи ультразвуковой томографии в медицине. В отличие от послойных схем томографии разработаны алгоритмы решения коэффициентных обратных задач для непосредственно трёхмерных уравнений гиперболического типа. В этом случае приходится иметь дело со сверхбольшим объёмом данных в нелинейной обратной задаче с числом неизвестных порядка 100 млн. Алгоритмы ориентированы на реализацию для суперкомпьютеров на графических картах на языке С/С++/OpenCL. Проведены исследования по эффективному распараллеливанию алгоритмов и разработке масштабируемого программного обеспечения. Разработано программное обеспечение для нескольких десятков GPU суперкомпьютера «Ломоносов». Проведены модельные расчёты в 3D обратных задачах на разработанном программном обеспечении с целью оптимизации томографических схем, параметров источников, приемников.
 
«Построение имитационных моделей хозяйственно-финансовой деятельности и создание на их основе компьютерных деловых игр»
 
Лаборатория имитационного моделирования и деловых игр (зав. к.ф.-м.н. А.В. Тимохов). Разработан программный комплекс «Финансы», предназначенный для профессионального обучения таким сторонам финансово-инвестиционной деятельности предприятий, как получение кредитов, размещение депозитов и предоставление займов. Комплекс представляет собой углублённое представление соответствующих тем в компьютерных деловых играх серии «БИЗНЕС-КУРС». В комплексе демонстрируются различные методы расчёта процентов, как с фиксированной, так и плавающей ставкой, организация учёта и отчётности по указанным сторонам деятельности предприятий. Компьютерные деловые игры серии «БИЗНЕС-КУРС» продолжали активно использоваться в учебном процессе экономического факультета, факультета государственного управления и Московской школы экономики МГУ, а также целого ряда других учебных заведений страны. В 2016 г. на их основе проведено 9 Всероссийских студенческих олимпиад в разных регионах России.
 
Учебная работа. Разработаны и прочитаны новые курсы.
‒ Многоязычие в дискурсе: теоретические аспекты (вед.н.с. Е.Э. Разлогова);
‒ Французский язык (вед.н.с. Е.Э. Разлогова);
‒ Численные методы в интегральных уравнениях и их приложения (проф. А.В. Сетуха).
 
Конференции. 93 сотрудника приняли участие в 96 научных конференциях, сделан 151 доклад.
Организованы и проведены:
‒ международная конференция «Суперкомпьютерные дни в России 2016» (26–27 сент.);
– международная конференция и школа молодых учёных по измерениям, моделированию и информационным системам для изучения окружающей среды: ENVIROMIS-2016 (11–16 июля);
‒ научная конференция «Работа реальных приложений на процессоре Intel® Xeon Phi™ 7200: подход, опыт и результаты» (26 сент.);
‒ научная конференция «Параллельные вычислительные технологии» (ПаВТ) 2016 (28 марта – 1 апр.);
‒ научно-практическая конференция «Технологии параллельной обработки больших графов» (3 марта);
‒ Международная Летняя Суперкомпьютерная Академия 2016 (23 июня – 2 июля);
‒ Russian-Finnish seminar on Land-atmosphere exchanges in heterogeneous landscapes (20 окт.);
‒ Joint Uppsala and Moscow State University HPC Workshop (10–11 нояб.);
‒ 13th Workshop on Numerical Methods for Problems with Layer Phenomena (6‒9 апр.);
‒ конференция с международным участием «Чтения памяти Натальи Николаевны Перцовой» (25 окт.).
 
Доктора наук 2016 г. Вед.н.с. лаборатории разработки систем автоматизации обработки изображений Романов Сергей Юрьевич защитил диссертацию на соискание ученой степени доктора физико-математических наук «Разработка алгоритмов решения прямых и обратных задач томографии в скалярных волновых моделях» (специальность 05.13.18 – математическое моделирование, численные методы и комплексы программ). Обратные задачи рассмотрены как коэффициентные обратные задачи определения неизвестной функции скорости в нелинейной, трёхмерной постановке. Предложены итерационные методы решения, основанные на возможности прямого вычисления градиента функционала невязки через решение сопряжённой задачи для волнового уравнения. Разработаны комплексы программ на суперкомпьютерах. Одним из основных применений полученных результатов является медицинская диагностика.
 
Публикации. Опубликовано 5 монографий, 6 учебных пособий, 146 статей в научных журналах, в т.ч. 43 в журналах индексируемых в Web of Science и Scopus, 68 тезисов докладов. Издан новый том электронного журнала «Вычислительные методы и программирование. Т. 17».
Монография
 
Гончарский А.В., Романов С.Ю., Серёжников С.Ю. Суперкомпьютерные технологии в задачах проектирования томографических диагностических комплексов.
 
Адрес центра: http://www.srcc.msu.ru/