В университете МГИМО введен в эксплуатацию вычислительный кластер

Вычислительный кластер проектировался и создавался параллельно с проектным, строительным и монтажно-наладочным процессами компьютерного класса в аудитории №120 в 2024 году. В январе 2025 введен в эксплуатацию.

Было начато реальное использование кластерных параллельных вычислений, освоены классическое и нейросетевое машинное обучение, вошли в арсенал современные языки программирования.

Комплекс получил наименование CL120.

Он включает в себя

  • 35 вычислительных узлов, в качестве которых используются обычные персональные компьютеры;
  • 2 коммутатора 24 / 1 Gbit;
  • 1 сервер 16 ядер / 128 Gb.

 

Программное обеспечение

  • Операционная система GNU / Linux Debian 12;
  • Фреймворк для параллельной обработки данных и машинного обучения Apache Spark 3.5.1;
  • СУБД PostgreSQL 17.

 

Языки программирования

  • Python 3.11.2;
  • PL / pgSQL;
  • Другие программные средства.

Все оборудование класса используется в учебное время, согласно расписанию, как обычный учебный компьютерный класс, кроме тех случаев, когда занятие предполагает использование параллельных вычислений.

Во внеурочное время персональные компьютеры перезагружаются в операционную систему GNU / Linux, после чего кластер готов к работе. Впрочем, и в этом случае компьютеры класса могут использоваться, как обычные персоналки - все кластерные вычисления используют ресурсы ПК в фоновом режиме.

Другими словами под Linux класс может быть использован в учебных целях, как с использованием вычислительного кластера студентами, так и с использованием традиционных, однопользовательских программных средств.

 

Функции сервера

  • распараллеливание выполняемой задачи;
  • хранение данных;
  • распределение вычислительной нагрузки и данных между узлами;
  • объединение результатов полученных от узлов;
  • самостоятельная работа над задачей в период, когда узлы (персональные компьютеры) заняты или выключены.

 

Вывод

Университет впервые получил вычислительный кластер, способный в режиме параллельных вычислений решать статистические и иные задачи на больших данных, с использованием как классического машинного обучения, так и глубокого обучения на нейросетях.

 

Годовой баланс времени

  • Учебное время = 8 месяцев * 20 дней * 8 часов = 1280 часов в год.
  • Полный годовой баланс = 365 * 7 * 24 = 61320 часов в год.
  • Ресурс вычислителя 61320 - 1280 = 60040 часов в год или 98% годового баланса.

 

Разумеется, это теоретические / умозрительные выкладки. Машину нужно обслуживать, готовить к каждому большому проекту, небольшие и учебные проекты могут крутиться параллельно, сразу группами, в учебное и не учебное время, поэтому реальный ресурс CL120 можно будет оценить не менее чем через несколько месяцев или лет эксплуатации.

В презентации есть несколько примеров использования вычислительного кластера CL120.

Приглашаем всех, кому нужны исследования больших данных воспользоваться услугами Лаборатории ЭВТ им.Чепоского.

 

Мы помогаем произвести

  1. декомпозицию вашей задачи;
  2. собрать и пред-обработать данные;
  3. создать и обучить вашу модель;
  4. внедрить ее в приложение.

 

Приложения

  1. Эта статья в PDF
  2. Презентация кластера CL120

 

04.06.2025
  • Эксклюзив
  • Новости
  • Аналитика
  • Невоенные аспекты
  • Россия
  • Новейшее время