ИИ позволит точно моделировать производительность систем хранения данных
Исследователи факультета компьютерных наук НИУ ВШЭ разработали новый подход к моделированию систем хранения данных на основе генеративных моделей машинного обучения. Он позволяет с высокой точностью предсказывать ключевые характеристики работы таких систем при различных условиях. Результаты опубликованы в журнале IEEE Access.
Системы хранения данных играют важную роль в современном цифровом мире, отвечая за сохранность и оперативную доступность огромных объемов информации. Эти системы состоят из множества компонентов — контроллеров, дисков HDD и SSD, кеш-памяти, — которые совместно обеспечивают быструю и эффективную работу. Чтобы такие системы функционировали оптимально, важно точно прогнозировать их производительность при различных сценариях, например при изменении нагрузки.
Исследователи факультета компьютерных наук НИУ ВШЭ разработали новый подход к моделированию производительности систем хранения данных, который базируется на использовании генеративных моделей машинного обучения. Авторы предложили методику, позволяющую с высокой точностью предсказывать ключевые характеристики работы систем: количество операций ввода-вывода в секунду (IOPS) и задержку (latency).
Моделирование состоит из двух этапов. Сначала ученые собирают данные реальных измерений производительности системы при различных нагрузках и конфигурациях. Затем эти данные поступают в специальные генеративные модели: регрессионную модель CatBoost и модель нормализующих потоков (Normalizing Flow). CatBoost хорошо работает с табличными данными и точно предсказывает средние значения и отклонения производительности. Модель нормализующих потоков позволяет получить полное распределение возможных значений с учетом неопределенности и вариабельности данных.
Михаил Гущин
«Одно из важных преимуществ нашего метода — это то, что он не требует детального знания внутреннего устройства компонентов системы. Часто это невозможно из-за коммерческой тайны производителей. Вместо этого генеративные модели обучаются непосредственно на реальных измерениях. В нашем исследовании, например, мы обучили модель на примере 300 000 измерений. Такой подход позволяет сделать метод универсальным и применимым к любым типам систем хранения данных», — рассказывает автор исследования Михаил Гущин, старший научный сотрудник факультета компьютерных наук НИУ ВШЭ.
Точность предложенного подхода исследователи проверили с помощью закона Литтла — фундаментального принципа теории массового обслуживания. Результаты тестов показали высокую степень соответствия предсказаний реальным наблюдениям: ошибки прогнозирования IOPS составляют всего 4–10%, а задержки — 3–16%, при этом корреляция с наблюдаемыми значениями достигает 0,99.
Азиз Темирханов
«Предложенный нами подход открывает широкие перспективы для оптимизации и планирования работы центров обработки данных. Он позволяет заранее предсказывать поведение системы при изменении нагрузки, выявлять потенциальные проблемы производительности, оптимизировать энергопотребление. Кроме того, для точного моделирования не нужно проводить дорогостоящие физические эксперименты», — отмечает Азиз Темирханов, младший научный сотрудник Научно-учебной лаборатории методов анализа больших данных.
Код экспериментов, а также данные измерений производительности системы хранения данных выложены в открытый доступ.
Исследование выполнено в рамках проекта «Зеркальные лаборатории» НИУ ВШЭ по теме «Повышение эффективности центров обработки данных и систем хранения данных методами искусственного интеллекта».
Вам также может быть интересно:
В Вышке создали собственную MLOps-платформу
Ученые НИУ ВШЭ создали MLOps-платформу SmartMLOps. Она предназначена для исследователей в области искусственного интеллекта, которые хотели бы превратить свое изобретение в полноценный сервис. В будущем на платформе могут быть развернуты ИИ-помощники для упрощения образовательного процесса, оказания медицинской помощи, консультирования и решения многих других задач. Создатели ИИ-технологий смогут получить готовый к работе сервис в течение считанных часов. На суперкомпьютере Вышки этот сервис может быть запущен в несколько кликов.
«От нашей общей работы зависит будущее»: что несет человечеству развитие ИИ
Какие перспективы и вызовы для человечества несет развитие технологий искусственного интеллекта? Как его используют ученые? Каким будет мир, где доминирует ИИ? Эти и другие темы обсудили эксперты на форсайт-сессии «Будущее исследований в сфере искусственного интеллекта», которая прошла в НИУ ВШЭ.
ИИ в образовании: как преодолеть соблазн готовых решений
Искусственный интеллект уже стал обыденностью для молодежи: как показал опрос, около 87% студентов ведущих вузов используют ИИ в процессе обучения. Большая часть из них отметила, что он помогает им экономить время, при этом они проверяют сделанную ИИ работу. Результаты исследования были представлены на конференции по анализу данных и технологиям ИИ Data Fusion. В ее работе приняли участие научный руководитель НИУ ВШЭ Ярослав Кузьминов и другие эксперты Вышки.
Большинство студентов не верят, что ИИ сможет заменить их на работе
Большинство студентов считают, что ИИ не сможет заменить их на работе в ближайшие десять лет. Низким такой риск называют 27,2% респондентов, 41,5% — крайне маловероятным. Эти оценки были получены НИУ ВШЭ в ходе опроса 4200 студентов в 2025 году. Они приводятся в докладе «Эпоха больших языковых моделей: почему они все еще не профессионалы», подготовленном научным руководителем НИУ ВШЭ Ярославом Кузьминовым и старшим преподавателем кафедры высшей математики НИУ ВШЭ Екатериной Кручинской. Доклад был представлен на XXV Ясинской (Апрельской) международной научной конференции по проблемам развития экономики и общества, которая проходит с 15 по 18 апреля в НИУ ВШЭ.
Точный ИИ-оракул: какие тренды интересуют бизнес
Современные технологии ежедневно меняют мир, автоматизируя бизнес-процессы в различных отраслях. Специалисты НИУ ВШЭ представили масштабный опыт команды iFORA по реализации ИИ-проектов в интересах крупных компаний и органов власти.
Перспективы ИИ: математика машинного обучения в фокусе
Институт искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ провел выездной воркшоп «Математика машинного обучения». Здесь собрались ведущие ученые и специалисты НИУ ВШЭ в области машинного обучения, математики и статистики. В центре внимания исследователей оказались математические аспекты, лежащие в основе современных и наиболее перспективных направлений машинного обучения. Программа воркшопа включала мини-курсы, практические работы, доклады и круглый стол, посвященный перспективам развития ИИ в России.
Внедрение искусственного интеллекта в организации: какие эффекты отмечают сотрудники
45% организаций, которые занимались внедрением ИИ в работу, заявили о повышении производительности труда в результате его использования. Об этом говорится в исследовании «Внедрение ИИ в работу организаций: чем обусловлена вариация эффектов на труд?». Исследование проведено директором Центра статистики труда и заработной платы ИСИЭЗ НИУ ВШЭ Анной Демьяновой и стажером-исследователем центра Дарьей Талакаускас. Оно было презентовано на XXV Ясинской (Апрельской) международной научной конференции по проблемам развития экономики и общества (XXV ЯМНК), проходящей в НИУ ВШЭ с 15 по 18 апреля.
«Идею всегда задает человек»: что дает ИИ образованию и медиа
ИИ-технологии меняют принципы работы образования и медиаиндустрии. Большинство студентов уже в той или иной мере используют ИИ, а нейросети уже массово производят все виды контента. Возможности и вызовы эксперты обсудили на конференции «Образование и медиа в эпоху цифровых перемен», организованной Дирекцией по маркетинговым коммуникациям НИУ ВШЭ и «Яндекс Образованием».
В Вышке стартовали открытые семинары «ИИ в индустрии»
Институт искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ запустил цикл открытых семинаров. Встречи посвящены актуальным вопросам внедрения искусственного интеллекта в различные отрасли экономики. Семинары проводятся еженедельно в 18:00 в кампусе на Покровском бульваре. Для участников также предусмотрена онлайн-трансляция.
Ученые представили новый метод для работы с несбалансированными данными
Специалисты факультета компьютерных наук НИУ ВШЭ и Лаборатории искусственного интеллекта Сбера разработали геометрический метод расширения данных — Simplicial SMOTE. Тесты на разных наборах данных показали, что он значительно улучшает качество работы AI. Метод особенно полезен в ситуациях, когда редкие случаи очень важны, например в борьбе с мошенничеством или при диагностике редких болезней. Результаты исследования доступны в открытом архиве Arxiv.org и будут представлены на Международной конференции по обнаружению знаний и анализу данных (KDD) летом 2025 года в Торонто.