Искусственный интеллект поможет в поиске новых частиц

Искусственный интеллект поможет в поиске новых частиц

Большой адронный коллайдер (БАК) каждую секунду сталкивает миллиард пар протонов. Иногда случается так, что несколько из этих столкновений могут породить что-то новое, чего ученые никогда раньше не видели. Поскольку эти события по своей природе сложно предугадать, физики не знают точно, что искать. Они беспокоятся, что в процессе отсеивания полученных данных от этих миллиардов столкновений они могут случайно удалить доказательства новых физических феноменов.

Столкнувшись с проблемой интеллектуальной выборки и сокращения данных, некоторые физики пытаются использовать технику машинного обучения, называемую “глубокой нейронной сетью”. В классических случаях глубокая нейронная сеть учится распознавать изображения, например, отличать кошек от собак, изучая стопку фотографий с надписью “кошка” и стопку с надписью “собака”. Но этот подход не будет работать при поиске новых частиц, так как физики не могут скормить машине фотографии чего-то такого, что они никогда не видели. Таким образом, они обращаются к “слабо контролируемому обучению”, когда машины начинают с известных частиц, а затем ищут редкие события с использованием менее подробной информации, например, как часто эти события могут происходить в целом.

В документе, опубликованном в мае на сайте научных препринтов arxiv.org, три исследователя предложили применить соответствующую стратегию, чтобы расширить классическую технику поиска новых частиц, которая обнаружила бозон Хиггса. Общая идея, по словам одного из авторов, Бен Нахмана, исследователя Национальной лаборатории Лоуренса, заключается в том, чтобы обучить машину поиску редких изменений в наборе данных.

Традиционные поиски в физике частиц обычно требуют от исследователей предположения о том, как будут выглядеть новые явления. Они создают модель поведения новых частиц – например, как новая частица может распадаться на группы известных частиц. Только после того, как они определят, что они ищут, они могут разработать стратегию поиска. Это задача, которая обычно занимает аспиранта по крайней мере год, но эту задачу, по мнению Нахмана, можно выполнить намного быстрее и тщательнее.

Предлагаемый алгоритм CWoLa (Classification Without Labels), который расшифровывается как классификация без меток, может искать существующие данные для любой неизвестной частицы, которая распадается на две более легкие неизвестные частицы одного и того же типа или две известные частицы разных типов. Используя обычные методы поиска, исследователям БАК потребовалось бы на это не менее 20 лет. Бен Нахман утверждает, что CWoLa может сделать такой анализ за один раз.

Методы машинного обучения успешно повысили эффективность некоторых задач на БАК, таких как идентификация “струй”, создаваемых кварками. Есть надежда, что нейронные сети смогут улавливать тонкие корреляции в данных, которые сложно моделировать.

Источник: quantamagazine.org