В крупных компаниях, где весь код лежит в едином репозитории, очень важно уметь оперативно локализовать баг. Задача усложняется, когда отельные файлы состоят из сотен строк, а проблема выявляется на этапе End-to-End тестирования или в продакшене. В такой ситуации необходимо автоматическое решение, которое способно быстро найти ломающий коммит, несмотря на то, что сообщения об ошибке зачастую трудночитаемые и содержат большой объём информации.
На этом семинаре мы разберём статью от Facebook (https://arxiv.org/pdf/2010.09977.pdf), в которой авторы предлагают эффективный unsupervised алгоритм локализации бага к коммиту, использующий методы информационного поиска. Описанный алгоритм приспособлен к сложной информации из коммитов и сообщений об ошибке, и в настоящее время непосредственно используется в Facebook.
コメント