Человек ещё не вполне на ты с генетикой, но успехи последних лет позволяют делать выводы и прогнозы о повышенной вероятности негативных мутаций ДНК того или иного человека. Умение делать это — шаг в сторону умения парировать такие мутации. Но это в будущем, а пока есть и другие задачи.
Например, существует задача научиться прогнозировать вероятность негативных мутаций ДНК домашних и диких животных. Скажем, у домашних коров. А также у диких животных, чья популяция невелика — если у них вероятность негативных мутаций высокая, возможно, требуется какое-то внешнее воздействие для спасения вида.
Идея хорошая, вот только про генетику животных человек знает в разы меньше, чем про генетику человека. Что затрудняет применение к ней аналитических методов, разработанных для человека.
Учёные из санкт-петербургского Политеха предположили, что можно применить классические методы машинного обучения к прогнозированию негативных мутаций у коров, обучив алгоритм на обширных базах данных, существующих для людей. Поскольку для коров аналогичные массивы информации ещё не накоплены.
Для проверки навыков, полученных алгоритмом, его проверили на массивах данных о геномах собак и мышей, благо по ним у людей собрана кое-какая информация. Алгоритм, обученный на данных человеческих мутаций, справился с классификацией неплохо, раскидав изменения в ДНК собак и мышей по нужным категориям. Это означает, что принципы категоризации для разных животных имеют схожие черты, и алгоритм получился эффективным. Стало быть, с его помощью можно анализировать данных и других животных, хоть коров, хоть дальневосточных тигров, получая достоверные результаты.