Новое программное обеспечение провело мета-анализ давно забытых неврологических исследований — и с помощью топологического анализа данных сумело выявить закономерности, которые заинтересовали специалистов.
Материалом для мета-анализа стали результаты исследований, которые списали как бесполезные 20 лет назад. Ведь в то время не существовало продвинутых систем машинного обучения, какую сейчас предоставила компания Ayasdi для Калифорнийского университета в Сан-Франциско, где работу ведёт группа неврологов и статистиков. Функциональность программы описана в научной статье, опубликованной вчера в журнале Nature Communications.
«Что казалось бессмыслицей, оказалось очень ценной информацией», — говорит Адам Фергюсон (Adam Ferguson), ведущий исследователь центра Brain and Spinal Injury в Калифорнийском университете в Сан-Франциско, один из авторов научной статьи. Насколько высока ценность этой информации, ещё предстоит изучить в результате клинических испытаний, но история уже поднимает ряд интересных вопросов. Например, есть ли смысл проводить новые клинические испытания, если можно заново проанализировать результаты старых. И ещё: следует ли публиковать в открытом доступе сырые данные от «неудачных» исследований даже в том случае, если их результатом не стала научная статья или какое-то открытие.
Повреждения спинного мозга — одна из областей медицины, которая практически не развивается. В этой области уже 20 лет не было значительных открытий. Травмы позвоночника слишком сложны и поэтому в них сложнее разобраться, чем в других системах. Исследователи решили ещё раз подвергнуть анализу массив старых архивных данных в поисках каких-то скрытых взаимосвязей.
Для этого использовали топологический анализ данных — технику, которая применяет концепции геометрической топологии для поиска скрытых паттернов в больших наборах данных. Программа нашла много закономерностей, большинство из них были известны медикам, в том числе неэффективность различных лекарств. Однако вредное влияние высокого давления на долговременное выздоровление пациента — такого никто не знал.
Неврологи говорят, что вряд ли смогли бы обнаружить такую закономерность обычными методами, без применения дата-майнинга. Слишком много переменных необходимо учитывать.
Изобретатель топологического анализа данных — стэнфордский математик Гуннар Карлссон (Gunnar Carlsson), соавтор научной работы. Он же сейчас президент компании Ayasdi, которую основал для одновременного использования технологий топологического анализа данных и машинного обучения. Софт Ayasdi анализирует данные без человеческого участия, не требует выдвижения теорий или направления работы.
До спинного мозга техника топологического анализа данных совершила ещё одно медицинское открытие: она помогла обнаружить уникальную мутацию рака молочной железы, при которой наблюдается высокая выживаемость.