Как ученые определяют COVID-19 и другие болезни по голосу
Исследователи изучают способы использования голоса людей для диагностики деменции, депрессии и даже COVID-19!
Израильская компания Vocalis Health по анализу голоса ранее создала приложение для смартфонов, которое могло обнаруживать обострения хронической обструктивной болезни легких, улавливая признаки того, что у пользователей возникает одышка во время разговора. Фирма решила сделать то же самое с COVID-19. Людей с положительным результатом теста на коронавирус попросили раз в день запускать приложение Vocalis и говорить в свои телефоны, описывая вслух окружающие предметы и считая от 50 до 70.
Затем Vocalis начал обрабатывать эти записи с помощью своей системы машинного обучения вместе с голосами здоровых людей, в попытке определить отпечаток голоса для болезни. К середине лета у фирмы было более 1500 образцов голоса и пилотная версия цифрового инструмента для выявления COVID-19. Инструмент, который компания в настоящее время тестирует по всему миру, предназначен не для постановки окончательного диагноза, а для помощи клиницистам в сортировке потенциальных случаев, выявлении людей, которые могут больше всего нуждаться в тестировании, карантине или медицинской помощи.
Vocalis не единственная компания, которая пытается найти голосовые биомаркеры COVID-19 – как минимум три исследовательские группы работают над аналогичными проектами. Другие команды анализируют аудиозаписи кашля больных COVID-19 и разрабатывают алгоритмы анализа голоса, предназначенные для определения того, носит ли человек маску для лица.
Эти системы могут однажды позволить эпидемиологам использовать смартфоны для отслеживания распространения болезней и превратить умные динамики в домашние медицинские устройства. Вполне возможно, что в скором будущем ваша Siri или Alexa просто скажут: «О, вы простудились! Я немедленно запишу вас к врачу!»
Речевые сигналы о психическом здоровье
За последнее десятилетие ученые использовали искусственный интеллект (ИИ) и системы машинного обучения для выявления потенциальных голосовых биомаркеров широкого спектра состояний, включая слабоумие, депрессию, расстройство аутистического спектра и даже болезни сердца. Разработанные ими технологии способны определить тонкие различия в том, как говорят люди с определенными заболеваниями.
Разговор требует согласования множества анатомических структур и систем. Легкие посылают воздух через голосовые связки, производящие звуки, которые формируются языком, губами и носовыми полостями, а также другими структурами. Мозг вместе с прочими частями нервной системы помогает регулировать все эти процессы и определять слова, которые кто-то произносит. Заболевание, поражающее любую из этих систем, может оставлять диагностические подсказки в речи человека.
Теперь исследователи могут вводить в компьютер сотни или тысячи образцов голоса для поиска признаков, которые отличают людей с различными заболеваниями от людей без них.
Большая часть ранних работ в этой области была сосредоточена на болезни Паркинсона, которая оказывает хорошо известное влияние на речь и для которой не существует окончательного диагностического теста. Расстройство вызывает множество двигательных симптомов, включая тремор, ригидность мышц и проблемы с равновесием и координацией. Потеря контроля распространяется на мышцы, участвующие в речи; в результате у многих людей с болезнью Паркинсона слабые, мягкие голоса.
Более десяти лет назад Макс Литтл, исследователь машинного обучения и обработки сигналов в Университете Бирмингема (Великобритания), начал исследовать, может ли анализ голоса помочь врачам в постановке сложных диагнозов. В одном исследовании Литтл и его коллеги использовали аудиозаписи 43 взрослых, 33 из которых страдали болезнью Паркинсона. Эти люди просто произносили звук «а-а-а-а». Ученые использовали алгоритмы обработки речи для анализа акустических характеристик каждой записи, включая такие, как одышка и колебания высоты тона и тембра, которые наиболее предсказуемы для болезни Паркинсона. Таким образом система могла идентифицировать образцы речи, полученные от людей с этим заболеванием, с точностью почти в 99%!
В настоящее время исследователи работают над определением биомаркеров речи для других видов нейродегенеративных заболеваний. Например, ученые из Торонто (Канада) использовали образцы голоса и расшифровки стенограмм более 250 человек, чтобы выявить десятки различий между речью людей с возможной болезнью Альцгеймера, основываясь не на акустических характеристиках, а на содержании речи. Страдающие этим заболеванием, как правило, имели меньший словарный запас, использовали более короткие слова и больше фрагментов предложений. Они также часто повторялись и использовали местоимения, такие как «это», так как забывали названия вещей. Система смогла идентифицировать людей с болезнью Альцгеймера с точностью в 92%.
Поскольку некоторые из этих голосовых изменений происходят на ранних стадиях нейродегенеративных заболеваний, исследователи надеются, что инструменты голосового анализа могут в конечном итоге помочь клиницистам диагностировать такие состояния раньше и начать лечение до того, как другие симптомы станут очевидными.
Что о здоровье расскажет детский лепет
Нейродегенеративные расстройства – это только начало. Ученые определили четкие модели речи у детей с нарушениями психического развития. В одном небольшом исследовании 2017 года Бьорн Шуллер, специалист по распознаванию речи и эмоций из Имперского колледжа Лондона, и его коллеги определили, что алгоритмы, анализирующие лепет десятимесячных младенцев, могут с некоторой точностью определять, у каких детей в дальнейшем будет диагностировано расстройство аутистического спектра. Система правильно классифицировала примерно 80% детей с аутизмом и 70% нейротипичных детей.
Исследователи также обнаружили, что многие дети с синдромом дефицита внимания и гиперактивности говорят громче и быстрее, чем их сверстники, и проявляют больше признаков речевого напряжения. Фирма PeakProfiling в Берлине в настоящее время разрабатывает инструмент для клинического анализа речи, который может помочь врачам в диагностике этого состояния.
Диагностика будущего
Однако автоматизированный голосовой анализ – все еще новая область, в которой есть ряд потенциальных ловушек, от ошибочных диагнозов до вторжения в личную и медицинскую конфиденциальность. Многие исследования остаются небольшими и предварительными, врачи скептически относятся к тому, сколько полезной информации действительно могут предоставить такие системы, и поэтому перейти от проверки концепции к широко применяемому продукту будет непросто.
Ученым по-прежнему необходимо проводить большие долгосрочные продольные исследования, чтобы продемонстрировать, что анализ голоса действительно может обнаружить болезнь раньше, чем стандартные методы диагностики.
Исследователи в этой области подчеркивают, что цель не в замене врачей или создании автономных диагностических устройств. Вместо этого они рассматривают голосовой анализ как инструмент, который врачи могут использовать для принятия решений, как еще один «жизненно важный тест».
Мнение специалиста