09.10.2020

Как ученые определяют COVID-19 и другие болезни по голосу

Исследователи изучают способы использования голоса людей для диагностики деменции, депрессии и даже COVID-19!

Израильская компания Vocalis Health по анализу голоса ранее создала приложение для смартфонов, которое могло обнаруживать обострения хронической обструктивной болезни легких, улавливая признаки того, что у пользователей возникает одышка во время разговора. Фирма решила сделать то же самое с COVID-19. Людей с положительным результатом теста на коронавирус попросили раз в день запускать приложение Vocalis и говорить в свои телефоны, описывая вслух окружающие предметы и считая от 50 до 70.

Затем Vocalis начал обрабатывать эти записи с помощью своей системы машинного обучения вместе с голосами здоровых людей, в попытке определить отпечаток голоса для болезни. К середине лета у фирмы было более 1500 образцов голоса и пилотная версия цифрового инструмента для выявления COVID-19. Инструмент, который компания в настоящее время тестирует по всему миру, предназначен не для постановки окончательного диагноза, а для помощи клиницистам в сортировке потенциальных случаев, выявлении людей, которые могут больше всего нуждаться в тестировании, карантине или медицинской помощи.

Vocalis не единственная компания, которая пытается найти голосовые биомаркеры COVID-19 – как минимум три исследовательские группы работают над аналогичными проектами. Другие команды анализируют аудиозаписи кашля больных COVID-19 и разрабатывают алгоритмы анализа голоса, предназначенные для определения того, носит ли человек маску для лица.

Эти системы могут однажды позволить эпидемиологам использовать смартфоны для отслеживания распространения болезней и превратить умные динамики в домашние медицинские устройства. Вполне возможно, что в скором будущем ваша Siri или Alexa просто скажут: «О, вы простудились! Я немедленно запишу вас к врачу!»

Речевые сигналы о психическом здоровье

За последнее десятилетие ученые использовали искусственный интеллект (ИИ) и системы машинного обучения для выявления потенциальных голосовых биомаркеров широкого спектра состояний, включая слабоумие, депрессию, расстройство аутистического спектра и даже болезни сердца. Разработанные ими технологии способны определить тонкие различия в том, как говорят люди с определенными заболеваниями.

Разговор требует согласования множества анатомических структур и систем. Легкие посылают воздух через голосовые связки, производящие звуки, которые формируются языком, губами и носовыми полостями, а также другими структурами. Мозг вместе с прочими частями нервной системы помогает регулировать все эти процессы и определять слова, которые кто-то произносит. Заболевание, поражающее любую из этих систем, может оставлять диагностические подсказки в речи человека.

Теперь исследователи могут вводить в компьютер сотни или тысячи образцов голоса для поиска признаков, которые отличают людей с различными заболеваниями от людей без них.

Большая часть ранних работ в этой области была сосредоточена на болезни Паркинсона, которая оказывает хорошо известное влияние на речь и для которой не существует окончательного диагностического теста. Расстройство вызывает множество двигательных симптомов, включая тремор, ригидность мышц и проблемы с равновесием и координацией. Потеря контроля распространяется на мышцы, участвующие в речи; в результате у многих людей с болезнью Паркинсона слабые, мягкие голоса.

Более десяти лет назад Макс Литтл, исследователь машинного обучения и обработки сигналов в Университете Бирмингема (Великобритания), начал исследовать, может ли анализ голоса помочь врачам в постановке сложных диагнозов. В одном исследовании Литтл и его коллеги использовали аудиозаписи 43 взрослых, 33 из которых страдали болезнью Паркинсона. Эти люди просто произносили звук «а-а-а-а». Ученые использовали алгоритмы обработки речи для анализа акустических характеристик каждой записи, включая такие, как одышка и колебания высоты тона и тембра, которые наиболее предсказуемы для болезни Паркинсона. Таким образом система могла идентифицировать образцы речи, полученные от людей с этим заболеванием, с точностью почти в 99%!

В настоящее время исследователи работают над определением биомаркеров речи для других видов нейродегенеративных заболеваний. Например, ученые из Торонто (Канада) использовали образцы голоса и расшифровки стенограмм более 250 человек, чтобы выявить десятки различий между речью людей с возможной болезнью Альцгеймера, основываясь не на акустических характеристиках, а на содержании речи. Страдающие этим заболеванием, как правило, имели меньший словарный запас, использовали более короткие слова и больше фрагментов предложений. Они также часто повторялись и использовали местоимения, такие как «это», так как забывали названия вещей. Система смогла идентифицировать людей с болезнью Альцгеймера с точностью в 92%.

Поскольку некоторые из этих голосовых изменений происходят на ранних стадиях нейродегенеративных заболеваний, исследователи надеются, что инструменты голосового анализа могут в конечном итоге помочь клиницистам диагностировать такие состояния раньше и начать лечение до того, как другие симптомы станут очевидными.

Что о здоровье расскажет детский лепет

Нейродегенеративные расстройства – это только начало. Ученые определили четкие модели речи у детей с нарушениями психического развития. В одном небольшом исследовании 2017 года Бьорн Шуллер, специалист по распознаванию речи и эмоций из Имперского колледжа Лондона, и его коллеги определили, что алгоритмы, анализирующие лепет десятимесячных младенцев, могут с некоторой точностью определять, у каких детей в дальнейшем будет диагностировано расстройство аутистического спектра. Система правильно классифицировала примерно 80% детей с аутизмом и 70% нейротипичных детей.

Исследователи также обнаружили, что многие дети с синдромом дефицита внимания и гиперактивности говорят громче и быстрее, чем их сверстники, и проявляют больше признаков речевого напряжения. Фирма PeakProfiling в Берлине в настоящее время разрабатывает инструмент для клинического анализа речи, который может помочь врачам в диагностике этого состояния.

Диагностика будущего

Однако автоматизированный голосовой анализ – все еще новая область, в которой есть ряд потенциальных ловушек, от ошибочных диагнозов до вторжения в личную и медицинскую конфиденциальность. Многие исследования остаются небольшими и предварительными, врачи скептически относятся к тому, сколько полезной информации действительно могут предоставить такие системы, и поэтому перейти от проверки концепции к широко применяемому продукту будет непросто.

Ученым по-прежнему необходимо проводить большие долгосрочные продольные исследования, чтобы продемонстрировать, что анализ голоса действительно может обнаружить болезнь раньше, чем стандартные методы диагностики.

Исследователи в этой области подчеркивают, что цель не в замене врачей или создании автономных диагностических устройств. Вместо этого они рассматривают голосовой анализ как инструмент, который врачи могут использовать для принятия решений, как еще один «жизненно важный тест».

Подробнее

Как ученые определяют COVID-19 и другие болезни по голосу

ТОП-статьи

Мнение специалиста

Читают также

Случайная статья