Что может телефон узнать о вас по звуку голоса?

Что может телефон узнать о вас по звуку голоса?

Подавляющее большинство людей в развитых странах теперь повсюду используют смартфоны. И хотя многие из нас уже хорошо знакомы с проблемами конфиденциальности, связанные со смартфонами, например отслеживание наших передвижений или даже возможностью делать тайные фотографии, все большее число людей начинают беспокоиться о том, что их смартфон действительно слушает все, что они говорят.

Возможно, это не имеет веских доказательств, но это не далеко от истины. Исследователи во всем мире начали разрабатывать множество типов мощных аудиоанализов, основанных на алгоритмах искусственного интеллекта (ИИ) и машинном обучении, которые могут извлекать много информации о нас только из звука. Хотя эта технология только начинает появляться, но растущие возможности в сочетании с ее присутствием 24/7 могут иметь серьезные последствия для нашей личной конфиденциальности.

Вместо анализа каждого слова, произносимого человеком, искусственный интеллект может извлечь огромное количество личной информации только лишь из звука нашей речи. Он может определить все, начиная от того, кто вы и откуда вы пришли, ваше текущее местоположение, пол и возраст, на каком языке вы говорите – и все эти данные только из мелодии вашего голоса!

Если вы еще не напуганы, хорошо – другие аудиоанализаторы могут определить, лжете ли вы, анализировать уровень вашего здоровья и текущее эмоциональное состояние. Существуют даже системы, способные обнаруживать, что вы едите, когда говорите с полным ртом, а также ведутся исследования, изучающие возможности диагностики заболеваний на основании звука голоса.

Системы ИИ также могут точно интерпретировать события из деталей фонового шума – например, аварии или выстрелы. Другая система ИИ, разработанная в прошлом году, может предсказать останется ли пара вместе, просто слушая тон, используемый при разговоре друг с другом. Все это примеры современных технологий ИИ, разработанных в исследовательских лабораториях по всему миру.

Все эти технологии, независимо от того, что они пытаются узнать о вас, – используют машинное обучение. Это включает в себя обучение нейронных сетей на огромных объемах данных, промаркированных соответствующим типом интерпретируемой информации или события. Обработав тысячи или миллионы записей, алгоритм постепенно начинает определять, какие характеристики данных – часто просто крошечные колебания в звуке – связаны с метками.

Например, система, которая может определить ваш пол, будет записывать речь с вашего смартфона и обрабатывать ее для извлечения небольшого набора различных значений, которые компактно представляют большую речевую запись. Как правило, этот набор значений представляет информацию об амплитуде и частоте в каждом 20-миллисекундном периоде речи (“кадре”). По их изменению друг относительно друга на определенном отрезке времени можно судить о принадлежности к мужской или женской речи.

Общая схема машинного обучения и классификации признаков (Автор: профессор компьютерных наук Ian McLoughlin)

Системы машинного обучения могут анализировать не только эти “кадры”, но и их динамику и последовательность во времени. Пока запись происходит в самом смартфоне, “кадры” отправляются на интернет-серверы, которые будут заниматься непосредственно извлечением данных, вычислением статистики и переобучением ИИ.

Искусственный интеллект был впервые создан для выполнения концептуальных задач, обычно требующих человеческого интеллекта. В настоящее время большинство систем ИИ выполняют анализ и извлечение данных из различного материала, распознавание и определение которых помогает и значительно расширяет возможности людей.

Например, аудиосистемы ИИ для мониторинга дорожного движения могут предупреждать диспетчера о ДТП по звуку аварии, а аудио-диагностический ИИ-комплекс может сообщить врачу о выявленной патологии. Но человеку все равно придется самому принимать решение на основе информации, предоставленной им искусственным интеллектом (Пока. И это хорошо! Прим.ред.)

Но новые технологии ИИ продолжают развиваться и возможности многих систем ИИ начинают превышать человеческие, а некоторые устройства даже способны действовать без вмешательства человека. Amazon Echo и Google Home – тому пример, у которых есть даже зачатки “мыслительных способностей”. Этот тип ИИ может реагировать на команды напрямую и также может действовать на их основании.

Большинство фирм-производителей электронных гаджетов заявляют, что их устройства не записывают нас, если мы сами не даем на то разрешение. Но были примеры того, как виртуальный ассистент от Amazon – Alexa делала аудиозаписи “по ошибке“. К сожалению, это только вопрос времени, прежде чем рекламодатели и мошенники начнут использовать эту технологию, чтобы получить всю информацию о нас.

Источник: techxplore.com

Фото: AllTechAsia.com