Голосовые помощники становятся похожи на людей, а сотрудники call-центров — на роботов

Автор фото: Рисунок Александра Сергеева
Помните? "Автоответчики, на мой взгляд, из числа тех изобретений, что делают жизнь неприятной в мелочах. Скажите честно — вы любите, когда вам отвечает машина? Но то, что произошло со мной, это уже не просто мелкая неприятность: автоматическая наборная машина только что позвонила мне сама!" Это цитата из повести американского фантаста Джона Варли "Нажмите "Ввод", которая в 1984–1985 годах собрала целую гроздь разнообразных литературных премий. С чуть подкорректированной лексикой она вполне уместно смотрелась бы в современных соцсетях, где пользователи наперебой делятся лайфхаками — как избежать нежелательных звонков по телефону и как добиться от голосового помощника, чтобы он поскорее соединил тебя с живым оператором.

Не ждите чудес

Разработкой голосовых роботов сегодня занимаются как гиганты типа "Яндекса", так и небольшие стартапы. Вложения в них довольно быстро окупаются за счет зарплат сотрудников call–центров. Тинькофф Банк, к примеру, осенью 2019–го рапортовал о том, что его голосовой помощник "Олег" отбился всего за месяц.
Обратная сторона медали — недовольство пользователей, у которых не получается добиться от голосовых помощников в контакт–центрах нужного результата. Поискав, в интернете несложно найти тучу аудиозаписей уморительных диалогов в духе бессмертного видео про шотландцев в лифте с голосовым управлением. Для горцев непреодолимым препятствием было произношение слова eleven (одиннадцать) без акцента.
Клиентам российских банков приходится еще сложнее. В результате, услышав в десятый раз от робота отстраненно–вежливое "кажется, я вас не понимаю", пользователь срывается на ругань или просто отключается. А в следующий раз лишь повторяет как заведенный: "Соединить с оператором. Соединить с оператором".
Заведующий лабораторией нейронных систем и глубокого обучения МФТИ, руководитель проекта iPavlov, занимающегося разработкой речевых решений (в том числе и для Сбербанка), Михаил Бурцев считает, что все дело в завышенных ожиданиях: "Люди ожидают, что голосовой помощник должен быть таким же, как человек. А он далеко не такой умный. Но он совершенно точно способен решить определенный круг задач. Наверное, все же проще 5 минут поговорить с роботом, пусть даже не очень умным, и решить свою проблему, чем 20 минут висеть на линии, ожидая ответа оператора".
По мнению эксперта, коммуникация в роботизированных call–центрах должна быть выстроена таким образом, чтобы дозвонившийся человек сразу четко понимал, чем робот ему может помочь, а чем нет.
"Роботов начали внедрять рано, как только они появились. И порой внедряли очень глупые алгоритмы, которые не могли ответить ни на какие вопросы. Сейчас они лучше, но люди, помня свой неудачный опыт, уверены, что робот не может решить никакую проблему. Хотя они могут это сделать зачастую лучше человека. Рано или поздно человек перестанет понимать, с роботом он говорит или с человеком. И это случится в пределах 5 лет", — уверен создатель успешного HR–проекта "Робот Вера" Владимир Свешников.
С этим солидарен президент Российской ассоциации нейроинформатики Сергей Шумский: "Конечно, голосовые помощники пока еще очень примитивные. Но уже есть модели генерации текстов, практически неотличимые от человеческих, например алгоритм GPT–3. Прорывы обязательно будут, но трудно прогнозировать их по времени. Кадры у нас есть, но финансирование на порядки меньше, чем на Западе. Будем стараться не отстать".

Золотая середина

"Есть две задачи: сделать так, чтобы голос робота был неотличим от голоса настоящего человека, и вторая — чтобы робот мог вести нормальный диалог. Мы сейчас больше сконцентрировались на первой, потому что столкнулись с проблемой — люди просто не слушают. Хотя мы же не со спамом звоним. Часто людям нужен этот звонок. Но услышав голос робота, они сразу сбрасывают", — описывает проблемы современных голосовых помощников Владимир Свешников.
Сейчас команда "Робота Веры" работает над проектом VeraVoice, в рамках которого добилась достаточно точного синтеза голосов около 20 российских и зарубежных знаменитостей. С построением диалога все обстоит несколько сложнее. Владимир Свешников считает, что для нормальной работы даже большого call–центра достаточно иметь проработанное "дерево" из 3–4 тыс. фраз. Другое дело, что сделать эти фразы нормальными для человеческого уха не так просто. Даже когда их пишет человек, они получаются слишком наигранными и неестественными, как в плохих сериалах. Сама же машина сгенерировать живую речь не может тем более.
"Современные самообучающиеся нейросети работают по такому принципу: у них есть некий входящий запрос, есть исходящий результат, к которому нужно прийти. И они разными путями к нему двигаются. А то, что посередине, им по большому счету не очень важно. Зато это важно живому человеку. И если “в середине” что–то идет не так, это, конечно, раздражает клиента", — поясняет генеральный директор компании "Нейроматикс" Владимир Статут.

Скрипты для бариста

Парадокс в том, что оказаться в ситуации "разговора с роботом" можно без всяких голосовых помощников и умных колонок. Линейный персонал неавтоматизированных call–центров, крупных магазинов или рекрутинговых агентств, как правило, работает по строгим скриптам, отклоняться от которых нельзя под страхом увольнения. И живого общения не получается, даже если вы стоите лицом к лицу и разделяют вас только прозрачный экран и эпидемиологически корректные маски на лице.
"Когда звонков очень много, то скрипты нужны. Время от времени мы привлекаем к работе разные call–центры для массового подбора персонала. И всегда смотрим, какие скрипты они используют. Call–центры сейчас активно выносятся в регионы, где работают люди, не имеющие особого представления о специфике работы на производстве или в IT, например. Пользуясь скриптом, они могут собрать нужную информацию, задать правильные вопросы. Для нас это экономит время, так мы отфильтровываем порядка 70% “холодных” звонков. Но всегда просим, чтобы скрипт был коротким. Тогда результат будет более очевидным. А если будет длинным, то, скорее всего, это вызовет раздражение", — рассказывает менеджер по развитию бизнеса консалтинговой компании Coleman Services Алексей Карпов.
Увы, но скрипты проникают и в те сферы, где им, казалось бы, не место. Кто из нас не попадал в ситуацию, когда в кофейне, где ты регулярно покупаешь свой капучино по пути на работу, бариста, прекрасно знающий тебя в лицо, ежедневно задает один и тот же набор вопросов про молоко, сахар, печенье и так далее? По мнению Алексея Карпова, одно из объяснений этому — большая текучка кадров, а также в целом низкий уровень сервиса, который, увы, пока что свойствен для российской сферы обслуживания.
С тем, что полностью заменить индивидуальный подход скриптами общения и роботами не удастся, согласна управляющий партнер кадровой компании AVRIO Group Consulting Светлана Катаева. "Я за технологии, за скрипты, но с человеческим лицом, — поясняет она. — К сожалению, “чувствительности” к ситуации, проявлению эмпатии, умению и пониманию, когда уместно отходить от скриптов, а когда просто необходимо, чтобы не потерять клиента, обучают не многие компании. Важно обучать людей гибкости, вариативности, навыкам слушать собеседника и уметь менять разговор, не бояться отходить от скриптов, если того требует ситуация. Чаще этого и не хватает крупным компаниям".