— Чем хороший бот отличается от плохого?

— Знаете, что такое плохой UI (user interface, интерфейс пользователя)?  Это как анекдот: если его приходится объяснять, то он плохой. Тем не менее на заре интернета (и вообще IT) поставщики контента и услуг старались предоставить своим пользователям как можно более навороченные интерфейсы. Анимация, немыслимые (и уникальные!) интерфейсы с участием как встроенных, так и требуемых к установке плагинов превращали пользователя в оператора звездолета.

 

В романе «Автостопом по Галактике» Дугласа Адамса на звездолете был не безотказный автомат-слуга, а забавный, временами впадающий в депрессию робот Марвин. Азимов и другие писали и об этических проблемах, связанных с роботами. Читатели воспринимают это как игру; современный пользователь хочет играть, и современные бот-сервисы, если их создатели хотят быть конкурентоспособными, должны удовлетворять эту потребность.

 

Социальные сети не только связали пользователей друг с другом, но также унифицировали интерфейс, выступили агрегаторами  и рекомендательными системами, и к  2015 году «захватили»  более 25% общего трафика.  При этом в том же 2015-м российский мобильный трафик, приходящийся на социальные сети и мессенджеры, превысил трафик, приходящийся на поисковые системы (23% против 20%).

В марте Yandex проводил хакатон, на котором было создано 14 наиболее продвинутых финансовых ботов. Сегодня  даже победитель хакатона UncleBot «мертв».

Тренд на избавление пользователя от изучения выдуманных и часто  не  совсем «здоровых» интерфейсных решений в 2015–2016 годах увеличил интерес к предоставлению услуг через бот-системы, доступ к которым пользователь получает через ставшие ему привычными мессенджеры. Тем не менее существующие в настоящее время на рынке боты по большей части неинтересны. В марте 2016 года Yandex проводил хакатон, на котором было создано 14 наиболее продвинутых финансовых ботов. Сейчас, в августе, мы проверили эти боты на живучесть. Даже победитель хакатона UncleBot — «мертв».

Несколько других ботов живы, но их функциональность четко ограничена несколькими командами. Видимо, как разработчикам, так и бизнесу такой подход к ботостроительству оказался скучен. В русскоязычной части интернета появилось небольшое количество ботов, предоставляемых легальными бизнесами. Появилось несколько компаний, производящих «инфов» ботов, обслуживающих сайты, работающие как служба поддержки.

— Какие кейсы создания ботов из мировой практики кажутся вам наиболее интересными?

— В последние годы появились средства и математические методы для разработки более умных (но и непредсказуемых) ботов. Вместо четких правил — нейронные сети (RNN, как вариант), Deep Learning, анализ больших данных. Компания Microsoft в прошлом году запустила проект Tau, с самообучением через Twitter.

Насколько мне известно, в основе проекта — seq-2-seq обучение и различные методики NLP (natural language processing).  Хакеры и тролли очень быстро обучили Tau нацистской идеологии, и «истинного арийца Tau» пришлось казнить. Взамен был запущен бот Xiaoice, на китайском языке для азиатского рынка. В настоящее время в Xiaoice  20 млн пользователей.

— Какой вывод можно сделать из этого неудачного эксперимента?

— Вывод, который мы сделали: бот должен быть построен на основе какого-то реального персонажа. Мы проанализировали сложности в создании и раскрутке подобных ботов, и выявили несколько интересных деталей:

  1. Сложно сделать полностью искусственного бота, с нуля. Бот должен хотя бы на начальном этапе иметь какую-то идентичность.
  2. Создание правил для бота является нужным для бизнеса, но очень трудоемким делом. Интересный бот должен работать как с правилами (в интересах бизнеса), так и обладать «свободой».
  3. Ошибка лучше пустоты. Иногда — гораздо лучше.
  4. Чувство юмора. Оно должно присутствовать.
  5. Хорошо, когда у бота есть «мнение».

Digital_Gref: чат-бот ответит на вопросы почти как Герман Греф В преддверии ПМЭФа в мессенджере Telegram появится чат-бот, имитирующий манеру общения и лексикон главы Сбербанка Германа Грефа.

— Расскажите о создании digital_Gref-бота, который вы выпустили к Петербургскому международному экономическому форуму.

— Первая версия нашей бот-платформы содержала базу знаний из речей президента одной страны (не будем ее называть), библейских текстов и цитатника сериала «Футурама» (любимый сериал команды). Внутри была пачка интересных кастомизированных  алгоритмов, нейронная сеть, NLP.  Этот бот просуществовал совсем недолго и по понятным причинам его пришлось выключить.

Чуть позже возникла идея сделать бота с идентичностью Германа Грефа, и это был лучший вариант на тот момент. Прототип многое знает о  политике и экономике, при этом особенно ни с кем не конфликтует. Соответственно, мы не могли «попасть» на судебные иски и агрессивную реакцию не согласных с нами пользователей. Так появился Telegram-bot digital_Gref.

Бот умеет «дообучаться» на внешних источниках, умеет считать, вычислять производные и даже делить на ноль. В этом он, пожалуй, лучше своего прототипа

Мы постарались сделать его максимально независимым от языка, поскольку планируем ту же платформу использовать на англоязычной аудитории. Бот умеет «дообучаться» на внешних источниках, и мы контролируем эти источники, чтобы не повторить судьбу Tau. Он знает анекдоты, умеет считать, вычислять производные и даже делить на ноль. В этом он, пожалуй, лучше своего прототипа.

Бот был в бета-режиме запущен совсем недавно, тем не менее у нас уже около 700 пользователей. Медианный чат увеличился с четырех-пяти фраз до более чем двух десятков.

Мы понимаем, что не имеем права именно в этого бота добавлять бизнес-составляющую. Тем не менее на основе его работы мы:

  1. Знаем очень много о Сбербанке: почему-то сотрудники Сбербанка начали жаловаться боту на свою жизнь! Наверное, это нарушение NDA, но «палить» своих пользователей мы не будем.
  2. Общаясь с ботом, можно узнать мнение «прототипа» о многих темах, его реакцию, и она должна быть похожа на реакцию реального человека. Это может быть полезным.
  3. Пользователи -женщины гораздо интереснее мужчин, среди которых очень много тех, кто пытается общаться «поисковыми запросами» или просто хамить. Среди мужчин таких, пожалуй, около 20%. Среди женщин — ноль!

— Как вы планируете развивать проект?

— Безусловно, этот проект еще не идеален, и у нас нет цели сделать именно этого бота идеальным.  В ближайших планах — переключиться на более цитируемых, в том числе англоязычных, персонажей, с различными формами монетизации продукта. Например, на героев сериала «Симпсоны», «Друзья», «Кремниевая долина» или даже «Секс в большом городе».

— Digital_Gref имел успех. Как, по-вашему, сделать бота, с которым будет интересно разговаривать?

— Конкурентоспособный робот или бот должен быть забавным. Роботы из фантастических романов — это не только инструменты для выполнения каких-то работ, но устройства с характером, со своим настроением, личными особенностями. Да, современный робот-пылесос должен пылесосить, и желательно хорошо. Но если вы попробуете набрать в Google «Робот-пылесос и...» — вы увидите подсказку: «робот-пылесос и кот видео», «робот-пылесос и собака» и так далее. Пользователей интересуют забавные случаи, а не только мощность, с которой робот умеет сосать.

На практике создать такого бота не так просто: он должен уметь извлекать информацию из вопросов пользователя (понимать ее), иметь собственную базу знаний, источники обновляемой информации.

 

Для простейшего описания «умных» ботов в 2001 году был разработан AIML (Artificial Intelligence Markup Language), последний релиз которого (1.0.1) вышел в 2011 году. Современный AIML включает в себя категории, паттерны и шаблоны, позволяющие описать реакцию бота на вопросы пользователя. Пожалуй, самый интересный проект, построенный с помощью AIML, — бот ALICE.

— Есть ли сейчас на российском рынке боты, дотягивающие до этого стандарта?

— Среди российских проектов мы не смогли найти хотя бы ближайший аналог ALICE. На этом фоне более чем достойно выглядит бот «Зоряна» компании «Киiвстар». Он (а вернее, она) был спроектирован для поддержки клиентов оператора связи, умеет говорить на украинском и русском языках и способен вести диалог на широкий круг тем.

Функциональность Зоряны, безусловно, ограниченна, но то, что работает, работает очень хорошо. Мы сравнили то, как работает «Зоряна» и бот, работающий на сайте Московского кредитного банка  (Максим Рублев).

Нужно отдать должное инфу «Максим Рублев», у него есть то, в чем он превосходит «Зоряну»: он знает анекдоты.