«Человеку важно иметь возможность высказаться»: как российский программист разрабатывает синтезаторы речи

Иван Бакаидов — программист, который с детства лишён возможности говорить понятно для окружающих, — разрабатывает интерфейсы для синтезаторов речи. Его приложения помогают людям набирать текст удобным для них способом и преобразовывать в голосовые сообщения. В интервью RT Бакаидов рассказал, как намерен развивать свои разработки.

— Иван, расскажите о своей болезни.

 У меня ДЦП и двухсторонняя расщелина нёба. Это вызывает дизартрию — расстройство речи, из-за которого я не могу произносить согласные звуки в потоке речи. Я их «сжёвываю», поэтому окружающим остаётся угадывать то, что я хотел сказать, по гласным.

— Где вы учились и кем сейчас работаете?

 Самообразован жизнью и самозанят разрушением жизни. Я занимаюсь веб-активизмом, донесением смыслов и идей через перформансы в сети: блог, интервью, магазин футболок с провокационными надписями и так далее. 

Одна из важных мыслей, которые я несу: человеку очень важно иметь возможность высказываться. Эта возможность делает из него личность. 

Поскольку я имею навыки программирования, то сделал несколько приложений, которые помогают неговорящим людям составлять фразы для синтезатора речи.

— Чем занимаются ваши родители?

 В данный момент отец — директор по развитию в одной медицинской фирме. Он хорошо разбирается в построении бережного бизнеса и в институциональных решениях, которые не зависят от людей. Мама занимается фотографией. По образованию отец — гидроинженер. Мама много лет работала переводчиком. У меня хорошая семья. Мне давали много знаний и всячески культивировали стремление к разностороннему развитию.

— Вы разрабатываете приложение, которое позволит общаться людям, лишённым сейчас такой возможности. В чём его суть и как оно работает? 

— Основная задача наших программ — позволить пользователю составить текст удобным для него способом, чтобы потом текст был озвучен синтезатором речи. Мы изобретаем разнообразные удобные интерфейсы для этого. Я разрабатываю серию приложений для людей с нарушениями речи.

Приложения направлены на решение разных моторных проблем, с которыми сталкиваются люди с особенностями. Например, «Linka.Нажми» позволяет пользователю печатать с помощью одной кнопки. «Linka.Покажи» ориентировано на людей, которые готовы общаться с помощью картинок. «Linka.Бумажная клавиатура» имитирует клавиатуру с большими кнопками, ею удобно пользоваться людям с нарушением моторики средней тяжести. Я пользуюсь программой «Linka.Напиши», которая голосом передаёт набранный мною текст, если запущен режим «Выступление», либо показывает его на экране ноутбука или телефона. Это очень актуально, если я общаюсь с человеком тет-а-тет или в шумной обстановке.

— Как возникла идея сделать такое приложение?

— «Linka.Нажми» раньше называлась DisQwerty. Это система выбора альтернатив с помощью одной кнопки. Когда я учился в девятом классе в школе «Динамика» (мне тогда было 15—16 лет), там появилась девочка по имени Лина, она пошла во второй класс. Особенности Лины позволяли ей управлять только наклоном головы. На общей школьной продлёнке я увидел, как с ней общаются, используя метод сканирования. У неё спросили: «Сколько будет 2+2?» — и показали цифровую клавиатуру из девяти ячеек.

Ассистент сначала водил пальцем по строчкам, Лина кивнула на второй ячейке, затем палец водили по этой строке, и она кивнула на третьей ячейке. То есть она дала ответы сначала 2, затем 3. В общем, плохо у девочки было с математикой… Но я увидел интересный алгоритм, который воплотил в коде. Только вместо ассистента была кнопка.

Сам алгоритм воссоздал часов за пять, он элементарный. Затем мы много перерабатывали программу с учителем Лины. Так, например, потребовалось увеличить шрифт, поскольку у детей в этом классе были проблемы со зрением.

Две другие программы появились чуть позже. Ко мне пришло осознание того, что я хочу делать программы для неговорящих людей, поскольку сам не говорю, и освоил API-синтезатор речи. Так появились «Linka.Напиши» и «Linka.Нажми» (DisType и DisTalk при создании). Программы были переименованы после смерти девочки Лины в память о ней.

«Linka.Напиши» я сам активно использую. Она устроена очень просто: поле ввода текста и кнопка «Сказать». «Linka.Покажи» подходит тем, кто не может писать, но может выбирать картинки из таблицы. Например, людям с аутизмом, с афазией, иностранцам или неграмотным людям. 

— Есть ли аналоги этих программ за рубежом? А в России?

 У каждой программы есть свои аналоги, и они как раз преимущественно существуют за рубежом. Некоторые из них могут «говорить» по-русски, но далеко не все. Вопрос в стоимости и доступности этих программ.

— Есть ли у вас спонсорская поддержка для разработки?

 Проект развивается на деньги частных благотворителей с 2015 года. Этим летом я нашёл партнёра с большим опытом в продуктовой разработке. Мы планируем развивать текущие приложения Linka и вывести на рынок новый продукт — maLinka, прототипом которого я недавно поделился с подписчиками в Facebook. Это портативный коммуникатор для общения в режиме реального времени, то есть мы разрабатываем клавиатуру, позволяющую пользователям с различными нарушениями моторики максимально быстро вводить сообщения. Для создания пилота мы планируем организовать краудфандинг на сумму 300—500 тыс. рублей. Уже с готовым пилотом мы приступим к поиску инвесторов.

Как я уже сказал, на данный момент проект развивается на деньги частных благотворителей, но сейчас я собрал команду, которая помогает мне находить гранты. Я человек дела, но не бумажного, поэтому для этого мне нужна помощь. Мы надеемся получить более масштабное финансирование и разработать портативный коммуникатор для людей без речи.

— В какой стадии работа и когда будет тестирование? Или оно уже было? Сколько пользователей? Какие отзывы? 

 Сейчас всеми приложениями пользуются около 600—700 человек. Приложения на стадии рабочего прототипа.

Отзывы о программах самые разные. Например, я знаю историю девушки, которая смогла реализовать свою мечту и начать работать радиоведущей после того, как стала пользоваться Linka.

В программах, конечно, ещё много непродуманного и достаточное количество ошибок. Хотелось бы найти более масштабный промышленный подход к их разработке.