Являются ли эти супер-впечатляющие голоса аудиокниг с искусственным интеллектом хорошими или плохими?

Оглавление:

Являются ли эти супер-впечатляющие голоса аудиокниг с искусственным интеллектом хорошими или плохими?
Являются ли эти супер-впечатляющие голоса аудиокниг с искусственным интеллектом хорошими или плохими?
Anonim

Ключевые выводы

  • DeepZen использует ИИ (искусственный интеллект) для создания поразительно реалистичных аудиокниг из текста.
  • Технология использует настоящих актеров, озвучивающих людей, для создания строительных блоков.
  • Amazon и Audible в настоящее время не принимают компьютерные аудиокниги.
Image
Image

DeepZen - компания, которая создает компьютерные голоса, используемые в аудиокнигах, на основе реальных голосов актеров. Качество пугающее, достаточно хорошее, чтобы слушать часами. Хитростью здесь является компонент ИИ (искусственный интеллект), который может читать текст и делать правильный эмоциональный ответ в зависимости от контекста. Затем эта эмоция передается голосу.

Это впечатляет и очень удобно. Но действительно ли мы хотим гомогенизированного опыта аудиокниги? А как насчет тех актеров озвучивания?

«С точки зрения независимого издателя все, что снижает стоимость производства аудиокниг, очень интересно», - сказал Lifewire по электронной почте Рик Карлайл, владелец независимого издателя Carlile Media.

"Но эта привлекательность предполагает, что продукт будет такого же качества, как и традиционное повествование. Я не думаю, что мы достигли этого на сто процентов. Не поймите меня неправильно, DeepZen удивительно хорош. потрясающий прорыв, и его создатели заслуживают огромной похвалы и успеха. Но он еще не идеален."

Аудио «достаточно хорошо»

Лучший способ понять качество DeepZen - это послушать образцы. Если бы вы не знали, что они были сгенерированы компьютером, вы могли бы даже не понять. Во всяком случае, ненадолго. Давайте предположим, что искусственный интеллект DeepZen совершенен и никогда не интерпретирует неправильно эмоциональные ноты, которые он должен выдавать.

Image
Image

Даже в этом случае человек может предложить более тонкие и часто более неожиданные интерпретации. Актер может неожиданно изменить слова, которые компьютер даже не учел бы. И на самом деле интерпретация ИИ, конечно, еще не так хороша, как у профессионального актера озвучивания.

"Как тот, кто работает над фильмами и совсем недавно в мире звукового повествования, хотя я впечатлен ИИ, я точно знаю, что есть глубокие глубины смысла, которые машина не может интерпретировать", профессиональный голос актер Пол Крам сказал Lifewire по электронной почте.

"Будет ли всплеск неизвестных авторов, использующих его? Я гарантирую, что он будет, потому что он "достаточно хорош"".

Достаточно хорошего качества в сочетании с удобством и экономией средств может быть достаточно, чтобы привлечь независимых издателей к сервису.

«Аудиокниги могут стоить до 500 долларов за час прослушивания аудио (гораздо больше за голос знаменитости), и это не включает временные затраты на управление и администрирование», - говорит Карлайл. «Возможность вдвое сократить эту стоимость, просто загрузив рукопись в такой провайдер, как DeepZen, чрезвычайно привлекательна».

Проблемы с разговорами

Это еще не так просто, как увольнять актеров озвучивания и загружать рукописи в DeepZen. В настоящее время существует одно препятствие для легкой речи об искусственном интеллекте в аудиокнигах, и это от Amazon.

Image
Image

«В настоящее время ACX, путь самостоятельного издателя к распространению аудиокниг Audible и Amazon, не принимает аудиокниги, которые не были записаны человеком», - говорит Карлайл.

Почему? Качественный. Вот запись часто задаваемых вопросов с веб-сайта:

"Преобразование текста в речь или другие автоматические записи не допускаются. Слушатели Audible выбирают аудиокниги для исполнения материала, а также для истории. Чтобы оправдать это ожидание, ваша аудиокнига должна быть записана человеком."

Это означает, что аудиокниги, созданные DeepZen, по крайней мере, на данный момент отсутствуют. Это чистая спекуляция, но DeepZen может показаться неплохим приобретением для Amazon, позволяя продавать сервис и оставлять его исключительно для книг Audible. И даже если этого не произойдет, если качество аудиокниг, созданных компьютером, будет таким же хорошим, то, по-видимому, мало причин не делать исключения из этого правила.

Хотели бы вы слушать аудиокниги, сделанные таким образом? Когда это произойдет, большинство людей даже не подозревают. Некоторые могут предпочесть совершенство компьютерных голосов, потому что они будут свободны от вокальных тиков и привычек, которые иногда могут отвлекать. Эта технология также подходит для видеоигр, теле- и радиорекламы и любых других сценариев, в которых вы наняли бы актера озвучивания.

Технология DeepZen также станет отличным способом автоматического создания новостных подкастов из письменных статей, что может быть удобно в дороге.

А как насчет тех актеров озвучивания? Что ж, будет по крайней мере одна возможность: они могут пойти работать в DeepZen.

Рекомендуемые: