Информация, необходимая для создания языкового модуля TTS

S
Автор Sergiiy
Обновлено 1 год назад

Эти правила необходимо уточнить для создания языкового модуля TTS:

  • Правила произношения чисел.
  • Правила произношения порядковых форм чисел.
  • Правила произношения последовательности цифр.
  • Правила произношения интервала времени.
  • Правила произношения даты и времени.

Правила произношения чисел

Это самая сложная часть текстового синтезатора. Правила создания номера могут сильно различаться в разных языках. Его цель состоит в том, чтобы преобразовать число в последовательность подсказок, которая представляет это число на слух. Например, число 12345 на английском языке преобразуется во фразу «двенадцать тысяч триста сорок пять».

Невозможно представить универсальный набор необходимых подсказок, который будет действителен для всех языков. Некоторые языки могут иметь падежи и другие модификации чисел. Итак, в качестве примера приведен набор необходимых подсказок для английского языка, но не забывайте, что для целевого языка он может быть совершенно другим.

один два три четыре пять шесть семь восемь девять десять одиннадцать двенадцать тринадцать четырнадцать пятнадцать шестнадцать семнадцать восемнадцать девятнадцать двадцать тридцать сорок пятьдесят шестьдесят семьдесят восемьдесят девяностосот тысяч миллионов минус более одного миллиарда меньше минус один миллиард

Правила произношения порядковой формы чисел

Эта функция позволяет подсистеме TTS произносить такие порядковые номера, как «первый», «двадцать седьмой» и т. д. В некоторых языках могут быть падежи и другие модификации порядковых номеров.

Для работы этой функции необходимы следующие дополнительные слова на английском языке:

первый второй третий четвертый

и так далее.

Правила произношения последовательности цифр

Обычно это одно из самых простых правил, но английский, например, использует здесь хитрость - последовательность цифр в английском языке произносится со словом «о» вместо «ноль» и «двойное о» вместо двух нулей подряд. , поэтому последовательность «1 0 2» будет звучать как «один о два». Поэтому необходимо применять такие правила, зависящие от языка.

Правила произношения интервала времени

В английском языке интервалы произносятся, например, как «один час двадцать четыре минуты и тридцать секунд». Для этой функции требуются следующие слова при использовании английского языка:

час часы минуты минуты секунды секунды

Обратите внимание, что нет необходимости делать перевод форм множественного числа, если в целевом языке нет форм множественного числа. Но при этом все формы должны быть указаны для языков, имеющих одну и более форм множественного числа.

Правила произношения даты и времени

На английском языке дата и время произносятся так: «октябрь двадцать первое девятнадцать восемьдесят семь два пятьдесят пять вечера». Для этой функции обычно требуются как минимум слова, обозначающие месяцы:

Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь

Также могут потребоваться дни недели и слова:

сегодня вчера завтра 
Оцените эту статью