Способ предварительной обработки текста

Классификация по МПК: G10L

Патентная информация
Заявка на изобретение №: 
2007143417
Дата публикации: 
Среда, Июнь 10, 2009

Формула изобретения 1. Способ предварительной обработки текста, включающий приведение его в нормализованный орфографический текст путем преобразования сокращений и аббревиатур в линейный текст, преобразования формул в их орфографическое представление, членение текста на предложения и слова, маркировку фразовых и словесных ударений, объединение слов в синтагмы с простановкой символов пауз в конце синтагм, с последующим транскрибированием синтагм - получением идеальных транскрипций, отличающийся тем, что формируют правила транскрипционного моделирования, которые затем применяют к полученным идеальным транскрипциям для получения возможных вариантов транскрипций. 2. Способ по п.1, отличающийся тем, что длина синтагм в словах может варьироваться от одного слова до нескольких слов, составляющих предложение. 3. Способ по п.1, отличающийся тем, что если на границах слов, входящих в синтагмы, проставлены символы пауз, они учитываются при формировании правил транскрипционного моделирования.