|
|
|
Источник: Международное информационное агентство «КазИнформ» (www.inform.kz)
12.11.2009 Завершена работа над системой распознавания казахского языка
АЛМАТЫ. 12 ноября. КАЗИНФОРМ /Екатерина Ионова/ - Завершились работы над технологией распознавания слитной казахской речи на 30 тысяч словоформ. Об этом в четверг в Алматы было объявлено на специальной пресс-конференции. Инновационная разработка ТОО «Изет» открывает новые возможности в общении человека с техникой на казахском языке. Работы над проектом продолжались три года, собственные и заимствованные инвестиции в разработку составили 200 тысяч долларов США. «Оригинальная отечественная технология распознавания речи создавалась с учетом фонетических и грамматических особенностей казахского языка. Он принципиально отличается от других языков не только фонетически, но и грамматически - наличием большого числа аффиксов, которые порождают несоизмеримое количество словоформ, что значительно усложняет математическое моделирование речи», - сказал директор ТОО «Изет» Изетали Тилегиев. По словам автора программы Андрея Карчина, для разработки программы была создана научно-исследовательская группа из специалистов по лингвистике, фонетике, математике, обработке сигналов и программированию, создан собственный набор речевых баз данных, в который входят записи более 60 дикторов общей продолжительностью около 500 часов. «Для создания языковых моделей была собрана текстовая база казахского языка объемом 20 млн. слов. Но работа перед нами стоит большая - необходимо собрать около тысячи человеческих голосов, разных по тембру, манере разговора, уровню громкости голоса разных возрастных групп. Также ведется разработка системы, подавляющей окружающие звуки», - сказал А. Карчин. На сегодня программа работает с 70-80% точности распознавания речи, к 2010 году планируется выпустить новую версию программы с 90% точности. Промышленное внедрение этой технологии открывает новые возможности голосового управления компьютерной и бытовой техникой, промышленным оборудованием и транспортом, управления службами сервиса по телефону, систематизации фонограмм и поиска по аудио архивам.
Доступ к документам и консультации
от ведущих специалистов |