METODA AUTOMATSKE ANALIZE BRZINE GOVORA
Sažetak
U ovom radu opisana je metoda analize brzine
govora ili tempa na osnovu uzoraka govora
dobivenih s televizijskih kanala koji sadrže tekst
izgovorenog u obliku titlova. Za prepoznavanje
govora korištena je nepovratna neuronska mreža
(engl. feed-forward neural network) trenirana
s oko 160 sekundi govora. Da bi se odredile
granice pojedinačnih riječi napravljena je
komponenta za poravnavanje govora s tekstom
koja pronalazi prihvatljivo podudaranje slova
teksta s fonemima koje je klasificirala neuronska
mreža. Komponenta za poravnavanje uzima u
obzir kategorije fonema za koje neuronska mreža
ima veću preciznost klasifikacije. Preliminarni
rezultati pokazuju prosječne promašaje
poravnavanja od jednog do tri fonema, zavisno
od govornika, sadržaja izgovorenog i kvalitete
snimke.