Отпремање презентације траје. Молимо да сачекате

Отпремање презентације траје. Молимо да сачекате

Ekstrakcija prozodijskih parametara iz govornog korpusa na srpskom jeziku Milan Sečujski Fakultet tehničkih nauka, Novi Sad Katedra za telekomunikacije.

Сличне презентације


Презентација на тему: "Ekstrakcija prozodijskih parametara iz govornog korpusa na srpskom jeziku Milan Sečujski Fakultet tehničkih nauka, Novi Sad Katedra za telekomunikacije."— Транскрипт презентације:

1 Ekstrakcija prozodijskih parametara iz govornog korpusa na srpskom jeziku
Milan Sečujski Fakultet tehničkih nauka, Novi Sad Katedra za telekomunikacije i obradu signala

2 Jezičke tehnologije Automatsko prevođenje teksta
Automatsko rezimiranje teksta Automatsko nalaženje informacije u tekstu Optičko prepoznavanje pisanog teksta Automatsko vođenje dijaloga Sinteza govora na osnovu teksta Prepoznavanje govora

3 AlfaNum Rečnik Spisak reči sa podacima o vrednostima morfoloških kategorija, čitljiv od strane računara LC Star

4 ? Korpus Anotiran ili neanotiran
U tekstu se reči javljaju u svim svojim pojavnim oblicima Kako razrešiti dvosmislenost? Morfološka anotacija u velikoj meri rešava i problem akcentuacije Pored svoje izdavačke delatnosti, Narodna knjiga počinje sa distribucijom stručne literature na engle-skom jeziku iz različitih oblasti. ?

5 Korpus Korpus srpskog jezika (CSL)

6 Korpus MULTEXT East AlfaNum

7 Izgradnja korpusa

8 Trenutno stanje na AlfaNum projektu
Realizovan akcenatski rečnik ( odrednica / izvedenih oblika reči) Realizovan anotiran korpus rečenica ( reči) Realizovani sistemi za automatsku morfološku anotaciju Zasnovan na automatskom učenju – 88% tačnosti Zasnovan na ručno dobijenim gramatičkim pravilima koja utiču na vrednost metrike u algoritmu za pretragu – 92% tačnosti Realizovani potpuno funkcionalni sistemi za prepoznavanje i sintezu govora: na srpskom jeziku na hrvatskom jeziku na makedonskom jeziku

9 Istraživanja u toku Deo korpusa je pročitan i u toku je labeliranje (delimično automatski): U pogledu granica između fonema U pogledu kvaliteta artikulacije U pogledu akcenta U pogledu rečenične prozodije

10 Istraživanja u toku Deo korpusa je pročitan i u toku je labeliranje (delimično automatski): U pogledu granica između glasova U pogledu kvaliteta artikulacije U pogledu akcenta U pogledu rečenične prozodije K A D S EVR A T I O I Z P A N A M E # O DM A H J E P RO D U ŽI O U J A P A N

11 Istraživanja u toku Deo korpusa je pročitan i u toku je labeliranje (delimično automatski): U pogledu granica između glasova U pogledu kvaliteta artikulacije U pogledu akcenta U pogledu rečenične prozodije    K A D S EVR A T I O I Z P A N A M E # O DM A H J E P RO D U ŽI O U J A P A N

12 Istraživanja u toku Deo korpusa je pročitan i u toku je labeliranje (delimično automatski): U pogledu granica između glasova U pogledu kvaliteta artikulacije U pogledu akcenta U pogledu rečenične prozodije _ K A D S EVR A T I O I Z P A N A M E # O DM A H J E P RO D U ŽI O U J A P A N

13 Istraživanja u toku Deo korpusa je pročitan i u toku je labeliranje (delimično automatski): U pogledu granica između glasova U pogledu kvaliteta artikulacije U pogledu akcenta U pogledu rečenične prozodije K A D S EVR A T I O I Z P A N A M E # O DM A H J E P RO D U ŽI O U J A P A N

14 Istraživanja u toku Deo korpusa je pročitan i u toku je labeliranje (delimično automatski): U pogledu granica između glasova U pogledu kvaliteta artikulacije U pogledu akcenta U pogledu rečenične prozodije K A D S EVR A T I O I Z P A N A M E # O DM A H J E P RO D U ŽI O U J A P A N _   

15 Određivanje istih parametara iz teksta
_ Kad se vratio iz Paname, odmah je produžio u Japan.

16 Određivanje istih parametara iz teksta
? _ Kad se vratio iz Paname, odmah je produžio u Japan.

17 Određivanje istih parametara iz teksta
_ Kad se vratio iz Paname, odmah je produžio u Japan.

18 Pretraga baze / \ \ Baza: ^ / \ \ \ \ \

19 Pretraga baze / \ \ Baza: ^ / \ \ \ \ \

20 Pretpostavke i ograničenja
Pretpostavljamo da f0 kriva zavisi isključivo od sledećih faktora: Akcenatska konfiguracija Položaj u rečenici (blizina i tip granice) a ne i od sledećih: Fokus Varijabilnost govornika Ovde radimo samo sa f0, ne i sa trajanjima pojedinih fonema

21 21 Hvala na pažnji!


Скинути ppt "Ekstrakcija prozodijskih parametara iz govornog korpusa na srpskom jeziku Milan Sečujski Fakultet tehničkih nauka, Novi Sad Katedra za telekomunikacije."

Сличне презентације


Реклама од Google