Ekstrakcija prozodijskih parametara iz govornog korpusa na srpskom jeziku Milan Sečujski Fakultet tehničkih nauka, Novi Sad Katedra za telekomunikacije.

Slides:



Advertisements
Сличне презентације
Lekcija 1: Istorija osiguranja
Advertisements

Računarstvo i informatika
Metodološki pristupi i metode u izučavanju SP
БЕЗБЕДНОСТ И ЗДРАВЉЕ НА РАДУ
Data mining Izdvajanje informacije iz skupa podataka i transformacija u jasnu strukturu za buduće korišćenje Data Mining koristi/prati isti opšti pristup.
VISOKA TEHNIČKA ŠKOLA STRUKOVNIH STUDIJA ZVEČAN
PRIMENA OBRAZOVNIH TEHNOLOGIJA NA UNIVERZITETU
Припрема за СИР Предшколска педагогија Методика ВОР-а
Изборни предмети -докторске студије-
6.1. Sustavno prikupljanje sadržaja s interneta
CILJANOM AKREDITACIJOM KA INTERNACIONALIZACIJI UNIVERZITETA
План и програми наставе и учења
ISPITIVANJE KVALITETA SOFTVERSKI GENERISANIH SEGMENATA U OBLASTI VREMENSKE SLOŽENOSTI ALGORITAMA ZA AUTOMATIZOVANO SASTAVLJANJE ISPITA     Đorđe Pešić,
REZULTATI POSLOVANJA PREDUZEĆA
G4 Tim: Tatjana Ružman Krešo Barić Marija Đapić Darko Jovišić.
Мерни ланци Провера: Машински елементи
BIZNIS PLAN !!! Veljković Uroš 157/09 Ristović Danilo 08/09
Наташа Дакић, Јелена Андоновски
КОНФЕРЕНЦИЈА ЗА НОВИНАРЕ
ИНДИВИДУАЛНИ ТРЕТМАН КОД ДЕЦЕ ОШТЕЋЕНОГ СЛУХА
Израда ИНДИВИДУАЛНОГ ОБРАЗОВНОГ ПЛАНА
Doprinos instrumenata marketing miksa satisfakciji studenata
РОД ИМЕНИЦА - обрада Данијела Бујагић.
Шта је семинарски рад? Семинарски рад је писани рад једног студента или групе студената у коме се обрађује одређена тема.
Припрема за СИР Курикулуми предшколског васпитања
ХОРИЗОНТАЛНО И ВЕРТИКАЛНО СТРУКТУИРАЊЕ ЈАВНОСТИ
Електронским учењем до креативне наставе
Program stručnog usavršavanja na Građevinskom fakultetu Sveučilišta u
Journal Citation Report Радионица за библиотекаре
Program za cjeloživotno učenje-Leonardo da Vinci
Katedra za elektroniku
КОМУНИКАЦИЈА И КУЛТУРА
План и програм индивидуалног третмана
Мала школа етнологије Народна традиција.
Ak. god. 2018/2019 izv. prof. dr. sc. Marko Maliković
FAKULTET TEHNIČKIH NAUKA DEPARTMAN ZA PROIZVODNO MAŠINSTVO
Olivera Kujundžić Ministarstvo održivog razvoja i turizma Oktobar 2017
Избор у звање научни сарадник кандидат: Никола Веселиновић
Специјализована ИТ одељења
Organizacija “Izabrane teme”
Књига је вреднија од свих споменика украшених сликама,рељефом и дуборезом,јер она сама гради споменике у срцу онога који је чита.                      
Školska knjižnica, Internet, mediji
Реизбор у звање научни сарадник кандидат: Новица Пауновић
Nalaženje partnera za multidisciplinarno istraživanje
Sistem plata zaposlenih u javnim službama u Srbiji
ПРАВОПИСНИ СИСТЕМ СТАНДАРДНОГ СРПСКОГ ЈЕЗИКА (први колоквијум)
NEURONSKE MREŽE 2. predavanje
na sveobuhvatnoj Ebsco platformi
CRNOGORSKI KOMITET MEĐUNARODNOG VIJEĆA ZA VELIKE ELEKTRIČNE MREŽE - CIGRE RAZVOJ I REALIZACIJA SISTEMA RADIO DALJINSKOG UPRAVLJNJA NA ELEKTRIČNIM MOSTNIM.
Primena softvera u aktuarstvu na pragu IV industrijske revolucije
Multimedijalni sistemi
Osnovne informacije o projektu
Relacione baze –primer modelovanja baze
PISANJE ISTRAŽIVAČKIH RADOVA
TEHNOLOGIJA MAŠINOGRADNJE
...šta po njoj se razlila lipa žućkasta boja. Zavičajni govor Promotri pjesnikove riječi. ...šta po njoj se razlila lipa žućkasta boja. ...šta.
Integrisani informacioni sistemi
2.РАЧУНОВОДСТВО, УПРАВЉАЧКО РАЧУНОВОДСТВО И ЊЕГОВА ИНФОРМАЦИОНА УЛОГА
smer: PREDŠKOLSKI VASPITAČ VI semestar
Metodologija istraživanja
ПРАВОПИСНИ РЕЧНИЦИ И СЛУЖЕЊЕ ЊИМА.
Projektovanje namenskih računarskih struktura u obradi signala
МЕЂУНАРОДНИ ДАН ПИСМЕНОСТИ
V SAVJETOVANJE CRNOGORSKOG KOMITETA CIGRE
Sadržaj predavanja Uvod u postupak procjene Metodologija procjene
Definicija i osobine digitalnih biblioteka
Sinteza srpskih interkorelacionih pogleda, posebno na jezik Srba u BiH
ЗНАЧАЈ ОСПОСОБЉАВАЊА, ИНФОРМИСАЊА И ИЗГРАДЊЕ СВЕСТИ О БЗР др Биљана Гемовић др Аница Милошевић мр Тања Крунић мр Наташа Субић.
Osnovne informacije o projektu
Транскрипт презентације:

Ekstrakcija prozodijskih parametara iz govornog korpusa na srpskom jeziku Milan Sečujski Fakultet tehničkih nauka, Novi Sad Katedra za telekomunikacije i obradu signala

Jezičke tehnologije Automatsko prevođenje teksta Automatsko rezimiranje teksta Automatsko nalaženje informacije u tekstu Optičko prepoznavanje pisanog teksta Automatsko vođenje dijaloga Sinteza govora na osnovu teksta Prepoznavanje govora

AlfaNum Rečnik Spisak reči sa podacima o vrednostima morfoloških kategorija, čitljiv od strane računara LC Star

? Korpus Anotiran ili neanotiran U tekstu se reči javljaju u svim svojim pojavnim oblicima Kako razrešiti dvosmislenost? Morfološka anotacija u velikoj meri rešava i problem akcentuacije Pored svoje izdavačke delatnosti, Narodna knjiga počinje sa distribucijom stručne literature na engle-skom jeziku iz različitih oblasti. ?

Korpus Korpus srpskog jezika (CSL)

Korpus MULTEXT East AlfaNum

Izgradnja korpusa

Trenutno stanje na AlfaNum projektu Realizovan akcenatski rečnik (100.000 odrednica / 3.700.000 izvedenih oblika reči) Realizovan anotiran korpus rečenica (150.000 reči) Realizovani sistemi za automatsku morfološku anotaciju Zasnovan na automatskom učenju – 88% tačnosti Zasnovan na ručno dobijenim gramatičkim pravilima koja utiču na vrednost metrike u algoritmu za pretragu – 92% tačnosti Realizovani potpuno funkcionalni sistemi za prepoznavanje i sintezu govora: na srpskom jeziku na hrvatskom jeziku na makedonskom jeziku

Istraživanja u toku Deo korpusa je pročitan i u toku je labeliranje (delimično automatski): U pogledu granica između fonema U pogledu kvaliteta artikulacije U pogledu akcenta U pogledu rečenične prozodije

Istraživanja u toku Deo korpusa je pročitan i u toku je labeliranje (delimično automatski): U pogledu granica između glasova U pogledu kvaliteta artikulacije U pogledu akcenta U pogledu rečenične prozodije K A D S EVR A T I O I Z P A N A M E # O DM A H J E P RO D U ŽI O U J A P A N

Istraživanja u toku Deo korpusa je pročitan i u toku je labeliranje (delimično automatski): U pogledu granica između glasova U pogledu kvaliteta artikulacije U pogledu akcenta U pogledu rečenične prozodije    K A D S EVR A T I O I Z P A N A M E # O DM A H J E P RO D U ŽI O U J A P A N

Istraživanja u toku Deo korpusa je pročitan i u toku je labeliranje (delimično automatski): U pogledu granica između glasova U pogledu kvaliteta artikulacije U pogledu akcenta U pogledu rečenične prozodije _ K A D S EVR A T I O I Z P A N A M E # O DM A H J E P RO D U ŽI O U J A P A N

Istraživanja u toku Deo korpusa je pročitan i u toku je labeliranje (delimično automatski): U pogledu granica između glasova U pogledu kvaliteta artikulacije U pogledu akcenta U pogledu rečenične prozodije K A D S EVR A T I O I Z P A N A M E # O DM A H J E P RO D U ŽI O U J A P A N

Istraživanja u toku Deo korpusa je pročitan i u toku je labeliranje (delimično automatski): U pogledu granica između glasova U pogledu kvaliteta artikulacije U pogledu akcenta U pogledu rečenične prozodije K A D S EVR A T I O I Z P A N A M E # O DM A H J E P RO D U ŽI O U J A P A N _   

Određivanje istih parametara iz teksta _ Kad se vratio iz Paname, odmah je produžio u Japan.

Određivanje istih parametara iz teksta ? _ Kad se vratio iz Paname, odmah je produžio u Japan.

Određivanje istih parametara iz teksta _ Kad se vratio iz Paname, odmah je produžio u Japan.

Pretraga baze / \ ↑ − ↓ \ Baza: ^ ↑ / \ − ↓ \ \ \ \

Pretraga baze / \ ↑ − ↓ \ Baza: ^ ↑ / \ − ↓ \ \ \ \

Pretpostavke i ograničenja Pretpostavljamo da f0 kriva zavisi isključivo od sledećih faktora: Akcenatska konfiguracija Položaj u rečenici (blizina i tip granice) a ne i od sledećih: Fokus Varijabilnost govornika Ovde radimo samo sa f0, ne i sa trajanjima pojedinih fonema

21 Hvala na pažnji!