Hlavní stránka › Fóra › Forum pro soutěžící SOČ › Obhajoby – Praha › 42-kraj Praha-obor 18 › Odpověď na téma: 42-kraj Praha-obor 18
Dobrý den
1.Na téma převod řeči na text jsem již zpracovával seminární práci. Pro její účely jsem nahrával doma a zjistil jsem, že některé programy nejsou schopny rozpoznávat tehdy, pokud je na nahrávce v pozadí určitý typ ruchu. Program MegaWord třeba vyřadilo ždímání pračky na pozadí. Těchto defektů jsem se chtěl vyvarovat a případně si je do nahrávky doplnit později uměle. Dalším důvodem bylo moje nekvalitní technické vybavení.
2.Na začátku práce jsem měl hypotéz poměrně hodně, chtěl jsem zkoumat například vliv defektů nahrávky na výsledek. Kvůli časové náročnosti jsem se zaměřil jen na zkoumání vlivu kvality nahrávky na výstup. Potvrdilo se mi, že program bude potřebovat pro korektní rozpoznávání mnohem větší kvalitu nahrávky než člověk. Dále jsem chtěl zjistit, jak si programy poradí s nahrávkou vytvořenou programem pro převod textu na řeč. Očekával jsem, že se zde projeví výraznější defekty, protože programy nebudou na syntetizovanou řeč připraveny, ale nestalo se tak. Výsledky z nahrávky robot byly podobné výsledkům lidských mluvčí.
3.Případné emoce u programu za pravděpodobné nepovažuji. Na tuto myšlenku jsem přišel při objasňování nedeterministikého chování programů, které je způsobeno přítomností umělé inteligence v rozpoznávacím procesu programu. Nejvíce mě na tuto myšlenku přivedly výsledky některých velmi specifických pokusů, kdy programy generovaly text přirovnatelný zajímavé dadaistické básni.