Secretaría Uvigo - Ferramentas para a detección de mencións a palabras chave en fluxos de audio

Ferramentas para a detección de mencións a palabras chave en fluxos de audio

Data de defensa26/03/2021
TitulaciónGrao en Enxeñaría Mecánica
CentroCentro Universitario da Defensa da Escola Naval Militar de Marín
Dirección Titoría: Norberto Fernández García
Cotitoría: José Pablo González Coma
Tribunal Vogalía: Alfonso Rodríguez Molares
Presidencia: Paula Gómez Pérez
Secretaría: Miguel Rodelgo Lacruz
ResumoO audio mining é unha técnica que está actualmente en alza, xa que desempeña unha serie de funcións moi diversas. Dentro destas funcións, este traballo céntrase na detección de mencións a palabras. Esta función ten multitude de aplicacións, desde asistentes virtuais ou márketing ata a que máis interesa no obxectivo e o contexto deste traballo, a intelixencia militar.
Para realizar esta operación de procura de mencións a palabras, existen tres alternativas diferentes: search by sound, procura de certos patróns directamente no sinal sonoro; keyword spotting, detección de mencións a termos usando características extraídas do son e/ou lingüísticas ou speech recognition, onde o son se transcribe a texto para buscar a continuación as mencións no texto. Para atopar a mellor ferramenta que realice a función desexada, realizouse un estudo dunha selección de ferramentas que desempeñan a función. Elíxese a aplicación Vosk para proceder á súa instalación e unha descrición de cómo funciona. A continuación, co propósito de pescudar que factores son os que inflúen na calidade da transcrición e da procura de mencións a palabras realízanse diversas probas en diferentes escenarios (incluíndo comunicacións navais) e analízanse os resultados, para ao final concluír se inflúen ou non e en que medida os factores estudados.
Volver