Ferramenta para a extracción de publicacións de Reddit e obtención das súas temáticas
Data de defensa | 14/09/2022 |
Titulación | Máster Universitario en Enxeñaría Informática |
Centro | Escola Superior de Enxeñaría Informática |
Dirección |
Titoría: Analia María García Lourenco |
Tribunal |
Secretaría: María Lourdes Borrajo Diz Vogalía: Francisco Javier Rodríguez Martínez Presidencia: Arno Formella |
Resumo | Na última década medrou drásticamente o uso das redes sociais nunha amplia gama de ámbitos (personal, profesional, noticias, investimentos, etc.). A dispoñibilidade de grandes cantidades de información nestas plataformas esperta interés nas empresas á hora de recoller e analizar os comentarios dos usuarios para diversos fins coma crear productos máis atractivos, coñecer a opinión pública respecto a un producto/tema ou realizar campañas publicitarias máis persoalizadas ao consumidor. Unha das redes sociais máis coñecidas é o foro de noticias Reddit, que ten 430 millóns de usuarios. Propónse o desenvolvemento dunha ferramenta de extracción de publicacións en Reddit e obtención das súas temáticas. O obxectivo deste traballo é obter os textos das publicacións dunha rede social e extraer os temas tratados nestes. A extracción das publicacións realizarase mediante o emprego de APIs de terceiros. O análise dos textos realizarase mediante o emprego de técnicas en métodos de Machine Learning para extraer as temáticas tratados nos textos Palabras clave: análise de textos, topic modelling, Machine Learning, Reddit |