dc.description.abstract | El reconocimiento de estados emocionales de las
personas se ha popularizado en aras de mejorar las interacciones
entre personas y robots. Actualmente, los investigadores han
mostrado un creciente interés por desarrollar técnicas que
permitan reconocer emociones a través de la voz. Las técnicas
más populares para reconocer emociones mediante la voz, utilizan
bases de datos con registros de voz de diferentes personas
que expresan diferentes emociones, para entrenar algoritmos
de aprendizaje de máquina. Particularmente, las emociones
humanas pueden ser expresadas de diversas maneras, lo cual
afecta la capacidad de reconocimiento de estos algoritmos, y en
consecuencia, la capacidad de interacción eficaz de los robots,
ya que reconocer todas las formas de expresión de una misma
emoción a través de la voz es una tarea compleja. En este sentido,
en aras de proporcionar la capacidad a los robots de reconocer
emociones de un amplio grupo de personas, en esta investigación
se construye una base de datos en condiciones controladas y
actuadas de seis emociones (ira, sorpresa, felicidad, miedo, tristeza
y asco). Luego, con el propósito de hacer comparaciones, se
entrenan tres modelos de aprendizaje automático (Máquinas
de Vectores de Soporte, Bosques Aleatorios y Aumento del
Gradiente). Posteriormente, se construyen dos bases de datos
adicionales (una en condiciones controladas y semi-naturales, y
otra en condiciones no controladas y naturales) para probar
con mayor rigurosidad los modelos entrenados. Los resultados
obtenidos indican que la mejor tasa de reconocimiento se obtiene
cuando se hacen predicciones sobre muestras capturadas en la
mismas condiciones que las muestras de la base de datos de
entrenamiento, y además, para muestras pertenecientes a las otras
bases de datos hay resultados prometedores, como por ejemplo,
la alta tasa de reconocimiento de la ira en todas las pruebas
realizadas. | es_VE |