Profesor del MBA USACH publica el artículo “Effects on Time and Quality of Short Text Clustering during Real – Time Presentations” en reconocida revista científica

Comparte

Héctor Ponce, profesor del MBA USACH y PhD in Management Systems, University of Lincoln, UK.; publicó su trabajo “Effects on Time and Quality of Short Text Clustering during Real – Time Presentations” en la prestigiosa revista IEEE Latin America Transactions.

El académico del MBA de la Universidad de Santiago de Chile, Héctor Ponce, PhD in Management Systems, University of Lincoln, UK., publicó uno de sus últimos trabajos de investigación denominado “Effects on Time and Quality of Short Text Clustering durin Real – Time Presentations” en la destacada revista IEEE Latin América Transactions.

Esta revista proporciona la difusión de documentos de investigación de calidad en tres áreas principales: Computación, Energía (eléctrica) y Electrónica; con el objetivo de informar temas emergentes o la resolución de problemas en América Latina. La revista cuenta además con algunas subáreas (pero no se limitan a): control de sistemas, comunicaciones, instrumentación, inteligencia artificial, energía e industria.

Fue en esta prestigiosa revista donde el profesor del MBA plasmó su trabajo investigativo “Effects on Time Quality of Short Texy Clustering durin Real – Time Presentations”, investigación que fue financiada por los Proyectos FONDEF/ CONICYT (IT18I001) y FONDECYT (1200803). Que realizó junto a Diego Fuentealba y Mario López, académicos del Departamento de Ingeniería Industrial de la Universidad de Santiago de Chile.

El estudio examina los efectos en el tiempo y la calidad de los algoritmos de agrupación de texto aplicados a textos de tamaño corto, medio y largo, y se examina si la agrupación de texto corto muestra un rendimiento razonable para las presentaciones en directo. Para realizar este estudio, los investigadores de la USACH ejecutaron varias simulaciones en las que fueron variando el número de frases (de 5 a 200) contenidas en cada tipo de texto (largo, medio y corto) y el número de clústeres generados (de 2 a 10).

Los algoritmos utilizados fueron los steamers de bola de nieve, TF-IDF, y K-medios para la agrupación; y los tipos de texto fueron Reuters, 20 grupos de noticias y un conjunto de datos experimentales, para los textos de tamaño largo, medio y corto, respectivamente.

“El primer resultado mostró que el tamaño del texto tenía un gran efecto en el tiempo de ejecución del algoritmo, con el tiempo medio más corto para los textos corto y el tiempo medio más largo para los textos largos. El segundo resultado mostró que el número de frases en cada tipo de texto predice significativamente el tiempo de ejecución, pero no el número de clústeres generados por K-means”, explicó Héctor Ponce.

El académico del MBA señaló que se utilizaron medidas de inercia y pureza para probar la calidad de los racimos generados. El tamaño del texto, el número de frases y el número de grupos predicen la inercia, mostrando la inercia más baja para los textos cortos. Las medidas de pureza fueron como los resultados reportados anteriormente para todos los tipos de texto. Por lo tanto, los algoritmos de agrupación para textos cortos se pueden utilizar con confianza en presentaciones en tiempo real.

Para leer el paper completo hacer clic AQUÍ

Lee más noticias