Réplica de Ruth Nohemí Espinoza Pérez a nota de Quadratín
MÉXICO, DF., 24 de noviembre de 2014.- El Internet, los dispositivos móviles y las redes sociales hacen que el material disponible aumente exponencialmente y de ahí que la ciencia de datos cobre relevancia. Por ello, se requieren cada vez más personas especializadas en su manejo y capacitadas en indagación y docencia en el rubro, advirtió Sergio Rafael Coria Olguín, investigador visitante en el Centro de Ciencias de la Atmósfera (CCA) de la UNAM.
“Es una materia cada vez más necesaria en la academia, gobierno y empresas, pues en cada una de estas áreas los volúmenes de información crecen constantemente”.
Las naciones desarrolladas tienen centros especializados, los cuales han demostrado su valía al momento de diseñar políticas públicas, expuso. “Urge crear espacios similares en el país (universitarios o independientes), pues sus aportes permitirían entender mejor los problemas sociales, económicos y de salud, así como generar investigación multidisciplinaria”, expuso.
Detalles
La ciencia referida consiste en aplicar metodologías provenientes de la ingeniería en computación y la estadística para analizar grandes volúmenes de información (bases de datos). La finalidad es descubrir patrones significativos con utilidad práctica.
Los análisis y modelos derivados tienen diversas aplicaciones, como en el CCA, donde se emplean para investigar el clima; en instancias gubernamentales para analizar programas de asistencia, estrategias de apoyo en desastres naturales y supervisión de recursos públicos, y en bancos y empresas con propósitos mercadológicos y de optimización de procesos.
Al respecto, Coria Olguín señaló que hay dos categorías de datos: estructurados y no estructurados. Los primeros se organizan en tablas, como las empleadas en sistemas informáticos para cobrar impuestos, derechos y servicios. Los segundos se integran de volúmenes de texto, videos, audios o fotografías descargables de la web. En esta labor se apoya en metodologías de ciencia e ingeniería de la computación, y en estadística y matemáticas.
“Por ejemplo, en seguridad pública permite identificar patrones en la ocurrencia de delitos (como homicidios y secuestros) para establecer políticas públicas, programas y estrategias para su prevención o combate. En el mundo de los negocios es útil para descubrir recurrencias en características y hábitos de consumo, así como expectativas de pago de clientes actuales y potenciales”.
Brecha digital
Coria Olguín, investigador visitante de la Universidad de la Sierra Sur (UNSIS) de Miahuatlán de Porfirio Díaz, Oaxaca, ha dedicado los últimos años a aplicar la ciencia de datos para entender cómo se configura la brecha digital en México, es decir, las diferencias en el grado de presencia y uso de las tecnologías de la información y comunicación (TIC) entre los municipios.
En esta labor usó datos del Censo de Población 2010 del Instituto Nacional de Estadística y Geografía (INEGI) y mediante técnicas de inteligencia artificial —específicamente árboles clasificadores, con variables sociodemográficas— obtuvo modelos que describen la situación actual del país.
Al compararse con naciones desarrolladas, México presenta un rezago considerable en presencia y aprovechamiento de las TIC, y en el ámbito interno se observan atrasos significativos en las entidades del sur y sureste (Guerrero, Oaxaca, Chiapas) respecto a las del centro (DF) y del norte (Nuevo León).
A partir de los resultados obtenidos, publicó el año pasado el artículo CT4RDD: Classification Trees for Research on Digital Divide, en la revista Expert Systems with Applications, en el que presentó reglas en forma de inferencias lógicas que describen cómo interactúa esta diferencia con las características poblacionales y de vivienda en los municipios mexicanos.
“Por ejemplo, los que registraron menor presencia de Internet (con menos del seis por ciento en el ámbito doméstico) se caracterizan por una presencia de computadoras personales menor o igual al 8.5 por ciento de los hogares”, refirió.
Trabajos encaminados a generar políticas públicas
Entre los trabajos desarrollados en el CCA, Coria Olguín realiza minería de datos climáticos y sociodemográficos mediante metodologías de estadística y aprendizaje automático para descubrir relaciones útiles a fin de incrementar el entendimiento de estos fenómenos y contribuir en la generación de políticas públicas.
“La UNAM provee un ambiente único para desarrollar este campo debido a que tiene especialistas en estadística, aprendizaje automático e ingeniería en computación, disciplinas con fuerte arraigo en la ciencia de datos, lo que la hace un escenario ideal para ahondar en esta área de investigación”, concluyó.