Estadística y tecnologías de la información – grandes retos y principios elementales

Camilo Cristancho (Universitat Autònoma de Barcelona, UAB)

En la última década el creciente uso de las tecnologías de la información y las comunicaciones (TIC) ha proporcionado un récord sin precedentes de información sobre el comportamiento humano. Esta oportunidad cambia los retos tradicionales de recoger, analizar e interpretar la información, especialmente cuando se considera que la capacidad computacional para almacenar y procesar esta información se ha adaptado de manera simultánea. No obstante, no es fácil prever las implicaciones que el desarrollo las TIC traerá para la estadística tal como la conocemos.

Uno de los cambios más importantes, desde el campo de las ciencias sociales proviene de la normalización en el uso de Internet y las redes sociales online, en la medida en que este espacio de interacción social ofrece grandes volúmenes de información de enorme riqueza y diversidad. La posibilidad de contar con registros de interacciones entre actores sociales permite analizar el comportamiento de los actores involucrados en temas de múltiples áreas de interés académico. Un seguimiento en tiempo real de las interacciones proporciona información sobre la estructura y el contenido de las relaciones. Esto es lo que (Lazer et al. 2009) introducen como una ciencia social computacional que “aprovecha la capacidad de recopilar y analizar los datos con una amplitud y profundidad y escala sin precedentes”. Pasar de los métodos de interacción investigador-objeto de estudio basados en la observación o en la interacción directa mediante entrevistas o encuestas a sistemas de análisis de registros de información no-reactiva, abre inmensas posibilidades para el análisis social. Equivale de alguna manera a la realización de estudios de campo de observación masivos sobre fenómenos colectivos que difícilmente podrían ser estudiados de otro modo a un nivel agregado.

Este enfoque de investigación digital (Rogers 2013) genera una oportunidad única para acercarse al desarrollo de la actividad social en la medida en que esta se mueve hacia nuevas formas de interacción propias de la sociedad de la información. El rastro de la actividad humana online posibilita igualmente la observación del comportamiento de las organizaciones de la sociedad civil y los gobiernos en los procesos sociales. El desarrollo de la actividad organizada mediante asociaciones formales o movimientos emergentes en las múltiples esferas de la internet 2.0 (web-esfera, redes sociales, micro-mensajería, video-esfera) puede seguirse a partir del estudio de los asuntos de mayor relevancia en la agenda pública (conflictos políticos), mediante el monitoreo de los asuntos de interés social (ambiente, educación, salud, impuestos, seguridad, género, empleo, principios y valores, …) o de los actores particulares (Movimientos sociales, partidos, instituciones de gobiernos, líderes mediáticos, …) con el fin de documentar y analizar las dinámicas y consecuencias del uso de internet en la sociedad. Una contribución metodológica importante radica en que se recurre a métodos de investigación no invasivos (non-reactive data o unobstrusive research), (Janetzko 2008), analizando el rastro digital sin provocar reacciones en los individuos estudiados tal como ocurre con las encuestas o entrevistas. Esto ha permitido el desarrollo de estudios innovadores tales como la predicción electoral mediante el uso de datos de Twitter, el análisis de emociones y contenidos como indicadores de la opinión pública (González Bailón et al. 2010; Congosto 2013) o las tendencias de las epidemias como en los casos de Google flu trends o mediante menciones en Twitter (Achrekar et al. 2011 o Li & Cardie 2013).

Esto supone grandes ventajas metodológicas, técnicas y sustantivas para realizar la investigación pero también implica grandes desafíos desde perspectivas epistemológicas y metodológicas. Las técnicas estadísticas están detrás de las metodologías más utilizadas para lidiar con este tipo de datos y enfoques cuando se buscan tendencias y patrones o cuando se hace predicción (minería de datos, procesamiento de lenguaje natural, inferencia). Sin embargo, los cambios en la tecnología han generado la necesidad de adaptar las técnicas estadísticas más tradicionales para usarlas de manera creativa con el fin de pasar de enfoques basados en teorías elegantes y desarrollo de métodos a resolver problemas científicos (Leek 2013). Esto implica además retos importantes en el desarrollo de habilidades para adaptarse a las condiciones de programación y desarrollo informático para tratar con grandes volúmenes de información y algoritmos novedosos para almacenar y procesar datos. De esta manera, en la medida en que la estadística tienda a acercarse más a la ciencia de datos para resolver problemas prácticos, podrá avanzar a grandes pasos. El fenómeno de las nuevas tecnologías como posibilitador de grandes volúmenes de información y potencial de procesamiento ocurre de manera más clara quizá en otros campos de la ciencia. Es el caso de la bio-estadística y su rol en el desarrollo del genoma humano, donde la velocidad de cambio de la estadística aplicada es vertiginosa (Check 2012).

Otra forma de ver estos retos es preguntarse sobre qué permanece a pesar de los cambios. En un excelente artículo, Kirk Borne nos advierte sobre la importancia de no perder de vista los principios básicos de la estadística elemental. Hace referencia a retos que emergen al tratar con conjuntos de datos de toda la población o muestras en las que resulta difícil precisar su naturaleza (tales como los datos provenientes de redes sociales) y a posibles interpretaciones que olvidan verdades evidentes con respecto a cuestiones como la causalidad, la estimación, los sesgos y la ausencia de evidencia. Estas reflexiones nos recuerdan que a pesar del avance de la tecnología, las metodologías de interpretación de la información y la generación de conocimiento a partir de los datos sigue siendo estadística as usual.

Galeria | Aquesta entrada s'ha publicat en Estadística i TIC i etiquetada amb , , , . Afegiu a les adreces d'interès l'enllaç permanent.

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

Connecting to %s