Resum “Jornada estadísTICa”

Antoni Meseguer (Universitat Oberta de Catalunya, UOC)

L’ús intensiu de les Tecnologies de la Informació i la Comunicació (TIC) ha transformat el nostre entorn social i econòmic. Aquesta transformació ha suposat una evolució en la manera en què el mesurem i l’analitzem. La facilitat d’accés a fonts d’informació de les quals podem obtenir grans quantitats de dades (Big Data) pràcticament en temps real i en canvi constant, la utilització de noves tècniques d’anàlisi i la transformació de les antigues, així com la disponibilitat de noves eines de comunicació que faciliten una nova manera de presentar els resultats estadístics, han fet que comencem a parlar d’una nova forma de fer estadística.

Image

El proppassat 28 de novembre, vàrem celebrar una jornada organitzada per la Universitat Oberta de Catalunya (UOC), amb la col·laboració de la Societat Catalana d’Estadística (SCE) i l’Institut d’Estadística de Catalunya (IDESCAT), en què diferents especialistes del món professional i acadèmic varen parlar de totes aquestes qüestions. Aquesta Jornada estadísTICa, emmarcada en els actes de celebració de l’Any Internacional de l’Estadística, es va dividir en tres parts, d’acord amb el gràfic anterior. Tot seguit,  us faig un breu resum de les principals aportacions realitzades en la primera de les sessions: “Fonts d’informació i TIC: Big Data

Aquesta primera sessió de la Jornada estadísTICa va anar a càrrec de Frederic Udina i Abelló, Director de l’IDESCAT i professor de la UPF. El professor Udina va explicar que des dels seus orígens, l’estadística sempre ha estat estretament relacionada amb la recollida de dades. Per exemple, en els censos. Va parlar de censos que ja es troben en la Biblia, i dels fogatges, impost creat per Pere III al segle XIV, relacionat amb el recompte de llars (focs). En els seus inicis, la recollida de dades estava molt relacionada amb recaptar impostos i amb reclutar exèrcits. Tot i que ja es pot trobar la utilització de mètodes estadístics en escrits del segle IX (per exemple, en el “Manuscrit sobre desxifrar missatges encriptats” escrit per al-Kindi), l’Estadística (paraula que prové d’Estat, i associada inicialment a l’estadística oficial) és una ciència jove. El professor Udina va comentar que també podem trobar l’estadística en l’origen de la demografia (John Graunt, en el segle XVII, va utilitzar de forma sistemàtica les taxes de mortalitat de Londres per fer estimacions de la població a la ciutat) i en l’origen de l’epidemiologia (John Snow, en el segle XIX, va situar les dades de mortalitat en un mapa de Londres per trobar l’origen d’una epidèmia de còlera).

Amb l’aparició de la probabilitat (Bernouilli, De Moivre, Laplace, Gauss, etc.), va continuar el professor Udina, l’estadística fa la seva primera gran eclosió, i acaba entrant en gairebé en tots els camps científics. Ara ens trobem al davant d’una segona eclosió, amb el que Frederic Udina anomena la revolució de les dades: grans quantitats de dades (dades per tot arreu) i amb característiques, tipologies i estructures de dependència molt diferents. Per entendre aquest revolució, ens va proposar consultar els següents recursos:

Aquesta revolució Big Data, va continuar el professor Udina, ve més per la part de “Data” que per la part de “Big”. Sí, ara hi ha grans quantitats de dades (que ja hem de mesurar amb yottabytes, 1024 bytes), però encara és més important el canvi en les dades pròpiament. La gran varietat de fonts d’informació, la diversitat de l’origen de les dades, els mitjans de transmissió (disponibilitat en temps real) i el tractament de les dades, fa que ens trobem al davant de noves tipologies de dades, menys estructurades, amb una gran dimensionalitat, i amb relacions de dependència complexes.

Frederic Udina va comparar el que significa la revolució Big Data amb l’estadística oficial. Tot i que es poden trobar grans punts de coincidència (per exemple, des del punt de vista comercial o de la recerca), hi ha una gran complementarietat en les dues aproximacions:

Image

Finalment, el professor Udina va parlar del Big Data en l’estadística oficial, donant una referència bibliogràfica bàsica que tenen com a exemple a considerar des del mateix IDESCAT, com a model de sistema:

  • Wallgren, A. and Wallgren, B. (2007). Registered-based Statistics. Administrative Data for Statistical Purposes. Ed. Wiley.

Per acabar, també va donar diferents exemples, propis de l’IDESCAT (com per exemple el mapa de la població de 0 a 14 anys a Barcelona situada en una quadrícula de 100x100m) i d’altres fonts, en què es veu l’estreta relació del Big Data amb l’estadística oficial:

  • Einav, L. and Levin, J. D.  (2013). “The Data Revolution and Economic Analysis”, NBER Working Paper No. 19035. http://www.nber.org/papers/w19035
  • Chetty, R., Friedman, J. and Rocko, J. (2012). “The Long-Term Impacts of Teachers: Teacher Value-Added and Student Outcomes in Adulthood”, NBER Working Paper No. 17699. http://www.nber.org/papers/w17699
Galeria | Aquesta entrada s'ha publicat en Estadística i TIC i etiquetada amb , , , , , , . Afegiu a les adreces d'interès l'enllaç permanent.

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

Connecting to %s