Torturar los datos
Hoy tenía programado un texto sobre el impacto del logro conseguido ayer por nuestra selección de fútbol. También tenía perfilado otro acerca de una gesta de un chaval español, completamente desconocida para la gran mayoría. Pero he desprogramado el uno y dejado pendiente el otro.
¿El motivo? Una llamada telefónica. Pero, ¿qué llamada telefónica puede hacerte abandonar, o al menos posponer, lo ya escrito y dedicar parte de la hora de la comida a perpetrar otro artículo?
Pues resulta que he recibido una llamada de un organismo público que goza de cada vez peor fama, por el consenso mayoritario que existe en torno a la manipulación que contienen los resultados de sus análisis. Si, aunque pueda parecer increíble, me han llamado desde el CIS, con el que de buen grado me he prestado a colaborar en una encuesta acerca de, según me han comunicado, situaciones sociales y de actualidad en España, con una duración estimada de, en palabras de la persona que me iba a encuestar, unos quince minutos.
Por contextualizar, considero la estadística una ciencia maravillosa, y de grandísima ayuda en múltiples campos, desde la investigación científica hasta el mundo empresarial, pasando por la innovación, el deporte o la educación, por citar solamente algunos ejemplos. Por supuesto la sociología no es una excepción, sino todo lo contrario, ya que es a mi juicio uno de los mayores y mejores campos de aplicación de la estadística.
Sin embargo, la estadística generalmente no es considerada una ciencia exacta; quienes esto defienden tienden a sostener que solamente una observación de una muestra infinita podría dar lugar a una respuesta cierta. No estoy en desacuerdo con ello.
Al final del día - perdonen el uso de una expresión inglesa traducida de manera burda y literal, pero a diferencia de otras que me horrorizan como hacer sentido, esta me gusta y la uso habitualmente, pese a ser consciente de no significar en castellano lo mismo que expresa en inglés - , podemos decir que si manipulamos suficientemente la muestra tomada, estaremos dirigiendo de forma decisiva el resultado. ¿Quién no ha oído hablar de ese simplista pero ilustrativo ejemplo que dice que si tomamos una muestra de dos personas, una que ha comido un pollo y otra que no ha comido nada, tendremos un resultado estadístico que dice que los encuestados están correctamente saciados por haber disfrutado de medio pollo cada uno?
Pues hete aquí que hoy he podido comprobar en primera persona que esas acusaciones de manipulación hacia el CIS pueden tener su base. Porque he sufrido en mis propias carnes lo que considero un vulgar ejercicio de tortura dirigida de la muestra.
Y es que, tras leerme la encuestadora la información acerca de la política de privacidad, mis derechos de acceso y rectificación y las vías a través de las cuales ejercer dichos derechos, nos hemos metido en harina. O eso parecía…..Porque la encuesta ha durado el tiempo que ha costado preguntarme mi sexo, edad y lugar de residencia; mi respuesta a esas preguntas podría indicar que, estadísticamente, es muy probable que esté en un grupo no afín al Gobierno. En ese momento la entrevista ha sido interrumpida fulminantemente, con el pretexto de “hombre de xxx años residente en yyyy me indica el sistema que no es necesario que participe en el estudio”. No me invento ni una coma, se lo aseguro.
Así que ya saben, si quieren que un estudio les diga lo que ustedes quieren oír y les permita comunicar sin complejos aquello que ustedes quieran decir, moldeen la muestra a su gusto y tendrán buena parte del camino recorrido.
Si son ustedes un poquito más sensatos y quieren que su análisis sea lo más certero posible, no definan el resultado antes de definir la muestra, y construyan una muestra suficientemente representativa de cualquier tipo de resultado, sin importar qué es lo que queremos oír. Les recomiendo esta opción, a diferencia de quienes manejan el CIS, ustedes corren el riesgo de ser despedidos si se exceden en la tortura del dato y las consecuencias de ello son negativas para su compañía.