Es un hombre, tiene entre 25 y 30 años y está casado. Trabaja como autónomo y es rumano o búlgaro (los datos que ofrece la Encuesta de Población Activa dicen que es de uno de los dos países, pero no especifica cuál). Si se queda sin trabajo, elevará la tasa de paro nacional en casi dos centésimas, el equivalente a 4.366 personas, más de diez veces el peso del encuestado medio. Su importancia es aún mayor en la Comunidad de Madrid, donde vive. En esta región su pérdida de empleo incrementaría el paro un 0,13%. Es la persona de la que, al menos estadísticamente, más depende la subida o la bajada del paro en España. Aunque no vaya más allá de la curiosidad, él es una muestra de que la EPA es un reflejo de la realidad, muy bien elaborada, pero no es la realidad misma y tiene errores, según explica el analista estadístico Carlos Gil Bellosta.
Además, al presentar sus datos en nota de prensa, el Instituto Nacional de Estadística (INE), responsable de la EPA, no especifica en ningún momento que existe un margen de error y ofrece las cifras como algo cerrado, como si fuese la realidad misma y no una aproximación a ella. Así, cuando se habla de 6.202.700 parados, no se explica que con el error de muestreo del 0,86% que incluye la encuesta solo es posible afirmar con un 95% de confianza que la cifra se encuentra en el dato que ofrece el INE 106.000 parados arriba, 106.000 parados abajo. El número de desempleados estaría entonces entre 6.095.0000 millones de parados y 6.309.000, tal y como explicó el profesor de la Universidad de Castilla-La Mancha Josu Mezo.
Esta incertidumbre es aún mayor cuando se consideran grupos de personas más reducidos. En esos casos, la variación en el número de desempleados de una pequeña comunidad autónoma o un grupo concreto de trabajadores podría ser inferior al margen de error y perder significado. Para Gil Bellosta, no explicar que en realidad existe una horquilla de 200.000 parados es una oportunidad perdida para educar numéricamente a la población y transmite una idea errónea sobre cómo se obtienen los datos, qué significan y qué grado de seguridad ofrecen.
Otro de los datos que resultan llamativos sobre la EPA es lo que considera un empleado: “Haber trabajado durante la semana de referencia al menos una hora a cambio de un sueldo”. A esta categoría habría que añadir los subempleados, aquellos que no trabajan todas las horas que habitualmente trabajan las personas en su rama de actividad y desean trabajar más. España, además de los más de seis millones de parados, tiene alrededor de 2,5 millones de personas subempleadas y ocupa el segundo puesto por detrás de Grecia entre los países europeos en los que más trabajadores a tiempo parcial se incluyen en esta categoría.
Preguntas no neutras
La forma de presentar los datos no es neutra, pero tampoco las preguntas que se realizan para buscar unos datos concretos. “Alguien decide cuáles se buscan y cuáles no y sobre cuáles se pone el foco”, afirma Gil Bellosta. “Y alguien paga las nóminas de la gente implicada en el proceso”, añade. “Este problema se ve, por ejemplo, si un político trata de crear un incentivo para que haya más gente que cumpla el objetivo de la hora de trabajo en la semana de referencia o se saca del grupo de la población activa para incluirlo en el de los inactivos [que no computan como parados aunque no tengan trabajo] a una persona que se olvidó de sellar el paro”, señala.
Una variación metodológica de este aspecto puede provocar estimaciones muy diferentes de la tasa de paro, según ha denunciado Walter Williams, creador de Shadow Government Statistics, un portal en el que se ofrecen análisis estadísticos alternativos a los del Gobierno. Como se puede observar en el gráfico, Williams compara las cifras oficiales que aparecen en rojo con una medida que tiene en cuenta los desempleados desanimados a corto plazo (aquellos que pudiendo trabajar dicen no estar buscando empleo) y los subempleados. Por último, en azul, muestra su estimación en la que se incluyen todos los desempleados desanimados que se sacaron de las estadísticas en una reforma de 1994. En total, casi quince puntos de diferencia en los que se pierden millones de personas y de historias individuales.