Secretaria Alcalde, abran los datos de Jóvenes Construyendo el Futuro

Este texto es una colaboración que escribí para Nexos.

Hace un mes arranqué este blog publicando el primero de tres textos dedicados a proponer algunas ideas para que el portal de Jóvenes Construyendo el Futuro (JCF) ofrezca más datos, de formas más eficiente y efectiva. En aquella entrada me concentré en algunos aspectos que, desde mi perspectiva, podrían cambiarse para mejorar la experiencia de las y los usuarios del portal.

En este segundo texto propongo que aún cuando el portal cumple en cierta medida con transparentar algunos datos agregados del programa, existen motivos suficientemente alarmantes para pedir que Luisa Alcalde, Secretaria del Trabajo, tome acciones inmediatas para abrir por completo los datos del mismo.

El portal permite consultar diversas estadísticas de cuatro categorías de datos relacionadas con JCF: (i) aprendices vinculados, (ii) aprendices listos para vincularse, (iii) vacantes verificadas y (iv) centros de trabajo verificados.

Aunque en la página de inicio las estadísticas están agregadas a nivel nacional (p. ej., total de aprendices que son mujeres y hombres o la escolaridad de todos los aprendices vinculados), con algunos clics las y los usuarios pueden desagregar algunos de estos datos (p. ej., número de aprendices por edad en los municipios de cada entidad, o la lista de centros de trabajo participando en el programa por entidad).

Si bien es indiscutible que la publicación de los datos mencionados arriba representa un ejercicio de transparencia (uno que, por cierto, se suma a varias experiencias similares de administraciones anteriores),1 el portal de JFC se queda corto en un punto central: no permite que las y los usuarios podamos descargar las bases de datos que nutren la plataforma para poder utilizarlas.

Puesto de otra forma, el portal de JFC transparenta muchos datos (en su gran mayoría agregados), pero no los abre a la sociedad.2

La diferencia entre datos transparentes y datos abiertos es sutil pero crucial. Los primeros son demostrativos, los segundos reutilizables.

Más allá de ser una obligación legal,3 existen diversos motivos prácticos para solicitar la apertura de los datos de JCF.4 Aquí me centro en uno que me parece particularmente relevante: sin datos abiertos, las y los ciudadanos carecemos de los elementos que nos permitan verificar las cifras publicadas por la autoridad.

En el caso de JCF esto es particularmente relevante por, cuando menos, tres motivos.

Primero, hace unos días, Rafael Cabrera publicó en su cuenta de Twitter la primera imagen que yo haya visto sobre el padrón de beneficiarios de JCF. Después de consultarle cómo la obtuvo, Rafael me comentó que había solicitado el padrón de beneficiarios de este programa social a través de la Plataforma Nacional de Transparencia. Como respuesta, Rafael recibió tres ligas (1, 2 y 3), cada una de las cuales permite descargar un documento en formato PDF con más de mil páginas y que pesa más de 190MB.

Por si estas no fueran suficientes trabas para trabajar con los datos del padrón de beneficiarios, la información contenida en cada página de los PDFs fue guardada como imagen, lo que hace imposible copiar y pegar los datos de cada una de las aproximadamente 3,000 páginas. Incluso si se utiliza algún programa de reconocimiento óptico de caracteres, únicamente se puede extraer la información de la parte superior de cada página.

La respuesta de la Secretaría del Trabajo a esta solicitud de información sienta un muy mal precedente respecto a la voluntad de algunos funcionarios de la institución para abrir el padrón de beneficiarios del programa JCF.

Segundo, dado que no podemos acceder a los datos abiertos de JFC, lo único que nos queda para verificar las cifras presentadas en la plataforma es compararlas con las de otras fuentes públicas. Los resultados son muy preocupantes.

Los datos publicadas en la plataforma de JCF indican que hasta la semana 12 (última de marzo, si se considera que el programa se presentó el 8 de enero) había poco más de 240 mil aprendices vinculados (no doy una cifra exacta por motivos que explico en el tercer punto). Sin embargo, de acuerdo con el IMSS hasta el 31 de marzo solamente 106,625 jóvenes registrados en el programa de JCF recibían los servicios médicos del Instituto.

¿Qué explica esta enorme diferencia entre las cifras publicadas por la Secretaría del Trabajo y el IMSS? ¿Se debe a un rezago administrativo en el registro de las y los jóvenes en el IMSS? ¿Las cifras del IMSS reflejan el verdadero número de jóvenes que está trabajando?

Los resultados son igualmente preocupantes si la comparación es entre dos fuente de la propia STyPS: las cifras publicadas en el portal de JFC y los PDFs a los que dieron acceso a Cabrera. De acuerdo con el último párrafo de la segunda página del oficio de respuesta a la solicitud de información, los PDFs incluyen “el padrón de beneficiarios del primer trimestre del Programa Jóvenes Construyendo el Futuro”.

Tercero, las propias cifras publicadas en el portal de JCF aumentan la incertidumbre. De todas las gráficas y tablas incluídas en el portal, la única que nos permite conocer cómo han cambiado el tiempo el número de “aprendices vinculados”5 es la gráfica de líneas que está en la parte inferior izquierda de la página de inicio, titulada “Histórico semanal de vinculaciones”.

Si bien es virtualmente imposible extraer y reutilizar los datos incluidos en las 3,384 páginas de los tres archivos, lo que sí se puede hacer es contar cuántos beneficiarios hay en cada página y multiplicarlos por el número de páginas. Según mis cálculos, hay 54 nombres por página,6 lo que por multiplicado por 3,384 páginas arroja un total de 182,736 beneficiarios. Es decir, de acuerdo con los tres PDFs publicados por la propia STyPS, el número acumulado de beneficiarios del programa Jóvenes Construyendo el Futuro en el primer trimestre de 2019 tenía aproximadamente 60 mil beneficiarios menos que los que reporta el portal para la semana 12 (al menos hasta este momento).

Como usuario, uno esperaría que las únicas cifras que cambiarían (a la alza) en esta gráfica cada vez que se recarga la página fueran las de la última semana reportada (al momento de escribir este texto, es la semana 15). De manera sorprendente, esto no es así: para todas las semanas excepto la primera y última reportada, el número de personas vinculadas disminuye cada vez que actualiza la página. Cualquiera puede verificar esto directamente en el portal de JFC, eligiendo una semana, registrando el dato reportado y recargando la página 5 minutos después.

La reducción en el número de “vinculados” es tan acelerado que desde que comencé a escribir este texto la cifra para la semana 12 cayó de 244,057 a 241,270. ¿Qué explica este muy extraño comportamiento en los datos? ¿Se deben a un error de programación? ¿Están ajustando las cifras para que el número de “aprendices vinculados” de cada semana converja con alguna otra cifra?

¿La secretaria Alcalde está al tanto de todo lo que mencioné arriba? Si no es así, ojalá que pronto se lo hagan saber y ojalá que esté en su interés corregir este problema abriendo todos los datos del programa Jóvenes Construyendo el Futuro. De lo contrario, estaría contribuyendo a minar la confianza ciudadana en torno a uno de los principales programas sociales de la administración de López Obrador.


  1. Como mencioné en la entrada anterior, en la administración pasada el equipo del DataLab del Sistema de Información Social Integral de la entonces Secretaría de Desarrollo Social montó la Plataforma Preventiva de Política Social, en la que se publicaban diversos datos de programas sociales, incluyendo padrones desagregados a nivel individual.

  2. El artículo 5 del Decreto por el que se establece la regulación en materia de Datos Abiertos define las ocho características mínimas que debe tener un conjunto de datos para considerarse como de datos abiertos.

  3. La decisión de no abrir los datos del programa de JCF implica dejar de cumplir con los seis principios establecidos en la Carta Internacional de Datos Abiertos, adoptada por México en 2015, y, más importante aún, con los artículos tercero y séptimo del Decreto por el que se establece la regulación en materia de Datos Abiertos en nuestro país, así como con el artículo 129 de la Ley Federal de Transparencia y Acceso a la Información Pública.

  4. Sin datos abiertos, las y los ciudadanos estamos limitados a consultar la información pública en el formato y nivel de desagregación que decida la autoridad.

  5. Los términos usados en el portal de JCF son un factor más de incertidumbre. Mientras que los lineamientos del programa mencionan la categoría de “becarios”, la plataforma se refiere a “aprendices vinculados”. ¿Qué significa exactamente el segundo concepto? ¿Se refiere a jóvenes que gracias al programa ya están trabajando y capacitándose en alguna institución pública, empresa u organización social, o a jóvenes que gracias al programa iniciaron el proceso para hacerlo? Por desgracia, la plataforma no lo aclara.

  6. Verifiqué esta cifra en varias páginas de los tres PDFs seleccionadas aleatoriamente.