Análisis estadístico de licitaciones: más allá de la media
Mediana, desviación típica, percentiles, distribuciones y tests de bondad de ajuste para convertir datos en decisiones defendibles.
Equipo Certero
Publicado el 14 de enero de 2026
Índice del artículo
- Por qué la media no es suficiente
- Mediana vs media: cuál usar y por qué
- Desviación típica: la medida de la previsibilidad
- Percentiles: qué significan y cómo usarlos
- Distribuciones estadísticas: el siguiente nivel
- Normal (gaussiana)
- Lognormal
- Beta
- Weibull
- Gamma
- Cómo identificar la distribución de un segmento
- AIC y Kolmogorov-Smirnov: los tests clave
- AIC (Akaike Information Criterion)
- Kolmogorov-Smirnov (K-S)
- Ejemplo práctico: dos segmentos, dos decisiones
- Limitaciones y precauciones
- 1. Muestra insuficiente
- 2. Cambios estructurales
- 3. Sobreajuste
- 4. Dependencia temporal
- Conclusión
Por qué la media no es suficiente
Si pides a dos equipos la misma información — "¿cuál es la baja media en este organismo?" — y ambos te responden "18 %", puede que los dos estén en lo cierto y, a la vez, estén trabajando con realidades estadísticas totalmente distintas. La media es solo un número; detrás de ese número hay una distribución que puede tener formas muy diferentes, y la forma importa tanto o más que la media.
Considera estos dos casos:
Mercado A — 100 obras con bajas entre 15 % y 21 %, con media 18 %. Casi todas las obras se ganan en un rango estrecho. Las decisiones son fáciles: apuntar al 18-19 % da buenas probabilidades.
Mercado B — 100 obras con bajas entre 5 % y 35 %, con media 18 %. Hay obras ganadas con bajas bajas y otras con bajas muy agresivas. La misma oferta al 18 % resulta irrelevante: no cubre ninguno de los dos subsegmentos.
Los dos mercados tienen la misma media. La intuición de quien solo mira la media los trataría igual. La estadística bien aplicada los trata radicalmente distinto.
Misma media, distribución distinta
El factor que distingue las decisiones acertadas de las erróneas no es la media — es la forma completa de la distribución
Mediana vs media: cuál usar y por qué
La primera mejora sobre la media es la mediana: el valor que divide el conjunto de datos en dos mitades iguales. La mediana es más robusta frente a valores extremos: una o dos bajas muy altas apenas la alteran, mientras que pueden disparar la media.
En mercados de obra pública, donde de vez en cuando aparecen bajas muy agresivas (algunas en temeridad posteriormente aceptada), la mediana es generalmente una mejor estimación del "comportamiento típico" del mercado que la media.
Nota
La mediana y la media, cuando coinciden, indican una distribución simétrica. Cuando divergen significativamente (habitualmente media > mediana en bajas), indica una distribución con cola derecha — es decir, valores atípicos tirando la media hacia arriba.
Desviación típica: la medida de la previsibilidad
La desviación típica mide cuánto se separan los datos de la media. Dos mercados con igual media pueden tener desviaciones típicas radicalmente diferentes. Y eso es exactamente lo que distingue a un mercado "predecible" de uno "volátil".
Reglas aproximadas para bajas ganadoras de obra pública:
- Desviación < 4 pp — mercado muy predecible. La mediana es una guía fiable.
- Desviación 4-6 pp — mercado razonablemente predecible. La estadística funciona bien.
- Desviación 6-9 pp — mercado con dispersión alta. Hay que complementar con análisis segmentados.
- Desviación > 9 pp — mercado disperso o datos no homogéneos. Segmentar más fino antes de sacar conclusiones.
Los organismos más predecibles de la obra pública española se mueven en el rango 4-6 pp (TRAGSA, Gobierno Vasco, AENA); los más volátiles, por encima de 7 pp (DGC Carreteras, SEPES).
Percentiles: qué significan y cómo usarlos
El percentil X es el valor por debajo del cual cae el X % de los datos. En bajas ganadoras:
- Percentil 25 (P25) — el valor tal que el 25 % de las obras se gana con bajas menores.
- Percentil 50 (mediana) — el valor central.
- Percentil 75 (P75) — el valor tal que el 75 % de las obras se gana con bajas menores (y por tanto, un 25 % con bajas mayores).
Para decidir una estrategia de baja, los percentiles son más útiles que la media:
Resumen de esta sección
- •Estrategia conservadora — apuntar al P40-P50. Bajas moderadas, mayor margen.
- •Estrategia equilibrada — apuntar al P60-P70. Zona con alta probabilidad de adjudicación sin comprometer margen en exceso.
- •Estrategia agresiva — apuntar al P75-P85. Bajas más agresivas, mayor probabilidad de adjudicación, menor margen.
- •Estrategia extrema — apuntar al P90+. Riesgo elevado de entrar en temeridad o perder rentabilidad.
Distribuciones estadísticas: el siguiente nivel
Más allá de los estadísticos descriptivos, el análisis avanzado consiste en ajustar distribuciones estadísticas a los datos. Esto permite no sólo describir el pasado sino estimar probabilidades futuras.
Algunas distribuciones relevantes para bajas de licitaciones:
Normal (gaussiana)
La clásica campana simétrica. Útil cuando los datos son simétricos alrededor de la media. Rara vez se ajusta perfectamente a bajas de obra pública porque suelen tener asimetría.
Lognormal
Distribución asimétrica con cola derecha, donde el logaritmo de los datos sigue una distribución normal. Es un buen modelo para bajas cuando la media es moderada y existe cola de bajas muy agresivas.
Beta
Distribución definida en un intervalo [a,b]. Muy útil cuando hay un rango "natural" de bajas entre 0 y un umbral superior (por ejemplo, el umbral de temeridad).
Weibull
Distribución flexible que puede adoptar formas diversas según sus parámetros. Se usa frecuentemente en análisis de fiabilidad y también se ajusta bien a conjuntos de bajas con asimetrías específicas.
Gamma
Otra distribución asimétrica común. Puede ajustarse bien a bajas cuando la distribución tiene una cola pronunciada en uno de los dos lados.
¿Quieres ver estos datos en tiempo real?
Certero analiza más de 262.000 licitaciones reales para darte la baja óptima en cada organismo.
Cómo identificar la distribución de un segmento
Dada una muestra de bajas ganadoras de un organismo para un determinado CPV y rango de presupuesto, la pregunta es: ¿qué distribución la describe mejor?
El procedimiento estándar es:
- Ajustar varias distribuciones candidatas (normal, lognormal, beta, Weibull, gamma…) por máxima verosimilitud.
- Evaluar el ajuste con tests de bondad: AIC, BIC, Kolmogorov-Smirnov.
- Seleccionar la distribución con mejor ajuste, penalizando la complejidad (AIC/BIC) para evitar sobreajuste.
- Validar visualmente con histograma y Q-Q plot.
Una vez seleccionada la distribución, se pueden responder preguntas como:
- ¿Qué probabilidad hay de que la baja ganadora esté por debajo del X %?
- ¿Qué baja tiene probabilidad del 70 % de superar a la competencia?
- ¿Cuál es el valor esperado del umbral de temeridad?
AIC y Kolmogorov-Smirnov: los tests clave
AIC (Akaike Information Criterion)
El AIC pondera la bondad del ajuste con la complejidad del modelo: un modelo con más parámetros se penaliza. Para comparar varias distribuciones, se elige la que minimiza el AIC.
< 4 unidades
Diferencia mínima de AIC para considerar que una distribución es "significativamente mejor" que otra
Kolmogorov-Smirnov (K-S)
El test K-S compara la distribución empírica de los datos con la distribución teórica. Si el p-valor del test es mayor que un umbral (habitualmente 0,05), no podemos rechazar que los datos sigan esa distribución. Es una validación estadística formal del ajuste.
No todas las herramientas del mercado aplican este nivel de rigor estadístico: en nuestra comparativa de software para licitaciones de construcción desglosamos qué hace cada plataforma. En Certero, cada segmento del histórico (organismo × CPV × presupuesto) se analiza automáticamente con este enfoque: se ajustan 11 distribuciones candidatas, se compara su AIC y K-S, y se selecciona la mejor para alimentar las recomendaciones. Esto permite que las recomendaciones no se basen en un modelo estadístico genérico, sino en la distribución real observada del segmento concreto en el que el usuario va a competir.
Nota
Ajustar distribuciones requiere muestras razonables. Por debajo de 30-40 observaciones, los ajustes son inestables y es preferible limitarse a estadísticos descriptivos. Por encima de 100, las distribuciones ajustadas son ya muy informativas.
Ejemplo práctico: dos segmentos, dos decisiones
Supongamos que tenemos dos segmentos con la misma mediana (16 %) pero distribuciones distintas:
Segmento A — Distribución normal con media 16 % y desviación 3 pp.
- P(baja ≥ 19 %) ≈ 16 %
- P(baja ≥ 22 %) ≈ 2 %
- Con oferta al 18 %, probabilidad de superar a la mediana del mercado: ~25 %
Segmento B — Distribución lognormal con mediana 16 % y asimetría pronunciada.
- P(baja ≥ 19 %) ≈ 28 %
- P(baja ≥ 22 %) ≈ 11 %
- Con oferta al 18 %, probabilidad de superar a la mediana del mercado: ~42 %
La misma oferta en el mismo valor de baja da resultados muy distintos según la forma de la distribución. Las decisiones basadas solo en la mediana no capturan este matiz; las decisiones basadas en la distribución completa sí.
Limitaciones y precauciones
Algunas precauciones que hay que tener al aplicar estadística avanzada:
1. Muestra insuficiente
Con menos de 30-40 observaciones, los ajustes son poco fiables. Amplía el segmento (más CPV, más rango de presupuesto, ventana temporal más larga) antes de sacar conclusiones.
2. Cambios estructurales
Si el mercado ha cambiado estructuralmente (nuevo competidor, nueva normativa, inflación disruptiva), los datos pre-cambio pueden no representar el comportamiento futuro.
3. Sobreajuste
Tres parámetros pueden ajustar "cualquier" conjunto de 20 observaciones. No confundas bondad de ajuste con capacidad predictiva.
4. Dependencia temporal
Las observaciones no son completamente independientes: las dinámicas de un trimestre influyen en el siguiente. Asumir independencia total es una simplificación razonable pero imperfecta.
Para complementar el enfoque estadístico con la visión operativa, puedes leer nuestra reflexión sobre la importancia de los datos históricos y el artículo específico sobre baja temeraria, donde la estimación estadística del umbral es el punto central.
Conclusión
La estadística aplicada a licitaciones no es academicismo: es la única forma de convertir el ruido de miles de observaciones en decisiones defendibles. Percentiles, distribuciones, tests de bondad de ajuste y simulaciones permiten pasar de "creo que 18 % va bien" a "la probabilidad de superar a la competencia en este segmento con una baja del 18 % es del 42 %, con una distancia al umbral de temeridad de 3,1 pp". Ese salto cualitativo es el que, sistemáticamente, separa a las constructoras que ganan de las que adivinan.
Deja de adivinar. Acierta.
Certero te da el rango de baja óptimo para cada licitación, basado en datos reales y análisis estadístico avanzado.
Empieza tu prueba gratuita14 días gratis · Sin tarjeta de crédito · Cancela cuando quieras
