Diez errores estadísticos que frenan tu manuscrito clínico y cómo corregirlos

Errores comunes en investigación científica

Los errores estadísticos y de presentación siguen siendo una causa habitual de rechazo o de revisiones mayores en manuscritos biomédicos. A partir de la experiencia acumulada en más de 200 revisiones para revistas científicas en los últimos años, se describen 10 fallos recurrentes que comprometen la interpretabilidad, la credibilidad y la reproducibilidad de los resultados. El objetivo es ofrecer una guía práctica, orientada a autores y revisores, para detectar rápidamente estos problemas y corregirlos antes del envío.

Diez problemas habituales y cómo evitarlos

1) Uso incorrecto de lenguaje causal

Qué ocurre: se emplean expresiones que implican causalidad (por ejemplo, “x conduce a y”) cuando el diseño solo permite concluir asociación, especialmente en estudios transversales.

Por qué importa: los lectores se apoyan en el resumen para extraer mensajes; un lenguaje causal puede inducir conclusiones erróneas, sobre todo en quienes no dominan metodología.

Cómo evitarlo: revisar las conclusiones con “prudencia de diseño” y valorar si un lector independiente aceptaría la fuerza del mensaje según diseño, datos perdidos y análisis. Pedir una segunda opinión si hay dudas.

2) Resúmenes mal estructurados

Qué ocurre: subtítulos incorrectos, hallazgos colocados en métodos y resultados sin cuantificación.

Por qué importa: una estructura confusa reduce credibilidad y facilita malinterpretaciones; además, incumplir normas editoriales hace dudar del rigor global del manuscrito.

Cómo evitarlo: seguir las instrucciones de la revista, revisar ejemplos publicados y asegurar que el resumen cubre con claridad el qué, quién, dónde, cuándo y por qué, con resultados cuantificados.

3) Resultados dentro de la sección de métodos

Qué ocurre: se “filtran” resultados (tamaño muestral logrado, pérdidas, medias/medianas, valores de p, medidas de fiabilidad) en métodos.

Por qué importa: rompe la estructura científica y dificulta la lectura y la evaluación crítica.

Cómo evitarlo: redactar métodos como si el estudio no estuviera completado; cualquier dato derivado de la ejecución del estudio debe ir en resultados (salvo excepciones lógicas, como información de un piloto para cálculo muestral).

4) Descripción incompleta o inexacta del análisis estadístico

Qué ocurre: en resultados aparecen análisis “nuevos” no descritos en métodos, o se describen análisis en métodos que luego no se reportan. También se pierde el hilo lógico entre descripción, inferencia y modelos.

Por qué importa: el revisor estadístico escruta esta sección con detalle; si falta información, se compromete la reproducibilidad y se pierde la confianza en el trabajo.

Cómo evitarlo: alinear el orden de métodos y resultados: una lista de análisis descritos debe coincidir con lo finalmente reportado. Evitar “sorpresas” analíticas sin declarar.

5) Pruebas de normalidad usadas de forma inadecuada

Qué ocurre: se confía en pruebas de hipótesis de normalidad (p. ej., Kolmogorov–Smirnov o Shapiro-Wilk) como criterio decisivo.

Por qué importa: son muy dependientes del tamaño muestral: con muestras pequeñas pueden no detectar desviaciones y con muestras grandes pueden “sobredetectar” diferencias poco relevantes.

Cómo evitarlo: priorizar inspección visual (histograma o gráfico Q-Q) y, cuando se usa media y desviación estándar, considerar el rango que abarcaría aproximadamente el 95% de los datos como ayuda interpretativa.

6) Diagramas de flujo ausentes o insuficientes

Qué ocurre: se omiten etapas clave del flujo de participantes (considerados, contactados, excluidos, pérdidas, incluidos en análisis principal y análisis de sensibilidad) o falta granularidad.

Por qué importa: el diagrama de flujo aporta transparencia y permite valorar sesgos por pérdidas o exclusiones. La falta de detalle puede generar sospecha de información no explícita.

Cómo evitarlo: presentar un flujo completo desde la selección inicial hasta la muestra analizada, con razones de exclusión y pérdidas, y desglosado por brazos o exposiciones cuando aplique. Usar como referencia un esquema tipo CONSORT para decidir elementos mínimos.

7) Problemas en modelos de regresión (tres en uno)

Qué ocurre: confusión entre “multivariable” (varios predictores) y “multivariante” (varios desenlaces), inclusión de confusores sin justificar y ausencia de verificación de supuestos.

Por qué importa: la terminología condiciona lo que el lector espera; además, sin justificar confusores se debilita la interpretación causal/ajustada, y sin comprobar supuestos se cuestiona la validez del modelo.

Cómo evitarlo: usar la terminología correcta, justificar confusores (literatura previa, criterio experto o relevancia estadística) y declarar comprobaciones: por ejemplo, proporcionalidad de riesgos en Cox y colinealidad en modelos multivariables. En colinealidad, se recomienda evaluar el factor de inflación de la varianza, considerando preocupantes valores por encima de 10.

8) Selección de variables por significación univariable

Qué ocurre: se eligen variables para un modelo multivariable solo si en análisis univariable tienen p<0,05.

Por qué importa: los análisis univariables no ajustan por otros confusores; pueden ocultar asociaciones que emergen al ajustar o, al contrario, magnificar hallazgos espurios.

Cómo evitarlo: no basar la selección en p univariable. Considerar enfoques de evaluación del ajuste y parsimonia (p. ej., R2 ajustada en regresión lineal o criterios de información como el BIC), y preferir estrategias secuenciales combinando evidencia previa, criterio clínico y criterios estadísticos.

9) Reporte deficiente de datos perdidos

Qué ocurre: no se informa con precisión cuántos datos faltan, en qué variables y cómo se manejan; a menudo se recurre a enfoques problemáticos sin discusión.

Por qué importa: los datos perdidos pueden sesgar resultados y reducir precisión. El análisis por casos completos asume patrones de ausencia que pueden no cumplirse. Estrategias como “última observación arrastrada” o imputación de la media se consideran estadísticamente inadecuadas.

Cómo evitarlo: describir el método (por ejemplo, imputación múltiple y número de iteraciones), cuantificar número y proporción de ausencias por variable y señalizarlo en el flujo o tablas de resultados. Discutir limitaciones y realizar análisis de sensibilidad comparando casos completos frente a imputación.

10) Falta de detalle y coherencia en tablas

Qué ocurre: no se especifica si los estimadores son media o mediana, no queda claro si columnas son subgrupos, no se identifican las pruebas utilizadas y aparecen incoherencias como estimaciones fuera del intervalo de confianza o signos incorrectos.

Por qué importa: las tablas deben condensar información con máxima claridad; errores minan transparencia y reproducibilidad.

Cómo evitarlo: revisar coherencia de estimaciones e intervalos, pedir revisión externa “en frío”, y dejar inequívoco qué prueba se aplicó. Evitar reportar “NS” y mostrar siempre el valor de p. Expandir abreviaturas en notas, aunque parezcan obvias.

Bonus práctico para mejorar manuscritos

  • IQR frente a IQI: en datos asimétricos, en lugar de dar el IQR como un único número, es más informativo presentar el intervalo intercuartílico como percentiles 25 y 75 (IQI).
  • Intervalos de confianza frente a valores de p: los intervalos de confianza suelen aportar una interpretación más útil a nivel poblacional que el enfoque exclusivo en significación.
  • Gráficos: usar diagramas de barras para recuentos categóricos (no para medias), considerar escala logarítmica para medidas de razón con intervalos de confianza y elegir colores accesibles para personas con daltonismo.
  • Software estadístico: indicar siempre el software utilizado en métodos y citarlo correctamente, cuidando la capitalización (por ejemplo, Stata).

Mensajes clave

  • Evitar lenguaje causal cuando el diseño solo sustenta asociación.
  • Métodos y resultados deben estar alineados y en el mismo orden analítico.
  • La normalidad se evalúa mejor con inspección visual que con pruebas automáticas dependientes del tamaño muestral.
  • Modelos de regresión exigen terminología precisa, justificación de confusores y verificación de supuestos.
  • Los datos perdidos deben cuantificarse, explicarse y abordarse con estrategias robustas, idealmente con análisis de sensibilidad.

Relevancia clínica

La toma de decisiones en cardiología se apoya en evidencia publicada. Errores de análisis o de presentación pueden distorsionar el tamaño del efecto, la incertidumbre y la validez de las conclusiones, con impacto directo en cómo se interpretan intervenciones, pronóstico y asociaciones clínicas. Un manuscrito estadísticamente sólido mejora la calidad de la evidencia disponible y reduce el riesgo de conclusiones sobreinterpretadas.

Aplicación práctica

  • Antes del envío, comprobar que el resumen está estructurado según la revista y que cuantifica los resultados.
  • Releer métodos “como si el estudio no hubiera terminado” y desplazar cualquier hallazgo a resultados.
  • Verificar que cada análisis reportado aparece descrito en métodos, sin análisis “sorpresa”.
  • En regresión, justificar confusores y documentar comprobaciones de supuestos (incluida colinealidad).
  • Reportar datos perdidos por variable y añadir un análisis de sensibilidad cuando se use imputación.

Impacto en la práctica clínica

Aplicar esta lista de verificación reduce rechazos por problemas estadísticos, acelera el proceso editorial y favorece publicaciones más transparentes y reproducibles. Para el clínico, esto se traduce en resultados más fiables y comparables entre estudios, con mejor base para incorporar evidencia a guías, protocolos y decisiones a pie de cama.

Referencias:

  1. Heart. - Top 10 statistical pitfalls: a reviewer’s guide to avoiding common errors

 

Dr. Ramón Bover Freire

Ramón Bover Freire

Cardiólogo en el H. Clínico San Carlos de Madrid. Coordinador Unidad de Prevención y Rehabilitación Cardiaca. Diplomado en Estadística en Ciencias de la Salud por la Universidad Autónoma de Barcelona. ESADE Executive Education “Dirección de Servicios Integrados de Salud”.

@RamonBover

Colabora con CardioTeca
¿Quieres escribir en el Blog?
Únete a nuestros cientos de colaboradores científicos. Gana visibilidad y participa.

Blog Cardiología Clínica

Top 10: Lo más visto en 2025 en CardioTeca.com

Top 10: Lo más visto en 2025 en CardioTeca.com

  • Editores CardioTeca
  • 06 Ene
Inflamación y riesgo cardiovascular 2025

Inflamación y riesgo cardiovascular 2025

  • Jhan Saavedra Torres
  • 05 Ene

Servicios y Gestión de Proyectos - Trabaja con CardioTeca

Formación

Formación

Cursos online, con certificado de asistencia y acreditados. Formación cuándo y cómo quieras.
Patrocinio

Patrocinio

Acuerdos de colaboración o esponsorización de acciones y proyectos.
Ediciones

Ediciones

eBooks con depósito legal e ISBN, PDF navegables, infografías, pósters, publicaciones digitales.