viernes, 24 de octubre de 2008

Uso y abuso de los datos estadísticos

Cuando el documento realizado por el ex senador George J. Mitchell revelaba que Roger Clemens y otros más de ochenta jugadores de la Liga Profesional de Béisbol (Major Leage Baseball) habían consumido sustancias ilegales para mejorar su rendimiento, el galardonado lanzador hizo todo lo posible para limpiar su nombre. Además de la declaración de Clemens ante los legisladores del Capitolio, para demostrar su inocencia se adjuntó un voluminoso informe basado en datos estadísticos realizado por su agente de marketing.

Sin embargo, el artículo escrito por cuatro profesores de Wharton y publicado en New York Times el 10 de febrero defiende otra idea: la validez de cualquier tipo de análisis estadístico es tan bueno como cualquiera de las partes que lo componen. Esta puntualización posiblemente adquiera relevancia a medida que las organizaciones y los individuos intenten buscar cierto sentido a la creciente complejidad de datos estadísticos.

“Hoy en día los consumidores de información se ahogan entre tanto dato”, sostiene Justin Wolfers. “Empresas, trabajadores, estado y demás generan terabytes de datos en su empeño por cuantificar todo. Existen diversos modos de pulir las interferencias en los datos fuente. Desafortunadamente también es posible introducir interferencias en los mismos”.

Por ejemplo, una cadena de establecimientos al por menor podría analizar sus operaciones durante cierto periodo de tiempo y descubrir que en aquellas ocasiones en las que rebajó sus artículos se produjo una caída en las ventas. “Esto podría llevar a la conclusión de que la bajada en los precios ha provocado una reducción en el volumen de ventas”, dice Wolfers. “Pero la verdadera relación causal podría ser mucho más compleja. Antes de aumentar los precios con el fin –supuestamente- de incrementar las ventas, el minorista debería examinar algunas cuestiones adicionales para ver si en el periodo examinado la demanda en general había estado influenciada por otros factores. Por ejemplo, tal vez históricamente la empresa pone sus productos en rebaja precisamente durante periodos flojos de ventas. En este caso es la caída en las ventas la que provoca la reducción de los precios y no viceversa”.

Esto ilustra una dificultad fundamental inherente a los análisis estadísticos en el mundo de la empresa, en las ciencias sociales y en otros ámbitos, explica Wolfers. “En general es mucho más fácil aislar y descartar la información irrelevante cuando los investigadores trabajan con datos experimentales o científicos, como por ejemplo datos médicos”, señala. “En un contexto experimental, una empresa farmacéutica puede aleatoriamente distribuir el medicamento a determinado grupo de sujetos y el placebo a otro grupo. Suponiendo que los investigadores han escogido aleatoriamente a las personas que toman el medicamento, es posible identificar aisladamente los efectos del medicamento y del placebo”.

Pero en un contexto empresarial eso no es tan fácil. “En el ejemplo de la cadena de establecimientos al por menor, podría ser más difícil aislar los efectos que se deben a otros factores”, explica Wolfers. En cuanto a la modificación de los precios de venta, “sería necesario tener en cuenta la influencia de los días soleados versus los días de lluvia -o de los días en que hace calor y frío-, sobre el volumen de comercio y el comportamiento de los consumidores”.

En el caso Roger Clemens, Wolfers trabajó en colaboración con los profesores de Estadística Shane Jensen y Abraham Wyner, así como con el profesor de Marketing Eric Bradlow, para escribir un artículo titulado "Report Backing Clemens Chooses Its Facts Carefully" (“El informe que respalda a Clemens elige cuidadosamente los hechos”), que se publicó en Times.

En dicho artículo, los investigadores cuestionan la metodología empleada por Hendrick Sports Management para apoyar la declaración de Clemens desmintiendo el consumo de esteroides. “El informe Clemens intenta disipar toda sombra de duda al compararlo con Nolan Ryan, el cual se retiró en 1993 a los 46 años de edad”, se puede leer en el artículo. “Con dicha comparación Clemens no parece para nada un sujeto atípico: ambos jugadores disfrutaron del éxito bien entrados en los cuarenta. Se pueden extraer conclusiones similares cuando se compara a Clemens con dos de sus contemporáneos, Randy Johnson y Curt Schilling".

No obstante, los investigadores de Wharton afirman que dichas comparaciones son incompletas. “Si se compara a Clemens únicamente con aquellos que alcanzaron el éxito en la segunda parte de sus carreras -en lugar de compararlo con todos los lanzadores que tuvieron un éxito similar sólo en la primera parte de las mismas-, se minimiza artificialmente la posibilidad de que los datos sobre Clemens parezcan poco habituales”, escriben. “Los estadísticos llaman a este problema sesgo de selección”.

Igual que, en un análisis de comparación de precios, un comercio minorista debe considerar un escenario futuro alternativo plausible sobre cuál habría sido el nivel de ventas, los investigadores de Wharton sostienen que los resultados de Clemens deberían compararse con “todos los lanzadores con largas carreras profesionales”. Cuando se hace esto, la segunda parte de la carrera profesional de Clemens “es inusual”, escriben. La mayoría de lanzadores mejoran rápidamente al principio de sus carreras, alcanzan su máximo a los 30 años y luego lentamente entran en una fase de declive. Sin embargo, la carrera de Clemens empezó su descenso cuando tenía veinti-muchos años y posteriormente, bien entrados los cuarenta, protagonizó una sorprendente remontada.

En cuanto a “estadísticos contratados”, existe cierta tendencia a elegir grupos de comparación que favorezca las pretensiones de sus clientes, señalan los profesores de Wharton. Pero, ¿qué ocurre cuando se hacen análisis estadísticos sin la presión ejercida por determinado punto de vista? Análisis financieros, econometría, auditoría, producción u operaciones son algunas de las áreas donde se precisan datos sin sesgos para poder tomar buenas decisiones en un contexto de incertidumbre.
vía|http://wharton.universia.net

No hay comentarios: