Picture credit score: © Joe Nicholson-USA TODAY Sports activities
Traducido por José M. Hernández Lagunes
Aunque no hayas tomado una clase de estadística, probablemente aprendiste estadística básica en la preparatoria. Puede que incluso en secundaria. Ya sabes, cómo calcular la media de un conjunto de números. Si tienes cinco números, los sumas y los divides entre cinco.
Esa es la media. El problema es que la media no siempre es útil. Supongamos que vives en una ciudad donde hay cinco personas y cada una gana $50,000 al año. La media es $50,000. En mi ciudad también hay cinco personas. Una gana 100, otra 200, otra 300, otra 400 y otra 499,000. La media es de $100,000, el doble que en tu ciudad. ¿Significa eso que los habitantes de mi ciudad son más ricos? Por supuesto que no.
Para eso es útil la mediana. Es el valor medio. Tu ciudad tiene ingresos medios de 50,000. En la mía, es de 300. Eso es más descriptivo.
El tercer tipo de promedio, del que todo el mundo se olvida, es la moda o modal. Es el número que aparece con más frecuencia. Digamos que una tienda de vinos tiene 30 clientes en una hora. Siete pasan por los pasillos y se van con las manos vacías. Nueve se llevan una botella. Siete se llevan dos, cuatro se llevan tres y uno se lleva cuatro. Uno se lleva una caja entera y otro dos cajas. La media es de 2.5 botellas por cliente. La mediana es una. La moda es dos. Eso tiene más sentido, ¿verdad? Si le preguntas al dueño cuántas botellas se llevan sus clientes, te dirá: “La mayoría se llevan dos”.
Bien, ya he terminado con las cosas básicas que ya sabías. La cuestión es: aunque la media y la mediana suelen ser las medidas estadísticas más útiles de la media, hay ocasiones en las que la moda funciona mejor.
***
Retrosheet es una herramienta absolutamente inestimable. Es el motor de muchos de los sitios de datos de béisbol con acceso público. Está hecho por voluntarios al 100% y todo en el sitio es free of charge. Es increíble. Retrosheet ha catalogado las anotaciones de los partidos desde 1871 y las jugadas desde 1918. No está completo en todos los casos, pero es lo mejor que tenemos y es del dominio público. Una herramienta maravillosa.
Para cualquier temporada, puedes descargar los registros de cada partido. Esto es lo que obtuve de 161 columnas de datos de Retrosheet de la temporada 2023.
***
El punto del preámbulo es que este es un buen ejemplo de cuándo el modo es útil. En 2023 hubo 4.62 carreras por equipo y partido. Pero como todos los promedios, eso se ve afectado por valores atípicos en el lado alto. Hay partidos en los que los equipos anotaron diez carreras más que la media. No hay partidos en los que los equipos anotaron 10 carreras menos que la media. ¿Qué ocurrió con más frecuencia?
Anotaciones. Hubo 4.62 carreras por equipo y partido. La puntuación media de los visitantes fue de 4.63 carreras. La puntuación media de los locales fue de 4.62 carreras (Esto no significa que los visitantes ganaran más partidos que los equipos locales. Los equipos locales ganaron 1,265-1,164, un porcentaje de victorias de .521). La puntuación media fue de 4 carreras para cada uno. ¿Pero sabes cuál fue el marcador más frecuente?
Fue 3 para los locales, 2 para los visitantes. Hubo 77 partidos con esa combinación exacta. Native 4, Visitantes 3 en segundo con 68 instancias. Le sigue Native 5, Visitantes 4, con 54. Los 10 primeros puestos los completan:
Native 3, Visitante 2: 52 veces
Native 5, Visitantes 4: 49 veces
Visitantes 4, Native 3 y Native 2, Visitantes 1: 48 veces
Native 7. Visitantes 6(!): 45 veces
Native 5, Visitantes 2: 45 veces
Visitantes 6, Native 2: 41 veces
Si lo que buscas es el resultado closing más ordinary, independientemente del equipo que ganara, fue el 3-2, que se produjo 129 veces. Hubo 116 partidos 4-3 y 103 partidos 5-4. En 2022, el tercer resultado más común fue 2-1. Que viva el reloj de lanzamiento y la regla de dejar de pisar la placa o lo que sea.
Field rating. Estos son los valores medios de los partidos de la temporada pasada.
Bateadores
Visitante
Native
AB
34.6
33.0
R
4.6
4.6
H
8.5
8.3
2B
1.7
1.7
HR
1.2
1.2
RBI
4.4
4.4
BB
3.3
3.2
Ok
9.0
8.2
SB
0.7
0.7
CS
0.2
0.2
LOB
6.9
6.7
Pitchers usados
4.1
4.4
Carreras limpias admitidas
4.2
4.3
PO
25.9
27.3
A
8.4
8.9
E
0.5
0.5
DP
0.8
0.8
Recuerda que el equipo native no siempre batea en la novena y puede que no consiga los tres outs en los further innings. Por eso los visitantes tienen más turnos al bate y el equipo native más outs. Observa la ventaja del equipo native tanto en ponches como en caminatas.
Estos son los valores modales, los resultados más comunes.
Bateadores
Visitante
Native
AB
33
33
R
3
3
H
8
8
2B
1
1
HR
1
1
RBI
3
3
BB
3
2
Ok
8
8
SB
0
0
CS
0
0
LOB
6
6
Pitchers usados
4
4
Carreras limpias admitidas
2
3
PO
24
27
A
8
9
E
0
0
DP
0
0
El año pasado el número modal de cuadrangulares por partido fue cero. No en 2023. Los equipos visitantes en 2023 batearon un cuadrangular 830 veces y ningúno 785 veces. Los equipos locales batearon una vez en los partidos 875 veces, pero lo mantuvieron todo en el parque 759 veces.
Tiempo de juego. La media fue de dos horas y cuarenta y dos minutos. Eso fue 24:23 más rápido que en 2022. Es posible que hayas oído hablar de esto. (El partido más largo del año fue el de los Cubs contra los Diamondbacks, el 16 de septiembre: Arizona 7, Chicago 6, 13 entradas, 4:24. El más corto fue Braves contra Mets, 28 de abril: Atlanta 4, Nueva York 0, suspendido tras cinco entradas, 1:23. La mediana elimina los valores atípicos: 2:47. La duración más común del partido, que se produjo 62 veces, fue de 2:41, un minuto menos que la media.
Alineaciones. Retrosheet incluye las alineaciones iniciales de cada equipo, con el nombre del jugador y su posición. Como las posiciones son numéricas, podemos utilizar la moda para averiguar qué posición batea con más frecuencia en cada alineación. Aquí se muestran las dos posiciones que aparecen con más frecuencia en cada puesto de la alineación.
Orden al bat
Visitante
Native
1
2B, LF
2B, LF
2
SS, 2B
SS, 1B
3
BD, 1B
BD, 1B
4
1B, BD
1B, BD
5
3B, BD
3B, BD
6
3B, RF
RF, 3B
7
C, 3B
C, 2B
8
C, CF
C, CF
9
C, CF
CF, C
No puedo explicar las diferencias en la selección de la alineación dependiendo de si el equipo está en casa o fuera. Las diferencias, sin embargo, no son grandes. De visitante, por ejemplo, el tercera base bateó en sexta posición 331 veces, el jardinero derecho 307 veces, el segunda base 316 veces y el jardinero izquierdo 308 veces. En casa, fue JD 329, 3B 324, 1B 302, y 2B 295. Son cambios enormes. No son grandes oscilaciones. Es interesante señalar que se nos dijo que la prohibición del cambio de posición pondría énfasis en la fortaleza de los jugadores de cuadro, que tendrían que utilizar su alcance, en lugar de su posición, para llegar a las pelotas, disminuyendo su producción ofensiva. Sin embargo, permanecieron en la parte superior del orden de bateo.
Estas son las alineaciones más comunes de los equipos visitantes y locales en 2022. Nótese que la primera ocurrió sólo 18 veces, la segunda 16.
Orden al bat
Visitante
Native
1
RF
RF
2
2B
2B
3
3B
3B
4
1B
1B
5
C
C
6
BD
BD
7
LF
LF
8
SS
SS
9
CF
CF
Sí ya sé, son los mismos. Esa alineación, habrás deducido, son los Atlanta Braves: Acuña, Albies, Riley, Olson, Murphy/d’Arnaud, Ozuna, Rosario (Pillar una vez), Arcia, Harris.
Anotación por entrada. A veces, el modo nos da información interesante. A veces no.
Visitante
Native
Inning
Media de carreras
Modo de carreras
Media de carreras
Moda de carreras
1
0.48
0
0.60
0
2
0.51
0
0.47
0
3
0.54
0
0.55
0
4
0.52
0
0.53
0
5
0.49
0
0.55
0
6
0.53
0
0.54
0
7
0.49
0
0.53
0
8
0.47
0
0.53
0
9
0.50
0
0.39
0
1-3
1.53
0
1.63
0
4-6
1.54
0
1.63
0
7-9
1.45
0
1.27
0
La diferencia entre la distribución por entradas de las carreras medias para los equipos locales y visitantes es interesante. Hubo un tiempo en el que la mayoría de las carreras se anotaban en la primera entrada. El bateador designado common ha cambiado esto. Esta es la distribución de las anotaciones en los últimos tres años en la Liga Americana (excluyendo la novena entrada, como se ha comentado anteriormente):
La ofensiva disminuyó en 2022, pero 2023 no es notablemente diferente que el 2021.
La Liga Nacional sí es diferente.
En 2021, la entrada con más carreras de la Liga Nacional fue la primera, con un amplio margen. En 2022 no fue así en absoluto, y en 2023 se anotaron casi tantas carreras en la tercera entrada como en la primera. La razón del predominio en la primera entrada en 2021 es que el equipo al bate tenía una alineación (teóricamente) optimizada, pero también porque había pocas posibilidades de que el out automático representado por el puesto del lanzador en la alineación llegara al bate.
Este patrón ha existido a lo largo de la historia del béisbol. Un siglo antes, en 1921, la entrada con más carreras fue la primera. En 1930, cuando los equipos anotaron un récord de 5.49 carreras por partido, fue la primera entrada. En 1968, el año del lanzador, cuando se anotaron 3.42 carreras por partido, fue la primera entrada. La hegemonía de la primera entrada fue constante hasta 1998, cuando la Liga Americana anotó más carreras en las entradas tres a siete que en la primera. Desde entonces, la primera entrada ha sido la más anotadora de la Liga Americana en sólo seis temporadas. Una combinación de la construcción moderna de las alineaciones, la habilidad common de los bateadores de la MLB y la ausencia de lanzadores bateando ha dado como resultado una distribución mucho más uniforme de las carreras entre las entradas. Con el BD common, se acabaron los días en los que se anotaban más carreras en la primera entrada que en ninguna otra.
Thanks for studying
It is a free article. If you happen to loved it, take into account subscribing to Baseball Prospectus. Subscriptions help ongoing public baseball analysis and evaluation in an more and more proprietary surroundings.
Subscribe now