Picture credit score: Thomas Shea-USA At this time Sports activities
Traducido por José M. Hernández Lagunes
Aunque no hayas tomado una clase de estadística, probablemente aprendiste estadística básica en la preparatoria. Puede que incluso en secundaria. Ya sabes, cómo calcular la media de un conjunto de números. Si tienes cinco números, los sumas y los divides entre cinco.
Esa es la media. El problema es que la media no siempre es útil. Supongamos que vives en una ciudad donde hay cinco personas y cada una gana $50,000 al año. La media es $50,000. En mi ciudad también hay cinco personas. Una gana 100, otra 200, otra 300, otra 400 y otra 499,000. La media es de $100,000, el doble que en tu ciudad. ¿Significa eso que los habitantes de mi ciudad son más ricos? Por supuesto que no.
Para eso es útil la mediana. Es el valor medio. Tu ciudad tiene ingresos medios de 50,000. En la mía, es de 300. Eso es más descriptivo.
El tercer tipo de promedio, del que todo el mundo se olvida, es la moda o modal. Es el número que aparece con más frecuencia. Digamos que una tienda de vinos tiene 30 clientes en una hora. Siete pasan por los pasillos y se van con las manos vacías. Nueve se llevan una botella. Siete se llevan dos, cuatro se llevan tres y uno se lleva cuatro. Uno se lleva una caja entera y otro dos cajas. La media es de 2.5 botellas por cliente. La mediana es una. La moda es dos. Eso tiene más sentido, ¿verdad? Si le preguntas al dueño cuántas botellas se llevan sus clientes, te dirá: “La mayoría se llevan dos”.
Bien, ya he terminado con las cosas básicas que ya sabías. La cuestión es: aunque la media y la mediana suelen ser las medidas estadísticas más útiles de la media, hay ocasiones en las que la moda funciona mejor.
<p fashion=”text-align: heart;”>***</p>
Retrosheet es una herramienta absolutamente inestimable. Es el motor de muchos de los sitios de datos de béisbol con acceso público. Está hecho por voluntarios al 100% y todo en el sitio es free of charge. Es increíble. Retrosheet ha catalogado las anotaciones de los partidos desde 1871 y las jugadas desde 1918. No está completo en todos los casos, pero es lo mejor que tenemos y es del dominio público. Una herramienta maravillosa.
Para cualquier temporada, puedes descargar los registros de cada partido. Esto es lo que obtuve de 161 columnas de datos de Retrosheet de la temporada 2022.
<p fashion=”text-align: heart;”>***</p>
El punto del preámbulo es que este es un buen ejemplo de cuándo el modo es útil. En 2021 hubo 4.53 carreras por equipo y partido. Pero como todos los promedios, eso se ve afectado por valores atípicos en el lado alto. Hay partidos en los que los equipos anotaron diez carreras más que la media. No hay partidos en los que los equipos anotaron 10 carreras menos que la media. ¿Qué ocurrió con más frecuencia?
Anotaciones. Hubo 4.28 carreras por equipo y partido. La puntuación media de los visitantes fue de 4.25 carreras. La puntuación media de los locales fue de 4.32 carreras. La puntuación media fue de 4 carreras para cada uno. ¿Pero sabes cuál fue el marcador más frecuente?
Fue 3 para los locales, 2 para los visitantes. Hubo 79 partidos con esa combinación exacta, uno más que Native 2, Visitantes 1, justo por delante de Native 4, Visitantes 3, con 72. Los 10 primeros puestos los completan:
Native 5, Visitante 3: 65 veces
Native 5, Visitantes 4: 60 veces
Visitantes 3, Native 2: 59 veces
Visitantes 4, Native 3: 57 veces
Visitantes 4, Native 2: 51 veces
Native 4, Visitantes 2: 49 veces
Native 4, Visitantes 1: 48 veces
Si lo que buscas es el resultado remaining más routine, independientemente del equipo que ganara, fue el 3-2, que se produjo 138 veces. Hubo 129 partidos 4-3 y 125 partidos 2-1. En 2021, el tercer resultado más común fue 5-4, lo que ilustra el declive ofensivo de 2021 a 2022.
Field rating. Estos son los valores medios de los partidos de la temporada pasada.
Bateador
Visitante
Native
AB
34.5
32.8
R
4.2
4.3
H
8.3
8.1
2B
1.7
1.6
HR
1.1
1.1
RBI
4.1
4.1
BB
3.0
3.1
Okay
8.7
8.0
LOB
6.8
6.6
Pitchers utilizados
4.2
4.4
CL permitidas
3.9
3.9
PO
25.8
27.3
A
8.6
9.0
E
0.5
0.5
DP
0.8
0.8
Recuerda que el equipo native no siempre batea en la novena y puede que no consiga los tres outs en los further innings. Por eso los visitantes tienen más turnos al bate y el equipo native más outs. Observa la ventaja del equipo native tanto en ponches como en caminatas.
Estos son los valores modales, los resultados más comunes.
Bateadores
Visitante
Native
AB
34
33
R
3
3
H
7
8
2B
1
1
HR
0
0
RBI
3
3
BB
3
3
Okay
9
8
LOB
6
6
Pitchers utilizados
4
4
CL permitidas
2
3
PO
24
27
A
9
9
E
0
0
DP
0
0
En los otros años que he hecho este análisis, el número modal de cuadrangulares por partido fue uno, no cero. Los equipos visitantes en 2022 no batearon cuadrangulares 914 veces y batearon uno 829 veces. Los equipos locales batearon un toletazo de vuelta entera 848 veces, pero no lo hicieron 883 veces. También es digno mencionar que, aunque los equipos locales anotaron más que los visitantes, cedieron tres carreras limpias por partido con mayor frecuencia, 379 en comparación con 344 por dos carreras limpias y 342 por una. Los equipos visitantes recibieron tres carreras en contra 348 veces, dos 389 veces y una 309 veces.
Tiempo de juego. La media fue de tres horas y siete minutos. Eso fue 4:45 más rápido que en 2021. (Este whole es para todos los juegos, no sólo los juegos de nueve entradas.) El juego más largo del año fue Twins en Cleveland el 17 de septiembre: Cleveland 7, Minnesota 6, 16 entradas, 5:24. El más corto fue Nationals en Philadelphia, 4 de agosto: Philadelphia 5, Washington 4, suspendido tras la parte alta de la quinta, 1:39. La mediana elimina los valores atípicos: 3:04. La duración más común del partido, que ocurrió 56 veces, fue de 3:01, seis minutos menos que la media.
Alineaciones. Retrosheet incluye las alineaciones iniciales de cada equipo, con el nombre del jugador y su posición. Como las posiciones son numéricas, podemos utilizar la moda para averiguar qué posición batea con más frecuencia en cada alineación. Aquí se muestran las dos posiciones que aparecen con más frecuencia en cada puesto de la alineación.
Orden al bat
Visitante
Native
1
2B, CF
2B, CF
2
SS, 1B
SS, 1B
3
DH, 1B
DH, 1B
4
1B, DH
1B, DH
5
DH, 1B
DH, RF
6
RF, 3B
LF, 2B
7
LF, 3B
3B, 2B
8
C, CF
C, CF
9
C, CF
C, CF
No puedo explicar las diferencias en la selección de la alineación dependiendo de si el equipo está en casa o fuera. Pero las diferencias no son grandes. Fuera de casa, el jardinero derecho bateó el sexto 329 veces, el tercera base 318 veces, el segunda base 314 veces y el jardinero izquierdo 311 veces. En casa, fue el LF 346, el 2B 341, el 3B 307 y el RF 295 veces. No son grandes cambios. Es interesante notar, consistente con lo que escribí la semana pasada, que los jardineros centrales fueron generalmente débiles en el plato en 2022, reflejado por su posicionamiento en la parte inferior del orden.
Estas son las alineaciones más comunes de los equipos visitantes y locales en 2022. Nótese que la primera ocurrió sólo 10 veces, la segunda 13.
Orden al bat
Visitante
Native
1
CF
CF
2
RF
3B
3
SS
DH
4
1B
SS
5
DH
LF
6
2B
2B
7
LF
1B
8
3B
C
9
C
RF
¿Parece inconceivable esa alineación del equipo native: el parador en corto bateando de limpio, el primera base bateando séptimo? Esa fue la alineación de Boston los días 16, 17, 19, 21, 27, 28, 30 y 31 de mayo; y 15, 16, 17, 20 y 21 de junio: Hernández-Devers-Martínez-Bogaerts-Verdugo-Story-Cordero/Dalbec-Vázquez/Plawecki-Bradley. Creo que podemos asumir con seguridad que no batearán mucho a su campocorto cuarto en 2023.
Carreras por entrada. A veces, el modo nos da información interesante. A veces no.
Visitante
Native
Inning
Media de carreras
Moda de carreras
Media de carreras
Moda de carreras
1
0.43
0
0.57
0
2
0.39
0
0.48
0
3
0.50
0
0.50
0
4
0.47
0
0.47
0
5
0.51
0
0.50
0
6
0.47
0
0.50
0
7
0.47
0
0.47
0
8
0.42
0
0.52
0
9
0.47
0
0.39
0
1-3
1.33
0
1.55
0
4-6
1.45
0
1.48
0
7-9
1.35
0
1.20
0
La diferencia entre la distribución por entradas de las carreras medias de los equipos locales y visitantes es interesante. El hecho de que la anotación más común en una entrada sea cero no lo es.
Pero hay una diferencia notable con respecto a los últimos años. Este gráfico muestra las carreras por entrada de las dos Ligas en las dos últimas temporadas.
He omitido la novena entrada debido al problema del equipo native comentado anteriormente. Nota la diferencia entre la Liga Nacional de 2021, la línea negra gruesa, y las otras tres líneas. En 2021, la entrada con más carreras en la Liga Nacional, por un amplio margen, fue la primera. Eso se debe a que el equipo al bate tenía una alineación (teóricamente) optimizada, pero también a que había pocas posibilidades de que el out automático representado por el puesto del lanzador en la alineación llegara al bate. Este patrón ha existido a lo largo de la historia del béisbol. Un siglo antes, en 1921, la entrada con más carreras fue la primera. En 1930, cuando los equipos anotaron un récord de 5.49 carreras por partido, fue la primera entrada. En 1968, el año del lanzador, cuando se anotaron 3.42 carreras por partido, fue la primera entrada. La hegemonía de la primera entrada fue constante hasta 1998, cuando la Liga Americana anotó más carreras en las entradas tres a siete que en la primera. Desde entonces, sólo en seis temporadas se anotaron más carreras en la primera entrada de los partidos de la Liga Americana. Una combinación de la construcción moderna de las alineaciones y la ausencia de lanzadores bateando dio como resultado una distribución mucho más uniforme de las carreras entre las entradas. Con el bateador designado common, se acabaron los días en los que se anotaban más carreras en la primera entrada que en ninguna otra.
Thanks for studying
This can be a free article. Should you loved it, think about subscribing to Baseball Prospectus. Subscriptions assist ongoing public baseball analysis and evaluation in an more and more proprietary setting.
Subscribe now