Feminicidio en México, ¿10 casos al día?

Pedro Andrés Hernández Amador

3 de diciembre del 2021

El presente análisis se ha realizado como parte de las actividades de evaluación del módulo de probabilidad en el curso Matemáticas para ciencia de datos impartido en el primer semestre de la Maestría en ciencia de datos de la Universidad de Sonora.

El feminicidio se define como el asesinato intencional de una mujer sólo por ser mujer, aunque algunas otras definiciones consideran como feminicidio a cualquier caso de asesinato donde las víctimas sean mujeres o niñas, [1] en este trabajo nos apegaremos al último caso.

Este delito se ha convertido en uno de los principales y más graves problemas que el México actual enfrenta. Una dato importante (y alarmante) que en los últimos meses se ha divulgado en diferentes medios de comunicación es que cada día 10 mujeres son asesinadas en el país. [2], [3], [4]. De acuerdo a El Financiero [5], el año pasado Cada 2 horas y media una mujer fue asesinada, es decir, 9.6 mujeres al día.

El objetivo principal de este análisis es realizar una prueba de hipótesis utilizando los datos oficiales de asesinatos en México y determinar si la información proporcionada nos otorga evidencia estadística para creer, o no, que el número de mujeres asesinadas diariamente en México es igual a diez.

Obtención de los datos

El análisis se realizará tomando en cuenta las cifras oficiales de mortalidad por homicidios proporcionadas por el INEGI. En la primer parte de este trabajo se analizarán los datos agrupados por edades y por mes. Luego, se utilizarán los datos que contienen el número de homicidios total para realizar una prueba de hipótesis. Los pasos para descargar los datos son los siguientes:

  1. Acceder al portal de datos del INEGI correspondiente a las defunciones por homicidio.
  2. Seleccionar las variables "Entidad y municipio de ocurrencia", "Año de ocurrencia", "Sexo", Edad y dar click en el botón "Ver consulta" que se localiza al fondo de la página.
  3. En la siguiente pantalla seleccionar el año 2020 y seleccionar los rangos de edad. Para descargar el número de homicidios totales sin considerar la edad, asignar la edad como Total
  4. A continuación, se desplegarán los datos correspondientes a los casos de homicidio registrados en 2020 agrupados por entidad federativa y sexo. Para descargar los datos dar click en el botón "Exportar" habiendo seleccionado el formato Excel 5.0(.xls)

Para descargar los datos agrupados por mes se sigue el mismo procedimiento.

Para facilitar la ejecución de esta libreta, los datos que contienen el número de homicidios totales ya se encuentra almacenado en el archivo homicidios_2020.xls; asimismo, los archivos correspondientes al número de homicidios por edad se encuentran cada uno en su determinado archivo en la carpeta homicidios_por_edad. En la carpeta homicidios_por_mes se encuentran los datos agrupados por mes. Estas carpetas junto con la libreta pueden ser consultadas en este repositorio de Github.

Lectura de los datos

Se importan las librerías necesarias

Se cargan los datos en un DataFrame y se ajustan los parámetros del método pd.read_excel() para leer correctamente el conjunto de datos que corresponde al número total de homicidios agrupados por cada estado de la república mexicana.

Ahora se leerán los datos agrupados por edad. En este caso el procedimiento es más complejo ya que los datos para cada rango de edad se encuentran en archivos diferentes.

Reordenamos las columnas para acomodar los rango de edades de menor a mayor y convertimos todos los valores a números enteros.

Utilizando un procedimiento similar se cargarán los datos agrupados por mes.

Análisis exploratorio

A continuación se realizará un análisis exploratorio para ilustrar algunas características importantes de los datos

Se puede observar cómo la distribución se asemeja a una normal ligeramente sesgada hacia la derecha. También podemos ver que lamentablemente el 4.67% de los casos corresponden a mujeres infantes y adolescentes (entre 0 y 14 años). Además podemos discernir fácilmente que la mayoría de mujeres asesinadas son personas jóvenes con entre 15 y 44 años de edad, estos rangos de edad abarcan el 74% de los casos.

El número de feminicidios permaneció alto y con relativamente con poca variación, entre 271 y 352 casos mensuales. Lo que sí es importante remarcar es que en el último trimestre del año el número de casos fue a la baja.

Podemos observar que, por mucho, la entidad federativa con más feminicidios es Guanajuato. Sonora se encuentra en el decimocuarto sitio (sin contar la entidad No especificado).

Prueba de hipótesis

Como la información proporcionada por el INEGI corresponde a los datos de un año completo necesitamos modificar nuestra hipótesis. Los medios de comunicación establecen que diariamente asesinan a 10 mujeres, si tomamos en cuenta este dato como verdadero, entonces cada año el número de mujeres asesinadas es de 3,650. Ahora, para obtener la probabilidad de que una mujer sea asesinada debemos considerar el número de mujeres en México. De acuerdo al INEGI [6], en 2020 el 51.2% de la población mexicana total eran mujeres, es decir 64,540,634. Conociendo esta información podemos comenzar con la prueba de hipótesis.

Se obtiene el número de mujeres asesinadas en el 2020

Los datos

Ahora, establecemos las hipótesis

Luego, definimos el estimador y el estadístico de prueba

Podemos usar este estadístico de prueba porque podemos suponer que $X \sim Binom(n,p_0)$ y el parámetro $n$ es "muy grande".

Como nuestra hipótesis alternativa es $H_1: p > p_0$, entonces rechazaremos la hipótesis nula $H_0$ si $Z_c > Z_{1-\alpha}$. La prueba de hipótesis se realizará con un nivel de confianza del 95%, es decir $\alpha = .05$. A continuación se realizarán los cálculos correspondientes.

El resultado de la prueba de hipótesis nos dice que existe evidencia suficiente para rechazar $H_0$ a un nivel de $\alpha = .05$; es decir, podemos sospechar de que no es cierto que el número de mujeres asesinadas diariamente en México es igual a diez, si no que el número es mayor.

En busca de la verdad

Con un 95% de confianza podemos decir que en México asesinan a más de 10 mujeres al día. A continuación, buscaremos el número de mujeres asesinadas que más se acerque a la realidad pero ahora mediante pruebas de hipótesis de dos colas.

Todos los datos permanecerán constantes a excepción de $p_0$ porque el número de mujeres asesinadas al año variará y $Z_c$ ya que éste depende de $p_0$; además, ahora necesitaremos calcular $Z_{1-\frac{\alpha}{2}}$ y $-Z_{1-\frac{\alpha}{2}}$, valores que marcarán las regiones de rechazo de la prueba de hipótesis.

Nuevas hipótesis

Para encontrar el rango más probable de mujeres asesinadas en México se realizarán $m$ pruebas de hipótesis partiendo de que el número de asesinatos diarios es 0.1. En algún momento, para cierta $p_0$, la hipótesis nula dejará de rechazarse y esto marcará el límite inferior de nuestro intervalo. El algoritmo terminará hasta que $H_0$ vuelva a rechazarse, con lo que habremos encontrado el límite superior del intervalo.

Conclusiones

La distribución por edades del número de casos de feminicidios parece seguir una distribución normal. De esta representación de los datos pudimos observar que el 74% de las mujeres asesinadas tenían la edad de entre 15 y 44 años; además, el 4.67% de los casos corresponden a niñas y adolescentes. También observamos que en el 2020 el número de feminicidios permaneció muy alto pero con poca variación a lo largo del año presentando una tendencia a la baja en los últimos tres meses. Asimismo, obtuvimos que Guanajuato, el Estado de México y Chihuahua son las tres entidades federativas con el mayor número de feminicidios registrados. Sonora se encuentra en el decimocuarto puesto.

De la prueba de hipótesis podemos concluir que, con un nivel de confianza del 95%, en México son asesinadas entre 10.6 y 11.2 mujeres diariamente, para fines prácticos podemos establecer este número en 11. Esto es alarmante porque significa que las medidas tomadas (si es que existe alguna) para menguar este grave problema están fracasando; además, el incremento en un caso diario supone un incremento de 365 asesinatos en un año. Desgraciadamente tenemos que comenzar a hablar de 11 mujeres asesinadas al día así como algunas fuentes que ya han encontrado y reportado esta nueva cifra con anterioridad [7], [8], [9].