# C√≥mo se usan los modelos de series de tiempo para proyectar las ventas en una empresa

> *–û—Ç–Ω—ã–Ω–µ –≤—Ä–µ–º—è –±—É–¥–µ—Ç —Ç–µ—á—å –ø–æ –ø—Ä—è–º–æ–π;
> –®–∞–≥ –≤–≤–µ—Ä—Ö, —à–∞–≥ –≤–±–æ–∫ ‚Äì –∏—Ö –º–∏—Ä –∑–∞ —Å–ø–∏–Ω–æ–π.
> –Ø —Å–∂–µ–≥ –∏—Ö –∂–∏–∑–Ω—å, –∫–∞–∫ –≤–æ—Ä–æ—Ö –≥–∞–∑–µ—Ç ‚Äì
> –û—Å—Ç–∞–ª—Å—è —Ç–æ–ª—å–∫–æ –≥—Ä—è–∑–Ω—ã–π –∞—Å—Ñ–∞–ª—å—Ç.*
> - –†–æ–∫-–Ω-—Ä–æ–ª–ª –º–µ—Ä—Ç–≤
> –ê–∫–≤–∞—Ä–∏—É–º
> 


_Elaborado en el ejercicio del a√±o sab√°tico autorizado en la UJED_

## Introducci√≥n

Si lo que buscas es una herramienta para predecir el comportamiento de una variable en el tiempo, esto es lo m√°s cercano que encontrar√°s.

La frase ‚Äúseries de tiempo‚Äù significa dos cosas:

1. Modelos que analizan la naturaleza de fluctuaciones temporales de una variable (o varias).
2. Registros regulares de datos de una variable en el tiempo (p. ej. registros mensuales del Producto Interno Bruto).

El supuesto clave de las series de tiempo es que podemos extraer informaci√≥n sobre el comportamiento de nuestros datos s√≥lo con el registro de su comportamiento en el tiempo. Si lo piensas, es un supuesto fuerte. Pero pronto ver√°s que aplicando algunos trucos, este supuesto puede llegar a ser muy razonable.

### Para qu√© se usan las series de tiempo

Los modelos de series de tiempo son muy populares en todas las ciencias.

Hay aplicaciones en sismolog√≠a, medicina, epidemiolog√≠a, e incluso para predecir los rendimientos agr√≠colas. Pero uno de los usos m√°s populares de las series de tiempo son los negocios.

Los usos en negocios de las series de tiempo incluyen:

- Proyecci√≥n de ventas.
- Predicci√≥n de demanda.
- Finanzas.
- Energ√≠a.
- Mercados financieros.
- Optimizaci√≥n de inventarios.

Lo que tienen en com√∫n estos usos es que conocer los valores en el futuro es cr√≠tico.

En este cap√≠tulo veremos los modelos m√°s relevantes para el an√°lisis de series de tiempos. Veremos tambi√©n c√≥mo comprobar su capacidad de predecir causalidad. Finalmente, veremos aplicaciones espec√≠ficas de los negocios.

## Propiedades de las Series de Tiempo

Definimos una serie de tiempo como una secuencia $\{X_t\}$ de observaciones de una variable aleatoria en el tiempo.

Las observaciones $X_t$ tienen a $t$ como sub√≠ndice, que indica el momento en el tiempo de la observaci√≥n. Esto nos permite crear modelos sobre el comportamiento de la variable en el tiempo. Un ejemplo es una caminata aleatoria:

$$
X_t = X_{t-1} + \varepsilon,
$$

donde $\varepsilon$ es un ruido blanco.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# Fijar la semilla del generador de n√∫meros aleatorios para reproducibilidad
np.random.seed(42)

# Par√°metros
N = 100  # N√∫mero de pasos en el tiempo
sigma = 1  # Desviaci√≥n est√°ndar del ruido
X_0 = 0  # Valor inicial

# Inicializar el arreglo para X_t
X_t = np.zeros(N)
X_t[0] = X_0

# Generar el proceso
for t in range(1, N):
    epsilon = np.random.normal(0, sigma)  # Generar el ruido
    X_t[t] = X_t[t-1] + epsilon  # Actualizar el valor de X_t

# Graficar el proceso
plt.figure(figsize=(10, 6))
plt.plot(X_t, label='$X_t$')
plt.xlabel('Paso del tiempo')
plt.ylabel('Valor')
plt.title('Simulaci√≥n de $X_t = X_{t-1} + \\varepsilon$')
plt.legend()
plt.grid(True)
plt.show()

Cualquier parecido con una serie de tiempo real, es mera coincidencia.

### Estacionariedad

En un sentido intuitivo, una serie de tiempo es estacionaria cuando las propiedades estad√≠sticas del **proceso que genera la serie** de tiempo no cambian en el tiempo.

Hay mucha filosof√≠a detr√°s de esa definici√≥n. Para empezar, tenemos el supuesto de que existe un proceso que genera el comportamiento de la serie de tiempo. Luego hay que notar que esta definici√≥n no implica que no existan cambios de la serie en el tiempo, s√≥lo que la forma en que los datos cambian permanecen constantes.

Por eso es un concepto clave: sin estacionariedad, muchos modelos no funcionan.

En el ap√©ndice de este cap√≠tulo te dejo las definiciones formales de estacionariedad y sus ideas claves. En resumen:

- Podemos detectar si un modelo es estacionario usando la prueba Dickey-Fuller: si el p-value de nuestra prueba es inferior a 0.05, entonces nuestra serie es estacionaria.
- Si nuestra serie no es estacionaria, podemos diferenciarla. La serie se diferencia restando a cada elemento su rezago $X_t - X_{t-1}$.

El siguiente c√≥digo hace una simulaci√≥n de la serie de tiempo $y_t = \beta_0 + \beta_1 t + \phi y_{t-1} + \varepsilon_t$, as√≠ como su diferencia. Se muestran los gr√°ficos correspondientes y los resultados de la prueba Dickey-Fuller, hecha con la paqueter√≠a `statsmodels`.

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.tsa.stattools import adfuller

# Par√°metros del modelo
np.random.seed(42) # Para reproducibilidad
n = 100 # N√∫mero de observaciones
beta0 = 0.5 # Intercepto
beta1 = 0.01 # Tendencia
phi = 0.8 # Coeficiente autoregresivo
epsilon = np.random.normal(0, 1, n) # T√©rminos de error

# Generar la serie de tiempo
t = np.arange(n) # Tiempo
y = np.empty(n)
y[0] = beta0 + beta1 + epsilon[0] # Inicializar la primera observaci√≥n

for i in range(1, n):
    y[i] = beta0 + beta1 * t[i] + phi * y[i-1] + epsilon[i]

# Diferenciar la serie para conseguir estacionariedad
y_diff = np.diff(y)

# Prueba de Dickey-Fuller para la serie original y diferenciada
adf_result_original = adfuller(y)
adf_result_diff = adfuller(y_diff)

# Crear los gr√°ficos
fig, axs = plt.subplots(1, 2, figsize=(14, 6))

# Serie original
axs[0].plot(t, y, label='Serie Original')
axs[0].set_title('Serie de Tiempo No Estacionaria', fontsize=14)
axs[0].set_xlabel('Tiempo', fontsize=12)
axs[0].set_ylabel('Valor', fontsize=12)
axs[0].legend()

# Serie diferenciada
axs[1].plot(t[1:], y_diff, label='Serie Diferenciada', color='orange')
axs[1].set_title('Serie de Tiempo Diferenciada', fontsize=14)
axs[1].set_xlabel('Tiempo', fontsize=12)
axs[1].set_ylabel('Valor', fontsize=12)
axs[1].legend()

plt.tight_layout()
plt.show()

(adf_result_original[0], adf_result_original[1], adf_result_diff[0], adf_result_diff[1])

Algunos puntos relevantes.

- Normalmente cuando observas una serie con una tendencia como la que se muestra en el primer modelo, podemos esperar que la serie no sea estacionaria.
- Por lo general una diferencia deber√≠a ser suficiente para lograr estacionariedad. Es posible hacer dos o m√°s diferencias al modelo, pero hay que ser cautelosos, pues podr√≠as hacer la serie extremadamente vol√°til e introducir patrones artificiales en los datos.
- Si con una o dos diferencias no logras generar estacionariedad en la serie de tiempo, vale la pena revisar si no existen otros aspectos como cambios estructurales o estacionalidad en la serie. Estos aspectos se ven m√°s adelante con modelos espec√≠ficos.

El modelo ARIMA es un ejemplo de un modelo que funciona cuando la serie es estacionaria. Es tambi√©n un modelo popular por su flexibilidad de uso y lo poderoso de sus resultados. Veamos m√°s a fondo.

## El modelo ARIMA

El modelo ARIMA es como tener una bola de cristal que proyecta el futuro con base en el comportamiento en el pasado y nada m√°s.

Una idea muy intuitiva cuando vemos un gr√°fico de l√≠neas es que podemos simplemente seguir dibujando. Despu√©s de todo, tiene mas sentido pensar que la l√≠nea seguir√° una misma tendencia a que el siguiente n√∫mero ser√° totalmente aleatorio. Esa es la idea b√°sica detr√°s del modelo ARIMA.

El modelo ARIMA asume una relaci√≥n **lineal** entre las variables y sus rezagos.

Observa el siguiente modelo:

$$
y_t = \phi_0 + \phi_1 y_{t-1} + \varepsilon
$$

Nota que es b√°sicamente un modelo de regresi√≥n lineal, con la √∫nica diferencia de que la variable independiente y la dependiente son la misma. La historia que este modelo cuenta es que el valor de $X$ en el periodo $t$ depende de su valor en el periodo $t-1$. 

Este es un modelo AR(1).

### Modelos AR(p)

El predictor m√°s l√≥gico del valor de una variable en el tiempo son sus rezagos.

Dicho de otra manera: la mejor manera de saber cu√°les son las ventas del pr√≥ximo a√±o es observando las ventas del pr√≥ximo a√±o. Es un modelo sencillo, pero muy poderoso. El modelo AR($p$) asume que el valor de $y_t$ depende linealmente de los primeros $p$ rezagos de la serie.

Observa la siguiente simulaci√≥n de un modelo AR(3).

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Establecer la semilla para reproducibilidad
np.random.seed(42)

# N√∫mero de observaciones
n = 1000

# Coeficientes del proceso AR(3)
phi = np.array([0.5, -0.2, 0.1])

# T√©rmino de ruido
sigma = 1
epsilon = np.random.normal(loc=0, scale=sigma, size=n)

# Inicializando la serie temporal
y = np.zeros(n)

# Generando el proceso AR(3)
for t in range(3, n):
    y[t] = phi[0] * y[t-1] + phi[1] * y[t-2] + phi[2] * y[t-3] + epsilon[t]

# Creando un √≠ndice de series temporales
dates = pd.date_range(start='2024-01-01', periods=n)

# Convirtiendo a una serie de pandas para graficar
y_series = pd.Series(y, index=dates)

# Graficando
plt.figure(figsize=(14, 6))
plt.plot(y_series)
plt.title('Proceso Simulado AR(3)')
plt.xlabel('Tiempo')
plt.ylabel('Valor')
plt.show()

Estamos haciendo trampa.

Estoy creando una simulaci√≥n de un modelo donde 

$$
y_t = \phi_1 y_{t-1} + \phi_2 y_{t-2} + \phi_3 y_{t-3} + \varepsilon_t
$$

La ventaja es que sabemos que $\phi_1 = 0.5$, $\phi_2 = -0.2$ y $\phi_3 = 0.1$, y podemos hacer pruebas con python para aprender a hacer modelos AR. 

Estos son los pasos:

### **Paso #1:** Verifica si tu serie de tiempo es estacionaria.

La estacionariedad es lo que permite  que los modelos sean consistentes. Este es el c√≥digo:

In [None]:
from statsmodels.tsa.stattools import adfuller

# Realizando el test ADF
adf_result = adfuller(y_series)

# Extrayendo el valor p y los valores cr√≠ticos
p_value = adf_result[1]
critical_values = adf_result[4]

adf_result, p_value, critical_values

Aprendamos a interpretar esta prueba:

- La prueba se llama Dickey-Fuller Aumentada (ADF). Se usa para identificar la presencia de **ra√≠ces unitarias**. Identificar estacionariedad directamente requerir√≠a que supi√©ramos el proceso que genera la serie de tiempo. En nuestro caso lo sabemos porque nosotros lo generamos, pero en la vida real eso es justo lo que queremos estimar.
- Una serie de tiempo tiene ra√≠ces unitarias si se puede representar por el proceso donde las ra√≠ces de la ecuaci√≥n caracter√≠stica son iguales a uno (o est√°n en el c√≠rculo unitario de un espacio complejo.
- Especificaci√≥n del modelo. La prueba ADF se basa en la estimaci√≥n del modelo siguiente:

$$
ŒîYt=Œ±+Œ≤t+Œ≥Y_{t‚àí1}+Œ¥_1ŒîY_{t‚àí1}+Œ¥_2ŒîY_{t‚àí2}+‚ãØ+Œ¥_{p‚àí1}ŒîY_t‚àíp+1+\varepsilon_t

$$

- La hip√≥tesis nula de la prueba ADF es que la serie de tiempo tiene ra√≠z unitaria ($\gamma = 0$), lo que significa que no es estacionaria. La hip√≥tesis alternativa es que la serie de tiempo no es estacionaria ($\gamma < 0$).

En otras palabras, como el p-value es muy peque√±o ($p<0.01$), podemos interpretar que nuestra serie no es estacionaria.

### **Paso #2:** Si la serie no es estacionaria, considera transformarla para hacerla estacionaria.

Hay transformaciones que resultan naturales a una serie de tiempo. Por ejemplo, el indicador general de la actividad Econ√≥mica es evidentemente No-estacionario.

In [None]:
# Importar las librer√≠as necesarias
import pandas as pd
import matplotlib.pyplot as plt

# URL de los datos IGAE de INEGI
url = 'https://www.inegi.org.mx/contenidos/programas/igae/2018/tabulados/ori/IGAE_2.xlsx'

# Cargar los datos en un DataFrame de pandas
igae_data = pd.read_excel(url, skiprows=5)

# Mostrar las primeras filas del DataFrame para verificar los datos
print(igae_data.head())

# Paso 1: Eliminar la primera fila que no contiene datos, si a√∫n no se ha hecho
igae_data_cleaned = igae_data.drop(igae_data.index[0])

# Restablecer el √≠ndice despu√©s de eliminar la fila
igae_data_cleaned.reset_index(drop=True, inplace=True)

# Asumiendo que la fila "Total" es la primera fila despu√©s de limpiar
total_series = igae_data_cleaned.iloc[0, 1:].transpose()

# Excluir las columnas que no sean de meses y calcular el periodo
monthly_columns = [col for col in igae_data_cleaned.columns if col not in ['Unnamed: 0', 'Anual.30']]  # Ajustar las columnas excluidas seg√∫n sea necesario
periods = len(monthly_columns)

# Crear un rango de fechas para el √≠ndice
start_year = 1993  # A√±o de inicio, ajustar seg√∫n los datos
start_month = 1  # Enero como mes de inicio

dates = pd.date_range(start=pd.Timestamp(year=start_year, month=start_month, day=1),
                      periods=len(total_series),
                      freq='M')

# Crear un DataFrame a partir de la serie para usar el √≠ndice de fecha
df = pd.DataFrame(total_series.values, index=dates, columns=['Valor IGAE'])

# Graficar los datos
plt.figure(figsize=(10, 6))
plt.plot(df.index, df['Valor IGAE'])
plt.title('Serie de Tiempo IGAE')
plt.xlabel('Fecha')
plt.ylabel('Valor')
plt.xticks(rotation=45)  # Rotar las fechas para una mejor legibilidad
plt.show()


Con algo de experiencia vas a aprender a notar cuando una serie no es estacionaria s√≥lo al ver el gr√°fico, pero siempre debes de corroborar tus sospechas haciendo una prueba estad√≠stica.

### **Paso #3: Identifica el orden del rezago $p$.** La siguiente pregunta que tenemos es ¬øcu√°ntos rezagos debo usar en mi modelo?

Para resolver este problema usamos la funci√≥n de autocorrelaci√≥n (AFC) y la funci√≥n de autocorrelaci√≥n parcial (PAFC). Este es el gr√°fico que generan.

In [None]:
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf

# Creando figuras para los gr√°ficos
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(12, 8))

# Graficando la Funci√≥n de Autocorrelaci√≥n (ACF)
plot_acf(y_series, ax=ax1, lags=40)  # y_series es la serie temporal
ax1.set_title('Funci√≥n de Autocorrelaci√≥n (ACF)')

# Graficando la Funci√≥n de Autocorrelaci√≥n Parcial (PACF)
plot_pacf(y_series, ax=ax2, lags=40)  # y_series es la serie temporal
ax2.set_title('Funci√≥n de Autocorrelaci√≥n Parcial (PACF)')

plt.tight_layout()  # Ajusta autom√°ticamente los subgr√°ficos para que encajen en el √°rea de la figura
plt.show()


El truco para identificar el orden del rezago en un modelo AR($p$) es mirar el PAFC. El punto en el que la autocorrelaci√≥n cae por debajo del nivel de significancia (no est√° cubierto por el color en el gr√°fico), es el nivel de rezago que debemos usar.

En este caso el gr√°fico nos muestra una ca√≠da despu√©s del tercer rezago, que es lo que esperamos con el modelo que hemos dise√±ado.

### Paso #4: Ejecutar el modelo y mostrar los resultados

Finalmente estamos listos para ejecutar nuestro modelo AR(3).

In [None]:
from statsmodels.tsa.ar_model import AutoReg

# Ajustando un modelo AR(3)
model = AutoReg(y_series, lags=3)
model_fitted = model.fit()

# Mostrando los resultados
model_results = model_fitted.summary()

model_results

Lo que podemos observar en los resultados de este modelo:

- Los coeficientes son efectivamente cercanos a los que hicimos en la simulaci√≥n, con un valor significativo (p < 0.05)
- La secci√≥n donde dice Real e Imaginario nos ayudan a confirmar que nuestro modelo es estable (i.e. todas las unidades de la ecuaci√≥n caracter√≠stica est√°n fuera del c√≠rculo unitario).

### Paso #5: Comparar AIC y BIC para encontrar el mejor modelo

El criterio de Informaci√≥n de Akaike (AIC) y el Criterio de informaci√≥n Bayesiano son medidas que nos ayudan a identificar el ‚Äúmejor modelo‚Äù en t√©rminos de la informaci√≥n que podemos obtener.

La idea es esta: cuando incluimos m√°s variables a nuestro modelo, podemos tener mayor precisi√≥n, pero nos arriesgamos a un sobre-ajuste. Veamos que sucede si comparamos AR(3) con los modelos AR(2) y AR(4).

La regla de oro es el que el modelo con AIC y BIC m√°s bajo, gana.

In [None]:
# Ajustando modelos AR(2) y AR(4) y comparando AIC y BIC
model_ar2 = AutoReg(y_series, lags=2).fit()
model_ar4 = AutoReg(y_series, lags=4).fit()

# Extrayendo AIC y BIC para cada modelo
aic_bic_comparison = pd.DataFrame({
    'Model': ['AR(2)', 'AR(3)', 'AR(4)'],
    'AIC': [model_ar2.aic, model_fitted.aic, model_ar4.aic],
    'BIC': [model_ar2.bic, model_fitted.bic, model_ar4.bic]
})

aic_bic_comparison


Interesante.

El modelo AR(4) tiene un nivel menor de AIC, con un BIC ligeramente mayor. Eso quiere decir que, si no supi√©ramos el modelo real, bien podr√≠amos considerar el modelo AR(4) como viable.

Generalmente, el AIC se enfoca m√°s en la calidad del ajuste, mientras que el BIC a√±ade una penalizaci√≥n m√°s fuerte por la cantidad de par√°metros, favoreciendo modelos m√°s simples. 

### Paso 6: Generar proyecciones

Finalmente, podemos crear proyecciones a partir de nuestros modelos. En el siguiente c√≥digo, dividimos la base de datos en datos de entrenamiento (`train`) y de prueba (`test`). La idea es comprobar que nuestras proyecciones ayudan a predecir el valor que estamos buscando.

In [None]:
from sklearn.metrics import mean_absolute_error

# Dividiendo los datos en entrenamiento y prueba
train_data = y_series[:int(0.9 * len(y_series))]
test_data = y_series[int(0.9 * len(y_series)):]

# Ajustando el modelo AR(3) al conjunto de entrenamiento
model_train = AutoReg(train_data, lags=3).fit()

# Haciendo predicciones en el conjunto de prueba
predictions = model_train.predict(start=len(train_data), end=len(train_data) + len(test_data) - 1, dynamic=False)

# Calculando el Error Absoluto Medio (MAE)
mae = mean_absolute_error(test_data, predictions)

mae


Un gr√°fico nos puede ayudar a tener mayor claridad. Nota que la proyecci√≥n es s√≥lo una l√≠nea horizontal en el valor medio de los datos. Si lo pensamos bien, considerando el comportamiento de los datos, es una predicci√≥n razonable!

In [None]:
# Creando un gr√°fico para comparar los valores reales y las predicciones
plt.figure(figsize=(14, 7))
plt.plot(train_data, label='Training Data')
plt.plot(test_data, label='Actual Value')
plt.plot(predictions, label='Forecast', linestyle='--')
plt.title('AR(3) Forecast vs Actuals')
plt.xlabel('Date')
plt.ylabel('Value')
plt.legend()
plt.show()


## Medias M√≥viles: La MA de ARIMA

El procedimiento que vimos antes se puede aplicar igual con un modelo m√°s complejo.

En ocasiones, nos enfrentamos a dos problemas:

- Los rezagos de la variable no son suficientes para explicar su comportamiento.
- Los rezagos de los errores muestran una tendencia.

Lo curioso es que ambos problemas los podemos solucionar con la inclusi√≥n de los rezagos al modelo. Considera el siguiente modelos ARMA($p$, $q$), que contiene un rezago ($p = 1$) y tres rezagos del error ($q = 3$).

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.tsa.arima.model import ARIMA

# Estableciendo la semilla para reproducibilidad
np.random.seed(42)

# N√∫mero de observaciones
n = 1000

# Generando un t√©rmino de ruido
epsilon = np.random.normal(loc=0, scale=1, size=n)

# Inicializando la serie temporal
y = np.zeros(n)

# Par√°metros para el proceso ARMA(1,3)
phi = 0.5  # Coeficiente AR
theta = [0.1, -0.2, 0.3]  # Coeficientes MA

# Generando el proceso ARMA(1,3)
for t in range(4, n):
    y[t] = phi * y[t-1] + epsilon[t] + theta[0] * epsilon[t-1] + theta[1] * epsilon[t-2] + theta[2] * epsilon[t-3]

# Creando un √≠ndice de series temporales
dates = pd.date_range(start='2024-01-01', periods=n)

# Convirtiendo a una serie de pandas para graficar y modelar
y_series_arma = pd.Series(y, index=dates)

# Ajustando un modelo ARMA(1,3)
arma_model = ARIMA(y_series_arma, order=(1, 0, 3))
arma_result = arma_model.fit()

# Creando predicciones con el modelo ARMA(1,3) para los √∫ltimos 100 puntos de datos
arma_predictions = arma_result.predict(start=n-100, end=n-1)

# Creando un gr√°fico para comparar los valores reales y las predicciones de ARMA(1,3)
plt.figure(figsize=(14, 7))
plt.plot(y_series_arma[n-100:], label='Actual Values')
plt.plot(arma_predictions, label='ARMA(1,3) Predictions', linestyle='--')
plt.title('ARMA(1,3) Simulation')
plt.xlabel('Date')
plt.ylabel('Value')
plt.legend()
plt.show()

arma_result.summary()


Este modelo se ve m√°s interesante.

Los pasos que seguimos en la secci√≥n anterior aplican tambi√©n aqu√≠. De igual manera, si nos enfrentamos a un modelo ARMA, debemos verificar que sea estacionario, identificar el orden del proceso y hacer nuestras proyecciones.

Una diferencia clave son las funciones ACF y PACF. Para detectar el orden MA($q$) revisamos donde la funci√≥n ACF corta de manera abrupta.

In [None]:
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf

# Plotting ACF and PACF for the ARMA(1,3) model
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(12, 8))

# ACF
plot_acf(y_series_arma, ax=ax1, lags=40)
ax1.set_title('Autocorrelation Function (ACF) for ARMA(1,3)')

# PACF
plot_pacf(y_series_arma, ax=ax2, lags=40)
ax2.set_title('Partial Autocorrelation Function (PACF) for ARMA(1,3)')

plt.tight_layout()
plt.show()


Lo que podemos observar:

En el gr√°fico ACF parece haber un rechazo significativo en el primer retardo y luego una disminuci√≥n exponencial o una disminuci√≥n sinusoidal amortiguada en los retardos subsiguientes. Esto es t√≠pico de un proceso AR(1) o un proceso ARMA con un componente AR(1). El hecho de que el gr√°fico ACF no se corte despu√©s de un n√∫mero determinado de retardos sugiere la presencia de una componente AR.

El gr√°fico PACF muestra un rechazo significativo en el primer retardo y rechazos significativos en los retardos tercero y cuarto, lo cual es consistente con un proceso MA(3), ya que el PACF de un proceso MA(q) generalmente muestra rechazos significativos para los primeros $q$ retardos y luego se corta.

En la pr√°ctica la interpretaci√≥n del ACF y PACF puede ser m√°s arte que ciencia. Se basa en la identificaci√≥n de "cortes" y rechazos significativos, por lo que una interpretaci√≥n plausible de estos gr√°ficos ser√≠a que estamos mirando un proceso con una componente autoregresiva de orden 1 (AR(1)) y una componente de media m√≥vil de orden 3 (MA(3)).

## Ap√©ndice

Aqu√≠ van los temas que requieren una explicaci√≥n adicional, pero que rompen el ritmo de la explicaci√≥n principal si me extiendo en el texto.

### Proceso Estoc√°stico

La palabra estoc√°stico significa lo mismo que aleatorio.

La diferencia principal es que *estoc√°stico* viene del griego, mientras que *aleatorio* viene del lat√≠n. Para definir correctamente lo que es un proceso estoc√°stico necesitamos algunas definiciones adicionales que vienen de la teor√≠a de la probabilidad:

```{note}
üí° **Un espacio probabil√≠stico** es una tripla $(\Omega, \mathcal{F}, \mathbb{P})$ donde:

- $\Omega$ es un conjunto no vac√≠o conocido como el **espacio muestral**.
- $\mathcal{F}$ es una $\sigma$-√°lgebra (se lee *sigma*-√°lgebra) de subconjuntos de $\Omega$. Es decir, es una familia de subconjuntos cerrados con respecto a la uni√≥n contable y complementaria con respecto a $\Omega$.
- $\mathbb{P}$ es una medida de probabilidad definida para todos lo miembros de $\mathcal{F}$.
```

Ahora definamos las variables aleatorias

```{note}
üí° **Una variable aletoria** es una funci√≥n $x:\Omega\to\mathbb{R}$ tal que la im√°gen inversa de cualquier intervalo $(-\infty,a]$ pertenece a $\mathcal{F}$, es decir, es una funci√≥n medible.
```

Con estas definiciones, podemos llegar a nuestra definici√≥n de proceso estoc√°stico:

```{note}
üí° Un **proceso estoc√°stico real** es una familia de variables aleatorias reales $\mathbf{X} = \{x_t(\omega) | t \in T\}$ definidas en el mismo espacio probabil√≠stico $(\Omega,\mathcal{F},\mathbb{P})$. El conjunto $T$ se le llama el **espacio √≠ndice** de los procesos. Si $T\subset \mathbb{Z}$, entonces es un proceso estoc√°stico discreto. Si $T$ es un intervalo de $\mathbb{R}$ entonces es un proceso estoc√°stico cont√≠nuo.
```

### Ruido blanco

Un ruido blanco es un proceso estoc√°stico que no tiene correlaci√≥n serial con media cero y varianza constante finita.

```{note}
De manera formal, un proceso $\{w_t \}$ es un **ruido blanco** si:

- Su primer momento es siempre cero, es decir $E[w_t] = 0$.
- Su segundo momento es finito. Es decir, $E(w_t - \mu)^2]<\infty$.
- El momento cruzado $E[w_s w_t]$ es cero, para $s\neq t$. Es decir, $\text{cov}(w_s,w_t) = 0$.
```

### Definici√≥n formal de estacionariedad

[Stationarity in time series analysis](https://towardsdatascience.com/stationarity-in-time-series-analysis-90c94f27322)

### Ra√≠ces unitarias

Consideremos un proceso autorregresivo de orden $p$:

$$
y_t = a_0 +a_1y_{t-1} + \cdots + a_py_{t-p} + \varepsilon_t
$$

Donde $\varepsilon_t$ representa un ruido blanco. Podemos reescribir el mismo proceso como 

$$
(1-a_1L - \cdots - a_p L^p)y_t = a_0 + \varepsilon
$$

donde $L^i$ es el operador de rezago. La parte entre par√©ntesis de la izquierda se conoce como la *ecuaci√≥n caracter√≠stica* de la serie de tiempo. Consideremos la ra√≠z de esta ecuaci√≥n:

$$
m^p - m^{p-1}a_1- \cdots - a_p = 0
$$

Si la ra√≠z de la ecuaci√≥n es $m =1$, entonces el proceso estoc√°stico tiene **ra√≠z unitaria**. Esto se suele comprobar con la prueba Dickey-Fuller.

## Referencias

Abdul Jalil, N. H. R., & √ñzcan, B., & √ñzt√ºrk, I. (Eds.). (2019). Time Series Analysis (Stationarity, Cointegration, and Causality). En *Environmental Kuznets Curve (EKC)* (pp. 85-99). Academic Press. https://doi.org/10.1016/B978-0-12-816797-7.00008-4

## Como citar este libro

Cita en APA (7a edici√≥n)

```
Garc√≠a Meza, M. A. (2024). *Inferencia causal para negocios: Una gu√≠a pr√°ctica con Python*. https://inferenciacausal.com
```

Cita en MLA (9a edici√≥n)

```
Garc√≠a Meza, Mario A. *Inferencia Causal para Negocios: Una Gu√≠a Pr√°ctica con Python*. Durango, M√©xico, 2024. https://inferenciacausal.com.
```

Cita en Chicago

```
Garc√≠a Meza, Mario A. I*nferencia Causal para Negocios: Una Gu√≠a Pr√°ctica con Python*. Durango, M√©xico, 2024. https://inferenciacausal.com.
```


_Espero que este libro te resulte √∫til._

_Si eres economista y deseas escribir tu primer paper de econom√≠a, hice este curso gratis por correo justo para t√≠._

_En este curso aprender√°s a:_

* _Crear objetivos de investigaci√≥n que tienen sentido, que ning√∫n juez te podr√° "tumbar"._
* _Usar causalidad en tus modelos y no s√≥lo seguir una receta de cocina para trabajar con datos._
* _Apoyarte de otras personas y la tecnolog√≠a para escribir al menos dos papers al a√±o, todos los a√±os, consistentemente y para siempre._

<div style="text-align: center; margin-top: 20px;">
  <a href="https://guiaeconomista.com" target="_blank" style="background-color: #154957; color: #FFFFFF; padding: 10px 20px; text-decoration: none; border-radius: 5px; font-size: 16px;">
    Descarga La Gu√≠a del Economista aqu√≠
  </a>
</div>


<iframe src="https://guiaeconomista.com/#form" width="400" height="300" style="border: none;"></iframe>

<div style="height: 100vh"><script src="https://cdn.jsdelivr.net/ghost/signup-form@~0.1/umd/signup-form.min.js" data-label-1="inferenciacausal.com" data-background-color="#ffffff" data-text-color="#000000" data-button-color="#154957" data-button-text-color="#FFFFFF" data-title="Escribe tu primer paper de Econom√≠a" data-description="Todos los meses recibe un tutorial de econometr√≠a, un an√°lisis de un art√≠culo y una gu√≠a" data-icon="https://marionomics.com/content/images/size/w192h192/size/w256h256/2024/08/2.svg" data-site="https://marionomics.com/" data-locale="es" async></script></div>

_Elaborado en el ejercicio de a√±o sab√°tico UJED_