{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# El modelo de resultados potenciales\n",
"\n",
"> Algebra's like sheet music: the important thing isn't can you read music. It's can you hear it.
\n",
"> Can you hear it?
\n",
"> _Niels Bohr en Oppenheimer (2023)_\n",
"\n",
"---\n",
"_Elaborado en el ejercicio de Año Sabático autorizado en la UJED_\n",
"---\n",
"\n",
"Para entender la econometría necesitas comprender el multiverso.\n",
"\n",
"El multiverso se basa en la interpretación de Hughes Everett (1957) de la mecánica cuántica (Busch, *et al*., 2007). Pero la interpretación popular que aparece en las películas y cómics es que cada decisión que tomamos genera un universo nuevo.\n",
"\n",
"Hay un universo en el que aún estás con tu ex.\n",
"\n",
"Le vamos a llamar a ese universo un **contrafactual**, porque se opone a la realidad. Naturalmente, el hubiera no existe y no podemos obtener datos de los contrafactuales. Sólo podemos imaginarlo.\n",
"\n",
"## En un universo, fuiste a Harvard\n",
"\n",
"¿Habrías tenido mejor vida si hubieras atendido clases en Harvard?\n",
"\n",
"Medir la felicidad en la vida es muy difícil. Nos tendremos que conformar con tus ingresos. ¿Tendrías hoy mejores ingresos si hubieras ido a Harvard?\n",
"\n",
"No podemos comparar los ingresos de un egresado de Harvard con alguien que no fue. Los estudiantes de Harvard tienen (suponemos) más ingresos, mejores conexiones y un estilo de vida diferente a los que no asistieron. Decimos a esto que son **fundamentalmente** diferentes.\n",
"\n",
"## El error de novatos\n",
"\n",
"Si cometes este error estás *banneado* de por vida de mi clase.\n",
"\n",
"Supongamos que deseas saber el **efecto** que tiene entrar en una escuela más selectiva en los ingresos. Decides entonces que es buena idea evaluar la diferencia entre los ingresos de las personas que fueron a una escuela selectiva y los egresados de una no selectiva.\n",
"\n",
"$$\n",
"E[Y_1]-E[Y_0]\n",
"$$\n",
"\n",
"La $E$ denota la **esperanza** o valor esperado de lo que está entre paréntesis. Normalmente denotamos con $Y$ el **resultado** o la variable en la que esperamos ver un efecto. En este caso es el ingreso. \n",
"\n",
"El subíndice $1$ o $0$ nos indica el **grupo** al que pertenece la variable. Normalmente $1$ indica el **grupo de tratamiento** y $0$ el **grupo de control**.\n",
"\n",
"Tratamiento y control son parte del lenguaje en los estudios clínicos. Cuando quieres hacer un experimento para saber si una medicina funciona, divides a tus sujetos en dos grupos y a uno le aplicas la medicina y al otro no. Luego mides los resultados.\n",
"\n",
"Imaginemos que esta base de datos identifica a 180 alumnos, la mitad de ellos entró a una escuela selectiva y la otra mitad no lo hizo. ¿Cuál es el valor que representa la ecuación de arriba?"
]
},
{
"cell_type": "code",
"execution_count": 29,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"
\n", " | id | \n", "habilidad | \n", "selectivas | \n", "ingresos | \n", "
---|---|---|---|---|
0 | \n", "0 | \n", "0.496714 | \n", "1 | \n", "1519.595562 | \n", "
1 | \n", "1 | \n", "-0.138264 | \n", "0 | \n", "1394.600820 | \n", "
2 | \n", "2 | \n", "0.647689 | \n", "0 | \n", "1131.469293 | \n", "
3 | \n", "3 | \n", "1.523030 | \n", "1 | \n", "1743.236746 | \n", "
4 | \n", "4 | \n", "-0.234153 | \n", "0 | \n", "1134.701974 | \n", "