TP3: El bayesiano interestelar
Introducción
En este Trabajo Práctico te pondrás en la piel de un científico que fue convocado por la Agencia de Investigación Espacial para una misión espacial muy importante: medir directamente la gravedad en un planeta recién descubierto, el Planeta X. Aunque suene insólito, tu principal herramienta para esta tarea será una simple pelota de tenis. Eso sí, también tendrás a mano algunos “chiches” tecnológicos que te harán la vida más fácil, como la nave espacial de última generación The Bayesian, una imponente estructura de 10 metros de alto y 80 de largo diseñada para transportarte por el espacio, y una cámara especializada capaz de seguir bastante bien el movimiento de los objetos.
Una vez que llegues al Planeta X, habrá que moverse rápido ya que solo tendrás la oportunidad de hacer un único intento con la pelota. En el mismo, la lanzarás verticalmente hacia arriba, con la mayor precisión técnica posible, mientras un sistema de registro capta toda su trayectoria al detalle hasta que toque el suelo.
Para encarar semejante misión, pasarás por un proceso de entrenamiento especializado. Gracias a un programa de preparación bastante exigente, desarrollarás la capacidad de lanzar la pelota siempre con la misma velocidad inicial (aproximadamente 8 metros por segundo), sin importar las condiciones gravitatorias del entorno.
Para familiarizarte con el procedimiento y los instrumentos, primero harás una serie de pruebas en la Tierra. Después, como paso intermedio antes de ir al desconocido Planeta X, realizarás una parada en Marte. Como ya se conocen sus características gravitatorias y se lo considera un entorno seguro, ahí repetirás el mismo procedimiento de lanzamiento y registro, sumando datos que pueden llegar a ser muy valiosos.
Finalmente, emprenderás el largo trayecto hacia el misterioso Planeta X. A pesar de la natural incertidumbre y quizás un poco de la tensión que siempre genera enfrentarse a lo desconocido, podrás realizar el lanzamiento previsto con total éxito.
Ya de regreso en las oficinas de la Agencia de Investigación Espacial, llegará el momento decisivo: analizar todos los datos recolectados. Tu misión será, entonces, develar el enigma de la intensidad gravitatoria del nuevo Planeta X, una respuesta que, sin dudas, la comunidad científica y el público en general esperan con gran expectativa. F ## Datos
Los datos obtenidos durante los experimentos están organizados en archivos de formato CSV, cada uno representando un experimento en un planeta específico. El archivo tp3_planetax.csv
contiene los registros de tiempo y posición de la pelota de tenis durante el experimento en el Planeta X. Por su parte, los archivos tp3_marte.csv
y tp3_tierra.csv
almacenan los datos recolectados en Marte y la Tierra, respectivamente.
- Visualice los datos obtenidos en el experimento realizado en el Planeta X. ¿Tienen sentido las mediciones obtenidas?
Ecuaciones cinemáticas
La modelización estadística de este Trabajo se basará en la ecuación fundamental de la cinemática para un objeto que se mueve con aceleración constante. Esta ecuación relaciona la posición del objeto con el tiempo, la aceleración, la velocidad inicial y la posición inicial: \[ x_f = \frac{1}{2} a t^2 + v_0 t + x_0 \tag{1}\]
Donde las variables se definen de la siguiente manera:
- \(x_f\): posición vertical final de la pelota después de un tiempo \(t\) (en metros).
- \(t\): tiempo transcurrido desde el inicio de la observación (en segundos).
- \(a\): aceleración constante que experimenta la pelota (en metros por segundo al cuadrado). En este contexto, \(a\) representa la aceleración debida a la gravedad en la ubicación del experimento.
- \(v_0\): velocidad inicial de la pelota al comienzo del intervalo de tiempo \(t\) (en metros por segundo).
- \(x_0\): posición vertical inicial de la pelota en \(t=0\) (en metros).
Esta ecuación será la base para construir los modelos estadísticos que permitirán inferir la gravedad en el Planeta X, nuestro principal objetivo.
Modelos lineales
El modelo de regresión lineal normal suele presentarse de la siguiente manera: \[ \begin{aligned} Y_i \mid \mu_i, \sigma &\sim \text{Normal}(\mu_i, \sigma^2) & i = 1, \cdots, N \\\\ \mu_i = &\beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \cdots + \beta_p X_{pi} \end{aligned} \]
- Explique cómo se relacionan las variables y los parámetros del modelo lineal normal con las variables definidas en la Ecuación 1.
- Plantee el modelo lineal normal a utilizar para analizar los datos del experimento realizado en el Planeta X, sin incluir por ahora las distribuciones a priori.
En una primera aproximación, se propone utilizar distribuciones a priori no informativas (uniformes) para todos los parámetros del modelo.
- Implemente el modelo en Stan, obtenga muestras del posterior, presente las distribuciones a posteriori marginales e interprete el resultado en términos del problema.
- Visualice la curva de regresión junto a el o los intervalos de credibilidad que crea conveniente. Además, también elabore un gráfico que le permita visualizar la distribución predictiva a posteriori para diferentes valores de \(t\).
A continuación, se propone incorporar toda la información relevante disponible para la elección de las distribuciones a priori. Esto incluye los datos obtenidos en los experimentos realizados en la Tierra y Marte, así como las posibles relaciones entre las variables del modelo y los valores observados.
- Visualice los datos obtenidos en los experimentos en la Tierra y Marte, junto a los datos del Planeta X. ¿Cómo podría utilizar los datos de los otros planetas para determinar distribuciones a priori más informativas? ¿Y los datos conocidos del experimento?
- Especifique e implemente en Stan el model lineal normal con los priors actualizados, justificando sus elecciones.
- Realice pruebas predictivas a priori para evaluar la razonabilidad del prior elegido.
- Obtenga muestras del posterior y compare los resultados con los del primer modelo. ¿Qué puede concluir acerca de la gravedad del Planeta X? Sugerencia: reproduzca y/o actualice las visualizaciones realizadas para el primer modelo.
Finalmente, utilizando ambos modelos responda:
- ¿Cuánto tiempo tardaría en caer la pelota de tenis si se repite el lanzamiento pero utilizando una velocidad inicial de \(6 \text{ m}/{s}\)? ¿Y si la velocidad inicial es \(12 \text{ m}/{s}\)? ¿Con qué modelo se obtienen resultados más precisos? ¿Por qué?
Al trabajar con Stan:
- Utilice 4 cadenas de 1000 muestras cada una.
- Verifique la bondad de las muestras obtenidas mediante medidas de diagnóstico numéricas y gráficas que crea conveniente.