Liderar el desarrollo integral de evaluaciones e investigaciones sobre autonomía. Esto comienza con el modelado de riesgos y capacidades, e incluye el diseño, la implementación y la ejecución periódica de estas evaluaciones.
Iterar rápidamente en experimentos para evaluar las capacidades autónomas y pronosticar capacidades futuras.
Proporcionar liderazgo técnico a los ingenieros de investigación para delimitar y construir una infraestructura escalable y segura para ejecutar rápidamente experimentos a gran escala.
Comunicar los resultados de las evaluaciones a los equipos antrópicos pertinentes, así como a las partes interesadas en las políticas y a los colaboradores de investigación, cuando sea pertinente.
Colaborar con otros proyectos del equipo Frontier Red, Alignment y más allá para mejorar la infraestructura y diseñar técnicas de seguridad para capacidades autónomas.
Requisitos:
Tener experiencia en ML y liderar investigaciones experimentales sobre LLM/modelos multimodales y/o agentes.
Tener sólidas habilidades de ingeniería basadas en Python
Se sienten impulsados a encontrar soluciones a problemas de alcance ambiguo.
Diseñe y ejecute experimentos e itere rápidamente para resolver problemas de aprendizaje automático.
Prosperar en un entorno colaborativo (nos encanta la programación en pareja)
Tengo experiencia entrenando, trabajando con y dando indicaciones a los modelos.
Beneficios:
Rango salario: $315,000 – $340,000 USD
Patrocinio de visas: ¡Sí patrocinamos visas! Sin embargo, no podemos patrocinar visas con éxito para todos los puestos ni para todos los candidatos. Sin embargo, si te hacemos una oferta, haremos todo lo posible para conseguirte una visa y contratamos a un abogado de inmigración para que te ayude con ello.