2025 - Revival Lo Rural

Científico de datos de procesamiento del lenguaje natural (PLN)

Funciones:

  • Diseñar y desarrollar algoritmos y modelos de PNL avanzados adaptados específicamente a aplicaciones de inteligencia laboral, como publicaciones de empleo y análisis de perfiles profesionales.
  • Analice y preprocese datos de texto multilingües a gran escala, garantizando precisión, consistencia y preparación para modelado avanzado y aplicaciones del mundo real.
  • Realizar experimentación y validación rigurosa de modelos de PNL utilizando metodologías estadísticas robustas y métricas de evaluación relevantes, mejorando continuamente el rendimiento y la confiabilidad del modelo.
  • Implementar, supervisar y mantener aplicaciones impulsadas por NLP en producción, colaborando estrechamente con los equipos de ingeniería y productos para garantizar una escalabilidad y eficiencia óptimas.
  • Manténgase al día con las últimas investigaciones y metodologías de PNL, integrando de forma proactiva técnicas innovadoras en los flujos de trabajo del equipo para mantener capacidades de vanguardia.
  • Crear documentación y pautas completas para procesos, algoritmos y modelos de PNL, promoviendo la transparencia y el intercambio eficiente de conocimientos dentro del equipo.
  • Comunicar eficazmente información técnica y resultados a diversas partes interesadas, facilitando la toma de decisiones informada y la alineación entre equipos multifuncionales.

 

Requisitos:

  • Licenciatura o maestría en Ciencias de la Computación, Ciencias de Datos, Aprendizaje Automático, IA o un campo relacionado.
  • Más de 3 años de experiencia práctica en PNL, aprendizaje automático o ciencia de datos aplicada; se prefiere experiencia en análisis de la fuerza laboral
  • Base sólida en PNL, incluidos modelos basados ​​en transformadores, LLM y gráficos de conocimiento
  • Experiencia con ingeniería rápida, aprendizaje de pocos intentos o de cero intentos y RAG para aplicaciones de PNL personalizadas
  • Competente en el ajuste fino de parámetros eficientes (por ejemplo, LoRA, QLoRA, adaptadores) para optimizar el rendimiento y la eficiencia
  • Sólidas habilidades en Python; experiencia con Hugging Face Transformers, LangChain, LlamaIndex y bases de datos vectoriales (por ejemplo, Pinecone, Chroma)
  • Conocimiento de técnicas de optimización de modelos como cuantificación, destilación y poda.
  • Familiarizado con prácticas responsables de IA, incluida la mitigación de sesgos y la transparencia del modelo.
  • Experiencia con aceleración de GPU y entrenamiento distribuido para soluciones de PNL escalables
  • Sólidas habilidades analíticas y de resolución de problemas; capaz de alinear los modelos de PNL con las necesidades comerciales.
  • Excelentes habilidades de comunicación y colaboración en entornos multifuncionales.