RLHF Jobs

A methodology for aligning language models with human intents and preferences via reinforcement learning and human feedback. Enhances AI systems by refining their outputs based on user guidance and supervision.

Remote

Technical Director, MLE

Prophecy

San Francisco, California, United States

Senior Machine Learning Engineer – LLMs & Agentic AI

Keysight Technologies, Inc.

Barcelona, Catalonia, Spain

- Unavailable

Senior Machine Learning Engineer – LLMs & Agentic AI

Keysight Technologies, Inc.

Barcelona, Catalonia, Spain

- Unavailable

Principal Product Manager, Data Innovation

Cint

Barcelona, Catalonia, Spain

- Full Time

Transcriber

Appen

Cavite, Philippines

- Project Based

EQ Annotator

Appen

Cavite, Philippines

- Project Based

Head of Data Operations

Hippocratic AI

Palo Alto, California, United States

- Full Time

Applied Researcher I (AI Foundations)

Capital One

San Francisco, California, United States

+ 4 other locations

- Full Time

Applied Researcher II (AI Foundations)

Capital One

San Francisco, California, United States

+ 4 other locations

- Full Time

Senior Data Scientist - AI Data Science

Bristol Myers Squibb

Hyderabad, Telangana, India

- Full Time

Searching within 3 million jobs, this might take a second!...