기술/연구

"내 일 대신하는 AI" OpenAI 신형 공개 83% 실력

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2026.04.27 18:25

기사 3줄 요약

1 OpenAI 차세대 인공지능 모델 GPT-5.4 공식 공개
2 전문 지식 노동 평가서 인간 전문가 83% 수준 달성
3 컴퓨터 직접 조작하는 에이전트 기능 기본 탑재

인공지능이 우리 대신 출근하는 시대가 코앞으로 다가왔습니다. 오픈AI가 공개한 신형 모델은 단순한 도구를 넘어 'AI 직원'이라 불릴 만큼 똑똑해졌습니다. 이제는 인간의 보조를 넘어 스스로 업무를 완수하는 단계에 진입했다는 평가가 나옵니다. 배경지식이 없는 일반인도 체감할 수 있는 변화가 시작되었습니다.

전문가 83%를 이겼다고?

오픈AI가 최근 발표한 GPT-5.4는 전문 지식 노동 분야에서 압도적인 성능을 증명했습니다. 실제 업무 수행 능력을 평가하는 테스트에서 인간 전문가와 대등하거나 더 높은 성적을 거두었습니다. 무려 44개 직종에 걸친 복잡한 과제에서 83%의 승률을 기록하며 모두를 놀라게 했습니다. 이전 모델인 GPT-5.2가 70% 수준이었던 것과 비교하면 비약적인 발전입니다. 기업 채용 플랫폼 머커의 발표에 따르면 이 모델은 장기 프로젝트 수행 능력이 가장 뛰어납니다. 재무 모델링이나 법률 분석처럼 고도의 집중력이 필요한 작업에서 뛰어난 완성도를 보였습니다.

컴퓨터도 직접 다룬대

이번 모델에서 가장 눈에 띄는 변화는 컴퓨터 사용 능력이 기본으로 통합되었다는 점입니다. 인공지능이 화면 스크린샷을 분석해 인터페이스를 이해하고 직접 마우스와 키보드를 조작합니다. 웹사이트를 탐색하거나 필요한 소프트웨어를 실행해 실제 업무를 마치는 것이 가능해졌습니다. 이제 사용자는 복잡한 단계를 거치지 않고 결과물만 지시하면 되는 세상이 열렸습니다. 성능 지표에서도 인간의 평균 능력을 뛰어넘는 결과를 보여주었습니다. 컴퓨터 환경 조작 테스트에서 75%의 성공률을 기록하며 사람의 평균인 72%를 앞질렀습니다.

100만 단어를 한 번에

GPT-5.4는 한 번에 처리할 수 있는 정보량인 컨텍스트 길이를 100만 토큰까지 대폭 확장했습니다. 이는 수천 페이지 분량의 보고서나 방대한 프로그래밍 코드를 한 번에 읽고 분석할 수 있는 수준입니다. 덕분에 호흡이 긴 프로젝트를 계획하고 실행하는 데 매우 유리해졌습니다. 복잡한 프로젝트를 수행할 때 스스로 계획을 세우고 검증하는 과정을 거칩니다. 예를 들어 인공지능이 웹 애플리케이션을 개발하면서 동시에 오류를 찾아 수정하는 작업까지 자동으로 진행합니다. 개발자 교육 책임자 리 로빈슨에 따르면 이전보다 훨씬 적극적으로 문제를 해결합니다.

앞으로 우리 일자리는

오픈AI는 이번 모델이 지금까지 공개된 인공지능 중 가장 사실 정확성이 높다고 밝혔습니다. 실제 사용자들의 오류 데이터를 기반으로 개선하여 잘못된 정보를 말할 확률을 30% 이상 줄였습니다. 법률이나 금융처럼 정확도가 생명인 분야에서도 안심하고 사용할 수 있는 수준에 도달했습니다. 시각 이해 능력까지 강화되어 복잡한 도표나 고해상도 이미지도 정확하게 분석합니다.