“챗GPT만 중요한게 아냐!” 한컴, PDF 데이터로 AI 판도를 뒤집을까?
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2025.07.09 13:22

기사 3줄 요약
- 1 한컴, 글로벌 오픈소스 기업 듀얼랩과 기술 협력
- 2 AI 학습에 필요한 PDF 데이터 추출 기술 공동 개발
- 3 오픈소스 공개로 글로벌 AI 기술 생태계 구축 선언
국내 대표 소프트웨어 기업 한컴이 AI 시대의 새로운 승부수를 던졌습니다. 바로 우리에게 아주 익숙한 PDF 파일에서 데이터를 손쉽게 추출하는 기술입니다. 한컴은 이 기술을 위해 글로벌 오픈소스 전문 기업 ‘듀얼랩’과 손을 잡고 ‘오픈 PDF 데이터 로더’를 함께 개발한다고 발표했습니다.
이는 단순한 기술 개발을 넘어, AI 기술의 핵심인 데이터 활용 방식을 바꾸려는 큰 그림의 시작으로 보입니다. 전 세계 개발자들과 함께 성장하는 기술 생태계를 만들어 글로벌 AI 기업으로 거듭나겠다는 포부입니다.
그래서 그 기술이 정확히 뭔데?
‘오픈 PDF 데이터 로더’는 소프트웨어 개발 도구(SDK)의 한 종류입니다. 쉽게 말해 개발자들이 PDF 문서 안의 글자, 표, 이미지 같은 데이터를 마음대로 꺼내 쓸 수 있게 도와주는 ‘만능 도구상자’라고 생각하면 됩니다. 지금까지는 PDF 속 내용을 복사해 붙여넣거나 일일이 정리해야 하는 불편함이 컸습니다. 이 기술은 AI가 PDF 내용을 곧바로 이해하고 학습할 수 있도록 길을 열어주는 핵심적인 역할을 합니다. AI의 성능을 높이는 검색증강생성(RAG) 기술에서도 중요한 부분입니다.왜 공짜로 공개하는 거지?
한컴은 이 기술의 기본 버전을 누구나 무료로 사용할 수 있는 ‘오픈소스’로 공개할 계획입니다. 개발자들이 자유롭게 사용하며 더 큰 기술 생태계를 만드는 것이 목표이기 때문입니다. 물론 모든 것이 공짜는 아닙니다. 기본 기능은 무료로 제공해 사용자 저변을 넓히고, 문자 인식(OCR)의 정확도를 높이거나 복잡한 차트까지 인식하는 고급 기능은 유료 ‘애드온’ 형태로 판매해 수익을 내는 전략입니다. 이는 많은 글로벌 소프트웨어 기업이 사용하는 검증된 방식입니다.한컴의 진짜 목표는 뭘까?
이번 협력은 ‘아래아한글’로 유명한 한컴이 국내 시장을 넘어 글로벌 AI 시장에 본격적으로 뛰어들겠다는 선언과 같습니다. 파트너인 듀얼랩은 PDF 기술 표준을 다루는 협회의 정회원일 만큼 이 분야의 전문가입니다. 듀얼랩의 기술력과 한컴의 AI 기술을 결합해, PDF 데이터 처리 분야에서 세계적인 경쟁력을 갖추겠다는 것입니다. 단순한 제품 출시를 넘어, 개방과 협력이라는 가치를 통해 전 세계를 무대로 하는 AI 서비스 기업으로 도약하는 것이 한컴의 최종 목표입니다. (사진 출처: 한컴)
편집자:
이도윤 기자
제보·문의:
aipick@aipick.kr

부키와 모키의 티격태격
찬/반 투표
총 투표수: 1한컴의 PDF 오픈소스 전략, 성공할까?
성공
0%
0명이 투표했어요
실패
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사



