환영해🦉
기술/연구

웹 데이터 지옥 탈출? 56억 투자받은 AI 기술 등장

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2025.04.30 22:22
웹 데이터 지옥 탈출? 56억 투자받은 AI 기술 등장

기사 3줄 요약

  • 1 Structify, 웹 데이터 자동 정리에 56억 투자 유치
  • 2 AI 'DoRa'로 금융·건설 등 데이터 활용 간소화
  • 3 데이터 분석가 업무 80% 시간 절약 기대감 증폭
데이터 과학자들이 업무 시간의 80%를 웹사이트 같은 곳에서 뒤죽박죽 섞인 정보를 정리하는 데 쓴다는 사실, 알고 계셨나요? 이 지긋지긋한 '데이터 지옥'에서 우리를 해방시켜 줄 해결사가 등장했습니다. 바로 전 에어비앤비(Airbnb), 우버(Uber) 엔지니어들이 세운 미국 브루클린의 스타트업 '스트럭티파이(Structify)' 이야기입니다. 이들은 웹상의 복잡하고 지저분한 비정형 데이터를 기업이 즉시 활용할 수 있는 깔끔한 정형 데이터로 바꿔주는 기술을 개발했습니다. 최근에는 그 가능성을 인정받아 베인 캐피털 벤처스(Bain Capital Ventures)로부터 무려 410만 달러, 우리 돈으로 약 56억 원의 시드 투자를 유치하며 화제가 되고 있습니다.

그래서, 얘네 기술이 뭔데?

스트럭티파이의 핵심 기술은 '도라(DoRa)'라고 불리는 자체 개발 시각적 언어 모델(VLM)입니다. 기존의 웹 스크래핑 도구들이 웹사이트 구조가 조금만 바뀌어도 쉽게 고장 나는 것과 달리, 도라는 마치 사람이 웹페이지를 눈으로 보는 것처럼 내용을 이해하고 필요한 정보를 정확하게 뽑아냅니다. 회사 측은 이를 "사람 수준의 데이터 품질을 초인적인 속도로 제공한다"고 설명합니다. 여기에 더해, 추출된 데이터의 정확성을 높이기 위해 AI 검증과 사람의 검토를 결합한 '4중 검증 시스템'까지 도입했습니다. AI가 실수하거나 편향된 정보를 걸러내기 위한 장치인 셈입니다.

어디에 쓸 수 있는 거야?

이 기술은 특정 산업에 국한되지 않고 다양한 분야에서 활용될 수 있습니다. 예를 들어 금융 분야에서는 투자 설명회 자료나 미국 증권거래위원회(SEC) 공시 자료에서 필요한 정보를 자동으로 추출해 시장 분석이나 투자 결정에 도움을 줄 수 있습니다. 건설 현장에서는 복잡한 지반 공학 문서를 표로 깔끔하게 정리해 프로젝트 관리와 위험 평가를 쉽게 할 수 있습니다. 영업팀은 실시간으로 업데이트되는 기업 조직도를 확보해 잠재 고객 발굴에 활용하고, 마케팅팀은 경쟁사 분석이나 시장 조사를 자동화할 수 있습니다.

경쟁자는 없어? 뭐가 다른데?

물론 데이터 정리 및 분석 시장에는 이미 많은 강자들이 있습니다. 알터릭스(Alteryx), 인포매티카(Informatica), 마이크로소프트, 태블로(Tableau) 같은 대기업뿐 아니라 헤비아(Hebbia), 골든(Golden) 같은 다른 스타트업들도 유사한 문제를 해결하려 노력 중입니다.
경쟁사 강점 약점
Hebbia 워크플로우 자동화 및 데이터 분석 위한 생성형 AI 구체적인 약점 정보 부족
Golden 개체, 관계, 사실 중심 지식 그래프 특화 (블록체인 강점) 범용 데이터 통합 플랫폼 대비 범위 제한적일 수 있음
Alteryx 강력한 데이터 준비/통합, 시각적 워크플로우 설계 학습/구현 복잡성, 높은 비용 가능성
Informatica 포괄적 데이터 관리 (통합, 품질, 마스터 데이터) 높은 비용과 복잡성, 전문 지식 요구 가능성
Microsoft (Azure 등) 클라우드 기반 확장성, 타 MS 제품과 통합 용이 관리 복잡성, Azure 생태계 의존성
Tableau 강력한 데이터 시각화, 사용자 친화적 인터페이스 데이터 준비 기능은 상대적으로 제한적
스트럭티파이는 자체 개발한 DoRa 모델을 기반으로 한 '속도', '정확성', 그리고 '사용 편의성'을 차별점으로 내세우고 있습니다. 또한 개발자들이 기존 시스템에 쉽게 연동할 수 있도록 API(응용 프로그래밍 인터페이스)도 제공합니다.

누구나 쓸 수 있어? 앞으로는?

스트럭티파이는 개발자나 스타트업을 위해 월 100개 소스까지 무료로 사용할 수 있는 '스타터' 요금제를 제공합니다. 더 많은 기능이 필요한 기업을 위한 연간 11,000달러(약 1500만 원)의 '프로' 요금제와 맞춤형 '엔터프라이즈' 솔루션도 있습니다. 무료 버전을 통해 데이터 접근성을 높여 '데이터 민주화'에 기여하겠다는 포부입니다. 물론 AI 기술에는 늘 따라다니는 숙제도 있습니다. AI 모델의 편향성이나 데이터 정확성 문제, 그리고 웹 데이터 수집 과정에서의 프라이버시 침해 우려입니다. 스트럭티파이는 4중 검증 시스템과 인증이 필요한 정보는 접근하지 않는 원칙 등으로 이러한 문제를 해결하려 노력 중이지만, 지속적인 관리가 필요합니다. 스트럭티파이는 단순히 데이터를 정리하는 도구를 넘어, 정보 활용 방식을 근본적으로 바꾸려 하고 있습니다. 이들의 도전이 성공한다면, 웹상의 방대한 비정형 데이터가 마치 검색 엔진처럼 쉽게 접근 가능한 '구조화된 데이터'로 재탄생하는 미래를 기대해 볼 수도 있겠습니다. 기업들이 정보를 활용하는 방식에 큰 변화가 예상됩니다.
편집자: 이도윤 기자
제보·문의: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

AI 웹 데이터 정리, 인간 일자리 위협할까?

댓글 0

관련 기사