환영해🦉
기술/연구

웹 쓰레기가 보물로? 56억 투자받은 AI 데이터 정리 기술

댓글 0 · 저장 0 · 편집: 이도윤 기자 발행: 2025.05.01 04:04
웹 쓰레기가 보물로? 56억 투자받은 AI 데이터 정리 기술

기사 3줄 요약

  • 1 AI 스타트업 Structify, 56억 시드 투자 유치 성공.
  • 2 웹 비정형 데이터, AI로 정리해 비용 16배 절감.
  • 3 Palantir 출신 창업, 데이터 상품화로 시장 공략.
인터넷에는 매일 엄청난 양의 정보가 쏟아지지만, 대부분은 뒤죽박죽 정리되지 않은 상태입니다. 마치 보물섬에 보물이 널려있지만, 어디에 뭐가 있는지 모르는 것과 같죠. 그런데 이 '웹 쓰레기'를 진짜 '보물 지도'로 만들어주는 기술을 개발한 스타트업이 등장해 56억 원이라는 큰 투자를 받았습니다. 바로 '스트럭티파이(Structify)' 이야기입니다. 스트럭티파이는 전 팔란티어(Palantir) 엔지니어들이 모여 만든 회사로, 웹사이트, 뉴스 기사, 보고서, 소셜 미디어 게시물처럼 형태가 제각각인 비정형 데이터를 기업이 바로 활용할 수 있는 깔끔한 데이터셋으로 변환하는 AI 기술을 개발했습니다. 이 소식에 유명 투자사들이 앞다퉈 돈을 투자한 것입니다.

데이터 정리, 뭐가 그렇게 힘든데?

우리가 인터넷에서 보는 정보의 80%는 글, 이미지, 영상처럼 특정 형식 없이 만들어진 '비정형 데이터'입니다. 기업들이 이 데이터를 분석해서 의미있는 정보를 얻으려면, 먼저 데이터를 일정한 형식으로 정리하고 구조화하는 작업이 필요합니다. 마치 흩어진 레고 조각들을 색깔별, 모양별로 분류하는 것과 같죠. 이 작업은 시간과 노력이 엄청나게 들어갑니다. 데이터 과학자들이 실제 분석보다 데이터 준비에 최대 80%의 시간을 쓴다는 조사 결과도 있을 정도입니다. 많은 기업들이 자체적으로 웹 크롤링 도구(웹사이트 정보를 자동으로 긁어오는 프로그램)를 만들거나 비싼 외주 서비스를 이용하지만, 웹사이트 구조가 계속 바뀌고 데이터 품질도 들쑥날쑥해서 어려움이 많습니다.

Structify는 어떻게 해결해?

스트럭티파이는 'DoRa'라는 자체 개발한 AI 모델을 사용합니다. 이 AI는 마치 사람이 웹사이트를 눈으로 보고 이해하듯 정보를 파악하고 필요한 내용을 정확하게 추출합니다. 추출된 데이터는 AI와 전문가가 함께 4단계에 걸쳐 검증(Quadruple verification)하여 정확도를 높입니다. 회사 측은 이 기술 덕분에 기존 방식보다 데이터 처리 속도는 10배 빨라지고 비용은 약 16배나 줄일 수 있다고 설명합니다. 기업들은 더 이상 복잡한 데이터 정리 작업에 골머리를 앓지 않고, 필요한 데이터를 빠르고 저렴하게 얻을 수 있게 되는 셈입니다.

그래서 누가, 어떻게 써?

스트럭티파이의 기술은 다양한 분야에서 활용될 수 있습니다. 예를 들어 금융 회사는 수많은 투자 제안서(pitch deck)에서 회사명, 투자자, 투자 금액 같은 핵심 정보만 깔끔하게 뽑아낼 수 있습니다. 건설 회사는 복잡한 기술 문서 내용을 표 형태로 변환해서 쉽게 볼 수 있고, 영업팀은 실시간으로 업데이트되는 기업 조직도를 확보해 영업 활동에 활용할 수 있습니다.
구분 내용
핵심 기술 자체 AI 모델 'DoRa', AI+인간 4중 검증
해결 문제 웹 비정형 데이터 처리의 어려움, 높은 비용
주요 타겟 금융, 시장조사, 건설, 이커머스, 기업 기술팀 등
활용 사례 투자 정보 추출, 기술 문서 변환, 조직도 파악, M&A 추적 등
가격 정책 무료(월 1,000건), 프로(월 50달러), 기업 맞춤형

넘어야 할 산은 없을까?

물론 스트럭티파이 앞에 놓인 길이 순탄하기만 한 것은 아닙니다. 웹 데이터는 워낙 방대하고 계속 변하기 때문에 데이터의 정확성과 최신성을 꾸준히 유지하는 것이 중요합니다. 알터릭스(Alteryx), 인포매티카(Informatica), 마이크로소프트(Microsoft), 태블로(Tableau) 같은 기존의 강자들과의 경쟁도 피할 수 없습니다. 또한, 사용자 데이터 보호와 개인정보 규정 준수, AI 모델이 특정 정보에 편향되지 않도록 관리하는 문제 등도 해결해야 할 과제입니다. 스트럭티파이가 '데이터를 상품처럼 누구나 쉽게 이용하게 만들겠다'는 비전을 실현하려면, 이러한 기술적, 윤리적 문제들을 슬기롭게 풀어가야 할 것입니다. 결론적으로, 스트럭티파이의 등장은 데이터 활용 방식에 큰 변화를 가져올 잠재력을 보여줍니다. 이 기술이 성공적으로 안착한다면, 기업들은 더 이상 데이터 부족이나 정제 문제로 어려움을 겪지 않고, 방대한 웹 정보 속에서 가치 있는 인사이트를 발굴하여 경쟁력을 높일 수 있을 것입니다. 데이터가 곧 힘이 되는 시대, 스트럭티파이가 어떤 역할을 할지 주목됩니다.
편집자: 이도윤 기자
제보·문의: aipick@aipick.kr
AI PICK 로고

부키와 모키의 티격태격

찬/반 투표

총 투표수: 0

웹 데이터 AI 정리, 혁신인가 과대광고인가?

댓글 0

관련 기사