모키
2026년 02월 05일
퍼플렉시티, 딥 리서치 업그레이드했는데 상위 벤치마크에서 모든 경쟁자 이겼대!
첨부 미디어
We've upgraded Deep Research in Perplexity.
Perplexity Deep Research achieves state-of-the-art performance on leading external benchmarks, outperforming other deep research tools on accuracy and reliability.
Available now for Max users. Rolling out to Pro in the coming days. https://t.co/8RAlewuWa3
This upgrade pairs the best available models with Perplexity's proprietary search engine and sandbox infrastructure.
Deep Research now runs on Opus 4.5 for Max and Pro users. We'll upgrade to top reasoning models as they become available. https://t.co/zqbjyObX9T
We're also releasing a new open-source benchmark for evaluating deep research agents.
The Deep Research Accuracy, Completeness, and Objectivity (DRACO) Benchmark is grounded in how people actually use deep research.
Read more about how the benchmark was built: https://t.co/QjcOBhGUJk
Most benchmarks test isolated skills like fact retrieval or trivia. But real research requires synthesis across many sources, nuanced analysis, and accurate sources.
DRACO includes 100 tasks across 10 domains—Academic, Finance, Law, Medicine, Technology, General Knowledge, UX https://t.co/XYNS2A5x15
In our own DRACO evaluations, Perplexity outperforms all competitors in every domain, especially on Law, Medicine, and Academic use cases. https://t.co/tjiRMy84JV
Our DRACO Benchmark is fully open-source and we're releasing the benchmark, rubrics, and methodology today.
To learn more about methodology and detailed results, read the full paper: https://t.co/MDgnQ3E0kO
The dataset is available on Hugging Face: https://t.co/tHFHjzNNpR
로그인하면 맞춤 뉴스 물어다 줄게🦉
-
관심사 기반 맞춤 뉴스 추천
-
왕초보를 위한 AI 입문 가이드북 제공
-
부키가 물어다 주는 뉴스레터 구독
-
회원 전용 인사이트 칼럼 열람
-
둥지 커뮤니티 게시판 이용
지금 핫한 소식🚀
- 1. 마이크로소프트, 에너지 계획 도우미 미코 출시했네? 환경 친화적 솔루션 제공한대
- 2. 코파일럿, 발렌티나의 테크 세계 도전 도와주는 AI 비서 역할 톡톡
- 3. 코파일럿, 새로운 시작을 방해하는 것들 극복하도록 도와준대
- 4. 클로드, 내가 쓰는 AI 서비스 용도 공유해봤어!
- 5. OpenAI, roon의 코드 레드 포스트에 관한 기능 가능성 논란 중
- 6. 런웨이, 월드 모델 개발에 3500억 투자 유치 했대! 혁신 기술 선도한대
- 7. Kimi K2.5, 100개 AI 에이전트 동시에 부리는 오픈소스 모델 등장했대
- 8. AAI, 새로운 AI 프로젝트 공개했는데 추가 정보는 링크 확인해봐
- 9. 생성 AI, ChatGPT랑 제미나이, 클로드 셋 중 하나만 써도 충분하대
- 10. 앤트로픽, 데이터센터 전력 가격 인상분 100% 책임진다네
부키가 물어다 주는 뉴스레터🦉
미리보기구독하면 이메일로 AI 소식과 팁들을 보내줄게!
아직 댓글이 없어. 1번째로 댓글 작성해 볼래?