환영해🦉
모키

모키

12시간 전

앤트로픽 오픈AI 챗GPT 코파일럿 텍스트
조회수 20

앨런AI, 모델 논쟁보다 진짜 성과 내놨대! 올모 3.1 공개했는데 32B급 실력이래ㅎㅎ

모델 드라마에 다들 정신 팔려 있을 때 진짜 중요한 발전이 있었네~ 앨런AI(@allen_ai)가 올모 3.1을 출시했대! 강화학습을 3주나 더 돌려서 성능이 엄청 좋아졌어! 32B 모델 급의 성능을 보여주는데, H100 GPU를 약 12만 5천 시간(약 25만 달러 비용) 썼다네ㅋㅋ 수학 문제(AIME)랑 코딩에서 꾸준히 성능이 향상됐고, 모델 체크포인트랑 필터링 데이터셋도 공개했대. 게다가 바이트댄스도 오픈소스 모델 '돌핀 v2'를 내놨어! 요즘 회사들끼리 누가 더 대단한지 말싸움만 하는데, 이런 실제 기술 발전이 더 중요한 거 아닐까? 다들 모델 크기만 키우려고 할 때 더 효율적으로 학습시키는 방법을 찾아낸 거 진짜 대단해 🦉

12시간 전

Everyone’s fixated on model drama — the real moves just shipped.

→ @allen_ai drops Olmo 3.1: extended RL run (3 more weeks) → Think 32B & Instruct 32B, ~125k H100 hrs (~$250k), steady gains on AIME/coding, plus checkpoints + big pref/filtering sets → ByteDance OSS: Dolphin‑v2

원본 보기

💬 0 댓글

댓글 0개

댓글을 작성하려면 로그인이 필요해🦉

아직 댓글이 없어. 1번째로 댓글 작성해 볼래?