부키
2025년 11월 05일
교육
사업
오픈AI
챗GPT
텍스트
조회수 39
챗GPT, 이제 '정답' 찾는 수준 넘었어? '창의성' 평가 기준 찾는 중
기존 AI 평가는 그동안 주로 '정확도'에 초점 맞추고 있었는데, 이제는 '창의성'까지 평가하려는 움직임이 나타나고 있어.
그러니까 '정답이 있는 문제'는 AI가 맞았는지 틀렸는지 평가하기 쉬웠지만, 창의력이나 아이디어 발상 같은 '정답이 없는 문제'에선 AI의 능력을 어떻게 측정해야 할지 고민이 시작된 거지.
결국 '똑똑한' AI를 넘어서 '창의적인' AI로 발전하는 단계에 접어들고 있다는 거네. 특히 창작이나 기획 영역에서 AI를 활용하려면 이런 '주관적 영역'의 평가 기준이 필요해졌어.
사실 인간의 창의성도 객관적으로 측정하기 힘든데 AI의 창의성은 어떻게 평가할 수 있을지 궁금하긴 하다 ㅋㅋ
앞으로는 AI가 정답을 찾는 능력보다 새로운 아이디어를 제안하는 능력이 더 중요해질 수도 있겠다 🦉
첨부 미디어
2025년 11월 05일
【AIの"賢さ"の次に来るもの。】
これまでのAI評価は「正しさ」が中心でした。
しかし、創造性やアイデア出しのような「正解のない問い」におけるAIの能力は、どう測ればよいのでしょう? https://t.co/lwAVglyvqF
로그인하면 맞춤 뉴스 물어다 줄게🦉
-
관심사 기반 맞춤 뉴스 추천
-
왕초보를 위한 AI 입문 가이드북 제공
-
부키가 물어다 주는 뉴스레터 구독
-
회원 전용 인사이트 칼럼 열람
-
둥지 커뮤니티 게시판 이용
또는 회원가입 하기
지금 핫한 소식🚀
- 1. 챗GPT, 유저들 선호도 순위 1위로 뽑혔는데 그럴만 하지 않아?
- 2. 일론 머스크, 아프간 테러리스트에게 총상 입은 미 방위군 상태 호전 소식 전해
- 3. 헤이젠, 아바타 커스텀부터 번역까지 11월에 쏟아낸 신기능 모음 놀라워
- 4. 대규모 언어 모델, 생각하는 방식엔 특별한 리듬이 있다는데?
- 5. SynClub, 이젠 AI랑 연애까지 한다네? 심지어 가짜 잠든척하는 여자까지 있대ㄷㄷ
- 6. Base 네트워크, 베이스에서 주목받는 가상 AI 에이전트 7종 공개했대
- 7. AI Alpha, 이름만 거창한 전형적인 암호화폐 스캠 냄새 나네
- 8. AI, 에이전틱 AI(Agentic AI)가 뭐길래 이렇게 핫한거야?
- 9. 구글, 실제 작업하면서 VSCode와 클라우드 코드로 제미나이 활용해 여러 개발 병행중이래
- 10. AI 경마 예측, 일본 경마장 별 예상 번호 알려줄게!
부키가 물어다 주는 뉴스레터🦉
미리보기구독하면 이메일로 AI 소식과 팁들을 보내줄게!
아직 댓글이 없어. 1번째로 댓글 작성해 볼래?