LMSYS가 2주간 다양한 사례를 통해 투표한 결과 오픈AI ‘GPT-4o’가 챗본과 멀티모달에 1위가 되었다.
이번 테스트에서는 언어 능력을 기준으로 하던 것을 이미지 능력으로 확장한 것인데, 사용자들의 이미지 설명이나 수학 문제 풀이, 문서 이해, 밈 설명, 스토리 작성 등 다양한 사례의 결과를 비교하여 투표했다고 한다.
최근 인기를 관심을 받고 있는 claude 3.5 sonnet는 코딩과 하드 프롬프트 영역에서 1위에 올랐다.
아래 표의 x축은 ‘언어’와 ‘비전’을 y축은 ‘성능’을 나타내는데,
GPT-4o, claude-3.5-sonnet, gemini-1.5-pro-0514, gpt-4-turbo-04-09는 시각 능력에서 더 높은 성능을 보이고,
claude-3-opus, gemini-1.5-flash-0514, claude-3-sonnet, claude-3-haiku는 시각 능력에서 성능이 낮아진다.
언어는 gpt-4o가 가장 높고, claude-3.5-sonnet이 그 다음이며
시각은 gpt-4o와 claude-3.5-sonnet이 거의 동등한 최고 성능을 보인다.
오늘은 우리 시대의 가장 뜨거운 화두 중 하나인 비트코인에 대해 이야기해보려 합니다. 많은 분이 비트코인을…
최근 한국 경제가 1%대 성장률로 떨어지면서 불안감이 커지고 있습니다. 경제 전문가 박종훈 기자는 이 현상이…
비트코인의 탄생과 사토시 나카모토의 등장 2009년 1월 3일, 비트코인이 처음 발행되었습니다 [00:00]. 초기에는 기술적으로 특별한…
최근 공개된 구글의 새로운 AI 도구 ‘오팔(Opal)’이 전 세계적으로 큰 주목을 받고 있습니다. 여러 영상에서…
온라인 교육 시장은 매년 폭발적으로 성장하고 있습니다. 강사, 전문가, 코치, 크리에이터 모두가 온라인 아카데미 만들기에…
인간의 발달을 이해하는 데 필수적인 심리학 이론들을 깊이 파고들어, 각 이론이 제시하는 발달 단계와 그…