인공지능(AI)

인공지능(AI) 모델의 이미지 이해 능력 1위는?

LMSYS가 2주간 다양한 사례를 통해 투표한 결과 오픈AI ‘GPT-4o’가 챗본과 멀티모달에 1위가 되었다.
이번 테스트에서는 언어 능력을 기준으로 하던 것을 이미지 능력으로 확장한 것인데, 사용자들의 이미지 설명이나 수학 문제 풀이, 문서 이해, 밈 설명, 스토리 작성 등 다양한 사례의 결과를 비교하여 투표했다고 한다.

최근 인기를 관심을 받고 있는 claude 3.5 sonnet는 코딩과 하드 프롬프트 영역에서 1위에 올랐다.

아래 표의 x축은 ‘언어’와 ‘비전’을 y축은 ‘성능’을 나타내는데,
GPT-4o, claude-3.5-sonnet, gemini-1.5-pro-0514, gpt-4-turbo-04-09는 시각 능력에서 더 높은 성능을 보이고,
claude-3-opus, gemini-1.5-flash-0514, claude-3-sonnet, claude-3-haiku는 시각 능력에서 성능이 낮아진다.

언어는 gpt-4o가 가장 높고, claude-3.5-sonnet이 그 다음이며
시각은 gpt-4o와 claude-3.5-sonnet이 거의 동등한 최고 성능을 보인다.

boshow

Next 스마트폰 사진 촬영, 영상 촬영 가이드 »

Previous « 인공지능 기술 시대의 변화

Leave a Comment

Share

Published by

boshow

Tags: claudeGPT-4o인공지능인공지능1위

1년 ago

Recent Posts

전자화폐

전자화폐 전문가가 파헤치는 비트코인: 미래 화폐인가, 투기 수단인가? – 요약

오늘은 우리 시대의 가장 뜨거운 화두 중 하나인 비트코인에 대해 이야기해보려 합니다. 많은 분이 비트코인을…

20시간 ago

경제

위기의 시대, 살아남기 위한 당신의 경제 전략 – 박종훈 기자의 경고와 조언

최근 한국 경제가 1%대 성장률로 떨어지면서 불안감이 커지고 있습니다. 경제 전문가 박종훈 기자는 이 현상이…

20시간 ago

전자화폐

100조 원과 함께 사라진 비트코인 창시자, 사토시 나카모토의 정체는? – 꼬꼬무 요약

비트코인의 탄생과 사토시 나카모토의 등장 2009년 1월 3일, 비트코인이 처음 발행되었습니다 [00:00]. 초기에는 기술적으로 특별한…

20시간 ago

인공지능(AI)

AI가 당신의 비서가 되는 시대: 구글 오팔로 경험하는 노코드 AI 혁명

최근 공개된 구글의 새로운 AI 도구 ‘오팔(Opal)’이 전 세계적으로 큰 주목을 받고 있습니다. 여러 영상에서…

1일 ago

아카이브

온라인 아카데미 만들기, 라이브클래스로 단독 브랜드 구축하기

온라인 교육 시장은 매년 폭발적으로 성장하고 있습니다. 강사, 전문가, 코치, 크리에이터 모두가 온라인 아카데미 만들기에…

7일 ago

심리

성장통을 겪는 당신에게: 심리학 거장들이 말하는 삶의 단계별 성장 로드맵

인간의 발달을 이해하는 데 필수적인 심리학 이론들을 깊이 파고들어, 각 이론이 제시하는 발달 단계와 그…

1주 ago

L