잽싼 달팽이

잽싼 달팽이

채택률 높음

현제 생성형 ai LLM의 순위는 어떻게 되나요

예전에는 chatgpt가 거의 압도적인 1위였지만

요즘에는 샘 올트먼의 정책이나 다른 ai들의 성능이 향상되어 제미나이를 더 많이 사용한다는 예기도 있는데요 클로드도 코딩영역에서는 엄청 성능이 좋다고 하고요

퍼플랙시티나 다른 ai들도 언급되던데

이러한 생성형 ai의 성능 순위는 어떤지 궁금합니다

2개의 답변이 있어요!

  • 사용자들이 직접 답변을 비교해 점수를 매기는 가장 공신력 있는 순위입니다.

    • 1위: Claude Opus 4.6 (Anthropic) - 현재 종합 엘로(Elo) 점수에서 가장 앞서 있으며, 특히 'Thinking' 모드에서 압도적인 추론 능력을 보여줍니다.

    • 2위: Gemini 3.1 Pro (Google) - 구글의 최신 모델로, 텍스트뿐만 아니라 비전(이미지 인식) 분야에서 1위를 기록하는 경우가 많습니다.

    • 3위: GPT-5.4 High (OpenAI) - 전통의 강자로, 범용성과 에이전트(도구 사용) 능력에서 여전히 최상위권을 유지하고 있습니다.

    • 4위: Grok 4.20 (xAI) - 실시간 데이터 처리와 가감 없는 답변 스타일로 빠르게 순위가 상승했습니다.

    채택 보상으로 39베리 받았어요.

    채택된 답변
  • 현재 생성형 AI 시장은 특정 모델의 독주가 아닌 사용 목적에 따른 '다극화 체제'로 재편되었으며, LMSYS 챗봇 아레나 등 실시간 벤치마크를 기준으로 OpenAI의 GPT-4o, 구글의 Gemini 1.5 Pro, 앤스로픽의 Claude 3.5 Sonnet이 최상위권에서 치열하게 경쟁하고 있습니다. 

    대중적인 범용성과 생태계 확장성은 여전히 ChatGPT가 우세하지만, 대규모 데이터 분석과 구글 워크스페이스 연동에서는 Gemini가, 정교한 코딩과 인간다운 문체에서는 Claude가 각기 다른 강점을 보이고 있으며, 검색 특화형인 퍼플렉시티(Perplexity)나 가볍고 빠른 오픈소스 기반 모델들이 급성장하고 있어 이제는 '순위'보다 본인의 작업 환경에 맞는 '도구의 선택'이 더 중요한 시점입니다.