AI 연구회사인 Anthropic이 최근 대화형 AI 모델인 '클로드 2'를 발표하였습니다. 이 모델은 향상된 성능, 더 긴 응답 제공 능력, 그리고 API 또는 베타 웹사이트인 claude.ai를 통한 접근성을 자랑합니다. 사용자 친화적인 대화 방식, 명확한 생각 표현, 유해한 결과물 생성 가능성 감소, 그리고 더 긴 기억력에 대해 긍정적인 리뷰를 받았습니다.
클로드 2는 코딩, 수학, 그리고 추론에 대한 성능 향상을 보여주었습니다. 이 최신 모델은 멀티플 초이스 부분의 변호사 시험에서 76.5%를 기록하여 이전 모델인 '클로드 1.3'의 73.0%보다 높은 성적을 얻었습니다. 또한, 대학원 지원자들과 비교했을 때, 클로드 2는 GRE 읽기 및 쓰기 시험에서 90퍼센타일 이상의 성적을 얻었으며 수량적 추론에 대해서는 평균 지원자와 비슷한 수준을 보였습니다.
사용자들은 이제 입력 단락에 최대 10만 개의 토큰을 입력할 수 있으며, 클로드는 기술 문서 수백 페이지나 책 전체를 처리할 수 있습니다. 클로드는 이제 한 번에 수천 개의 토큰에 이르는 더 긴 문서를 작성할 수 있습니다.
또한 최신 모델인 클로드 2는 코딩 능력을 크게 향상시켰습니다. 이 모델은 Python 코딩 테스트인 'Codex HumanEval'에서 71.2%로 '클로드 1.3'의 56.0%보다 높은 성적을 얻었습니다.
Anthropic은 클로드 2의 안전성을 향상시키기 위해 노력하고 있으며, 이를 통해 유해하거나 불쾌한 출력을 생성하는 것을 방지하고 있습니다. 또한, 클로드 2는 미국과 영국에서 일반적으로 사용할 수 있으며, 몇 달 안에는 더욱 글로벌하게 확장할 계획입니다.
수천 개의 기업이 클로드 API를 사용하고 있으며, 이 중 하나인 Jasper는 개인과 팀이 콘텐츠 전략을 확장할 수 있도록 하는 생성적 AI 플랫폼입니다. 또한, Sourcegraph는 코드 AI 플랫폼으로, 사용자의 쿼리에 더욱 정확한 답변을 제공하고 최대 10만 개의 컨텍스트 창을 사용하여 더 많은 코드베이스 컨텍스트를 전달하기 위해 클로드 2의 향상된 추론 능력을 활용합니다.
이 모델은 아직은 베타 런치 단계에 있어, 때때로 부적절한 응답을 생성할 수 있습니다. 일상적인 상황에서 가장 유용하며, 신체적이거나 정신적 건강과 관련된 상황에서는 사용하지 않아야 합니다.
마지막으로, "콘텐주" 채널에서는 곧 구글바드, 챗GPT 그리고 클로드 2.0의 비교 영상을 업로드할 예정입니다. 이 흥미진진한 이벤트를 기대하며, 더 많은 정보와 업데이트를 공유하겠습니다.