요즘 정말 인기 있는 AI 챗봇 챗gpt죠. 우연히 접했다가 아주 푹 빠져서 재미나게 활용하고 있는 것 같습니다. 그래서 이 프로그램에 관심이 정말 많습니다. 여러 정보들을 모으다가 우연히 한 라디오에서 챗gpt 새로운 버전이 나온다는 것을 들었습니다. gpt-4 모델이 1/4 분기에 출시 될 거라고 하더군요.
1/4분기면 이번달인데, 언제쯤 나오려나 유심히 보다가 홈페이지에 들어가 보았더니 소식이 나왔습니다.
바로 오늘이네요! 오픈AI 홈페이지를 확인해 보니 챗gpt-4의 API를 챗gpt PLUS 사용자와 개발자들에게 대기자 명단에 등록하여 엑세스 할 수 있게 하였습니다.
챗 gpt 4 출시일
마이크로 소프트의 3대 CEO인 사티아 나델라는 오늘 3월 16일에 (내일이네요) "Future of Work with AI" 이벤트를 발표했습니다.
"Reinventing Productivity with AI"라는 즉, AI로 생산성을 재창조하는 것을 논의하는 행사를 주최할 것이라고 밝혔습니다.
미국시간 기준 오전 8시(한국시간으로는 21시경)에 라이브 스트리밍으로 마이크로 소프트 홈페이지에서 시청가능합니다.
정확한 확인을 위해 머니컨트롤이라는 금융포털 사이트의 뉴스를 확인해 봤습니다. 뉴스 기사에서는 챗gpt 이면의 AI를 더많은 개발자 도구와 계속 통합하면서 워크플레이스를 위한 향후 인공지능에 대한 세부 정보를 공유할 것으로 예상하고 있습니다.
또한 이 행사는 인도 시간으로 오후 9시 30분에 시작하며, 마이크로 소프트의 회장 겸 CEO인 사티야 나델라와 기업 업무 및 비즈니스 애플리케이션 부사장인 제라드 스파타로가 주최한다고 합니다. 이 3월 16일 마이크로 소프트가 진행하는 이벤트에서 챗gpt 4.0을 공개하지 않을까라고 많은 사람들이 예상하고 있습니다.
챗gpt 4.0 알아보기
오픈AI 홈페이지에서 제공하는 gpt-4에 대한 기술보고서입니다. 다운을 받아서 읽어보았습니다.
서론에 따르면 이미지 및 텍스트 입력을 처리하고 텍스트 출력을 생성할 수 있는 대형 멀티 모델인 GPT-4를 소개합니다. 이 모델의 성능은 다양한 테스트와 벤치마크에서 평가 되었으며 이전 모델 보다 성능이 우수하고 모의 변호사 시험에서 사람보다 높은 점수를 받았다고 합니다. 또한 광범위한 규모에서 예측 가능하게 작동하는 딥 러닝 인프라 및 최적화 방법을 개발하는 문제에 대해 얘기합니다.
기술보고서에 있는 그래프 에서는 실제 시험 조건과 채점 기준이 적용된 시뮬레이션 전문 시험에서 GPT-4의 성능이 GPT-3.5보다 훨씬 향상된 것을 알수 있습니다.
이 표에서는 또한 기계 학습 모델용으로 설계된 기존 벤치마크에서 평가한 GPT-4는 대부분의 최첨단 (SOTA) 모델과 함께 기존의 대규모 언어 모델보다 훨씬 뛰어난 성능을 발휘한다고 밝혔습니다.
다양한 언어의 MMLU벤치마크에서 이전 영어보델과 비교한 성능을 보여줬습니다. 라트비아어, 웨일스어, 스와힐리어와 같은 소스가 적은 언어를 포함하여 테스트한 대부분의 언어에 대해 영어로 된 기존 언어 모델보다 성늘이 뛰어나다고 합니다.
아무래도 우리는 한국어에 관심이 많을텐데요. 77%로 GPT-3.5보다 약 7% 발전 되었다고 합니다.
실제로 챗gpt를 사용하면서 영어로 질문했을 때와 한글로 질문했을 때의 차이를 꽤 많이 느꼈는데, 그래프를 분석해 보니 앞으로 선보일 챗gpt 4.0에서도 영어로는 85.5%, 한글로는 77%의 8.5%의 차이가 나네요. 이는 영어로 쓰는 인구가 한국어를 쓰는 인구보다 훨씬 많을 테니 딥러닝으로 운영되는 방식으로 차이가 있을 수 밖에 없네요.
이 그래프에서는 내부 평가에서 이전 버전들보다 정확도가 19% 향상되었음을 보여주고 있습니다.
잘못된 진술을 식별하는 모델의 기능을 테스트 하는 TruthfulQA와 같은 공개 벤치마크에서 좋은 결과를 얻은 반면에 GPT-4에서도 여전히 실수를 하기도 한다고 합니다. 예를 들어 질문을 교묘하게 속여서 하게 되면 너무나 쉽게 속아서 엉뚱한 대답을 한다고 합니다. 아직 완벽한 프로그램이 아니니 피할 수 없겠죠.
챗 gpt-4의 안전성과 위험을 개선하기 위해 사전 훈련 데이터 선택 및 필터링, 적대적 테스트를 위한 도메인 전문가 참여, 모델의 안전성 개선, 반복 모니터링 등 여러 조치를 구현했다고 합니다.
50명 이상의 사이버 보안 같은 전문가와 테스를 했는데, 테스트 결과 위험한 컨텐츠에 대한 요청을 거부하도록 모델을 교육함으로써 유해한 출력을 줄이기 위해 추가 안전 보상 신호를 통합했다고 합니다.
비쥬얼 인풋 능력에 관한 예시입니다. 우리가 사진과 링크를 첨부하여 질문하면 gpt-4가 꽤나 정확하게 답변해 준다고 합니다.
챗gpt 4.0 출시일과 챗gpt-4를 알아보았습니다. 이렇게 빠르게 변해가는 세상에 우리는 어떤 능력을 함양해야할까라는 생각을 하게 되네요. 지배당할 수는 없으니 우리만의 것들을 더 고수해야겠지요.