본문 바로가기
  • 당신은 참 괜찮은 사람입니다!
  • 당신은 사랑 받기에 충분합니다!
세상좋은 꿀팁/[생활 지식] 생활에 꼭 필요한 꿀팁

챗GPT-4 사용방법 "챗GPT-3.5와 성능 비교"

by 창의날다 2023. 3. 16.

한국 그리고 전 세계에 충격을 주었던  챗GPT가 약 4개월 만에 챗GPT-4로 업그레이드 되어 공개되었습니다. 짧은 시간에 업그레이드 된 것도 놀랍지만, 공개된 챗GPT-4 성능에 더욱 놀라게 됩니다. 오늘 포스팅에서는 챗GPT-4에 대한 성능 그리고 사용방법에 대해서 알아보도록 하겠습니다. 

&nbspp>

 

 

챗GPT-4 사용방법, 성능

챗GPT 개발사인 미국 오픈AI는 초거대 규모 AI '챗GPT-4'를 공개하였습니다. 

챗GPT-4는 이제 문자뿐 아니라 이미지도 인식하며, 다양한 시험에서 인간과 비슷한 수준의 퍼포먼스를 보였다고 발표하였습니다. 

챗GPT4사용방법
챗GPT4사용방법-홈페이지

 

챗GPT는 2022년 11월에 챗GPT-3.5 버전이 탑재되어 공개되었습니다. 

챗GPT는 인간의 언어를 이해하고, 문장과 글을 생성할 수 있는 혁신적인 기술 서비스를 제공하였습니다.

챗GPT-3.5 버전도 놀라웠는데, 이번 공개된 챗GPT-4 버전은 스마트폰을 통해 찍은 사진이나 사람의 손글씨도 인식하는 놀라운 발전을 보였습니다. 

그리고 이전 챗GPT-3.5 버전에서 없었던 일들을 지어내는 오류를 줄였다고 합니다. 

또한 변호사 및 각종 자격 시험에서 하위 10% 수준에 그쳤던 챗GPT-3.5와는 다르게 이번 챗GPT-4는 상위 10%의 능력을 보였다고 합니다. 

챗GPT-4 사용 바로가기!

 

 

 

챗GPT-4 vs 챗GPT-3.5 성능 비교

 

1. 챗GPT-4 성능

- 출시 : 2023년 3월 14일

- 기능 : 문장 인식 및 텍스트 새애성, 이미지 인식 및 분석

- 대표 서비스 : 챗GPT/빙(검색엔진), 이미지 분석 서비스 개발 중

- 데이터 처리 가능량 : 회당 2만 5000단어

- 성능 : 미 변호사 시험 298점(상위 10%), SAT 수학 시험 700점(상위 11%), 미 생물학 올림피아드 87점(상위 1%) 

 

2. 챗GPT-3.5 성능

- 출시 : 2022년 11월 30일

- 기능 : 문장 인식 및 텍스트 생성

- 대표 서비스 : 챗GPT, 빙(검색인진)

- 데이터처리 가능량 : 회당 3000단언

- 성능 : 미 변호사 시험 213점(상위 90%), SAT 수학 시험 590점(상위 30%), 미 생물학 올림피아드 43점(상위 68%)

 

 

 

챗GPT-4 사용 방법

이번에 공개된 챗GPT-4 사용 방법은 기존 챗GPT-3.5 버전(무료) 사용에 업그레이드를 해서 사용할 수 있습니다. 

물론 챗GPT-4 버전은 유료이며, 한달 20달러를 지불해야 합니다. 

기존 무료로 사용하던 챗GPT-3.5 사용 방법을 위해서 보셧다면, 다음 사항을 진행합니다.

- 챗GPT 홈페이지에서 모델을 "챗GPT-4"로 선택합니다. 

- 그럼 업그레이드를 진행할 때에 20달러를 결제하고 사용할 수 있습니다. 

챗GPT 사용 방법 바로가기!

 

 

 

챗GPT-4를 소개합니다.

아래는 오픈 AI에서 소개한 챗GPT-4에 대한 성능 소개글입니다. 

 

1. 챗GPT-4 기본 개념

우리는 OpenAI의 딥 러닝 확장 노력의 최신 이정표인 GPT-4를 만들었습니다. GPT-4는 많은 실제 시나리오에서 인간보다 능력이 떨어지지만 다양한 전문 및 학술 벤치마크에서 인간 수준의 성능을 보여주는 대규모 다중 모드 모델(이미지 및 텍스트 입력을 수락하고 텍스트 출력을 내보냄)입니다.

 

우리는 OpenAI의 딥 러닝 확장 노력의 최신 이정표인 GPT-4를 만들었습니다. GPT-4는 많은 실제 시나리오에서 인간보다 능력이 떨어지지만 다양한 전문 및 학술 벤치마크에서 인간 수준의 성능을 나타내는 대규모 다중 모드 모델(이미지 및 텍스트 입력을 수락하고 텍스트 출력을 내보냄)입니다. 예를 들어, 시험 응시자의 상위 10% 정도의 점수로 모의 변호사 시험을 통과합니다. 대조적으로 GPT-3.5의 점수는 하위 10% 정도였습니다. 우리는 6개월 동안   적대적 테스트 프로그램과 ChatGPT의 교훈을 사용하여 GPT-4를 반복적으로 조정하여 사실성, 조종성 및 가드레일 밖으로 나가는 것을 거부하는 측면에서 (완벽하지는 않지만) 최고의 결과를 얻었습니다 .

 

 

 

챗GPT4사용방법
챗GPT4사용방법-홈페이지

지난 2년 동안 우리는 전체 딥 러닝 스택을 재구축했으며 Azure와 함께 작업 부하를 위해 처음부터 슈퍼컴퓨터를 공동 설계했습니다. 1년 전 우리는 시스템의 첫 번째 "테스트 실행"으로 GPT-3.5를 교육했습니다. 몇 가지 버그를 찾아 수정하고 이론적 기반을 개선했습니다. 그 결과 GPT-4 훈련 실행은 (적어도 우리에게는!) 전례 없이 안정적이었으며 훈련 성능을 미리 정확하게 예측할 수 있는 최초의 대형 모델이 되었습니다. 우리는 신뢰할 수 있는 확장에 계속 초점을 맞추면서 미래의 기능을 점점 더 미리 예측하고 준비하는 데 도움이 되는 방법론을 연마하는 것을 목표로 합니다.

 

ChatGPT 및 API( 대기자 명단 포함)를 통해 GPT-4의 텍스트 입력 기능을 출시합니다 . 보다 폭넓은 가용성을 위해 이미지 입력 ​​기능을 준비하기 위해 단일 파트너 와 긴밀히 협력하여 시작하고 있습니다. 또한 AI 모델 성능의 자동 평가를 위한 프레임워크인 OpenAI Evals를 오픈 소싱하여 누구나 모델의 단점을 보고하여 추가 개선을 안내할 수 있도록 합니다.

 

 

 

2. 챗GPT-4 기능

일상적인 대화에서 GPT-3.5와 GPT-4의 차이는 미묘할 수 있습니다. 작업의 복잡성이 충분한 임계값에 도달하면 차이가 나타납니다. GPT-4는 GPT-3.5보다 더 안정적이고 창의적이며 훨씬 더 미묘한 지침을 처리할 수 있습니다.

 

두 모델의 차이점을 이해하기 위해 원래 인간을 위해 설계된 시험 시뮬레이션을 포함하여 다양한 벤치마크에서 테스트했습니다. 공개적으로 사용 가능한 최신 테스트(올림피아드 및 AP 무료 응답 질문의 경우)를 사용하거나 2022-2023 에디션의 연습 시험을 구매하여 진행했습니다. 우리는 이 시험을 위해 특별한 훈련을 하지 않았습니다. 시험에서 소수의 문제가 교육 중에 모델에 표시되었지만 결과가 대표적이라고 생각합니다. 자세한 내용은 기술 보고서를 참조하십시오.

챗GPT4사용방법
챗GPT4사용방법-홈페이지

 

 

 

또한 기계 학습 모델용으로 설계된 기존 벤치마크에서 GPT-4를 평가했습니다. GPT-4는 벤치마크별 제작 또는 추가 훈련 프로토콜을 포함할 수 있는 대부분의 최첨단(SOTA) 모델과 함께 기존의 대규모 언어 모델보다 훨씬 뛰어난 성능을 발휘합니다.

 

챗GPT4사용방법
챗GPT4사용방법-홈페이지



1) 시각적 입력

GPT-4는 텍스트 및 이미지 프롬프트를 수락할 수 있으며 텍스트 전용 설정과 마찬가지로 사용자가 시각 또는 언어 작업을 지정할 수 있습니다. 구체적으로 산재된 텍스트와 이미지로 구성된 입력이 주어지면 텍스트 출력(자연어, 코드 등)을 생성합니다. 텍스트와 사진이 포함된 문서, 다이어그램 또는 스크린샷을 비롯한 다양한 영역에서 GPT-4는 텍스트 전용 입력에서와 유사한 기능을 보여줍니다. 또한 퓨샷 및 사고 사슬 프롬팅을 포함하여 텍스트 전용 언어 모델용으로 개발된 테스트 시간 기술로 보강할 수 있습니다 . 이미지 입력은 여전히 ​​연구 미리 보기이며 공개적으로 사용할 수 없습니다.

 

 

2) 챗GPT-4 제한 사항

이러한 기능에도 불구하고 GPT-4에는 이전 GPT 모델과 유사한 제한 사항이 있습니다. 가장 중요한 것은 여전히 ​​완전히 신뢰할 수 없다는 것입니다(사실을 "환각"하고 추론 오류를 만듭니다). 특정 사용 사례의 요구 사항과 일치하는 정확한 프로토콜(예: 인적 검토, 추가 컨텍스트 기반 또는 고부담 사용 모두 방지)과 함께 특히 고부담 상황에서 언어 모델 출력을 사용할 때 세심한 주의를 기울여야 합니다.

 

여전히 실제 문제이지만 GPT-4는 이전 모델(각 반복마다 자체적으로 개선됨)에 비해 환각을 크게 줄입니다. GPT-4는 내부 적대적 사실성 평가에서 최신 GPT-3.5보다 40% 높은 점수를 받았습니다.

 

 

 

3) 교육 과정

이전 GPT 모델과 마찬가지로 GPT-4 기본 모델은 문서의 다음 단어를 예측하도록 훈련되었으며 공개적으로 사용 가능한 데이터(예: 인터넷 데이터)와 라이선스가 부여된 데이터를 사용하여 훈련되었습니다. 데이터는 수학 문제에 대한 정확하고 잘못된 솔루션, 약하고 강력한 추론, 자기 모순적이고 일관된 진술을 포함하고 다양한 이데올로기와 아이디어를 나타내는 웹 규모의 데이터 모음입니다.

 

 

4) 예측 가능한 확장

GPT-4 프로젝트의 큰 초점은 예측 가능하게 확장되는 딥 러닝 스택을 구축하는 것이었습니다. 주된 이유는 GPT-4와 같은 매우 큰 훈련 실행의 경우 광범위한 모델별 튜닝을 수행하는 것이 불가능하기 때문입니다. 우리는 여러 규모에서 매우 예측 가능한 행동을 하는 인프라와 최적화를 개발했습니다. 이 확장성을 확인하기 위해 동일한 방법론을 사용하지만 10,000배 적은 컴퓨팅을 사용하여 훈련된 모델에서 외삽하여 내부 코드베이스(훈련 세트의 일부가 아님)에서 GPT-4의 최종 손실을 사전에 정확하게 예측했습니다.

728x90

댓글