뉴스 보도 Technology
2023 년 3 월 15 일

GPT-4 이미지, 문서, 다이어그램 및 스크린샷에 대한 요청을 처리할 수 있습니다.

요컨대

GPT-4 이미지, 문서, 다이어그램, 스크린샷에 대한 요청을 처리할 수 있습니다. 이상 개선이군요 GPT-3, 텍스트만 처리했습니다.

GPT-4 다양한 시험과 테스트에서 탁월한 성능을 발휘하며 서면 형식으로는 제공되지 않는 이미지를 통해 추가 정보 및 세부 사항에 접근할 수 있습니다.

gpt-4 이미지 문서 스크린샷

OpenAI의 최신 이정표, 새로운 모델 GPT-4에서는 이미지, 텍스트가 포함된 문서, 다이어그램 또는 스크린샷을 입력으로 포함하는 요청을 수락할 수 있습니다. 이는 이전 버전에 비해 상당한 개선을 나타냅니다. GPT-3, 텍스트만 이해하고 출력할 수 있습니다. 이 새로운 기능으로, GPT-4 산재된 텍스트와 이미지로 구성된 입력이 주어지면 텍스트 출력을 생성합니다.

“텍스트와 사진, 다이어그램, 스크린샷이 포함된 문서를 포함하여 다양한 도메인에 걸쳐—GPT-4 텍스트 전용 입력과 유사한 기능을 보여줍니다.

OpenAI 썼다.

ChatGPT-4 이전 모델보다 크기가 더 커졌습니다. 이는 더 많은 양의 데이터에 대한 훈련을 거쳤으며 모델 파일에 더 많은 가중치를 포함하므로 작업 비용이 더 높아진다는 것을 의미합니다. 최신 AI 언어는 다음을 사용하여 인간과 유사한 텍스트를 생성할 수 있습니다. 깊은 학습 대규모 데이터 세트에서 사전 교육을 받고 있습니다.

GPT-4 이 타 AI 언어보다 월등한 성능 입증 서면 형식으로 제공되지 않을 수 있는 이미지를 통해 추가 정보 및 세부 정보에 액세스할 수 있는 기능으로 인해 다양한 시험 및 테스트에서

새로운 GPT-4 모델은 그림에 묘사된 내용이 정확히 무엇인지 알려주고 분석하며 그 의미까지 설명할 수 있습니다. 데모에서는 GPT-4 VGA 케이블이 iPhone에 연결된 시각적 농담을 설명했습니다. 아래에서 확인할 수 있는 "극단적인 다림질"을 보여주는 그림에서 특이한 점을 설명할 수도 있습니다.

gpt-4 형상
출처: OpenAI

그러나 더 유용한 의미도 있습니다. GPT-4의 새로운 지식. 프레젠테이션에서 PGT-4는 그림에 표시된 재료로 무엇을 요리할 수 있는지 알 수 있는 것으로 나타났습니다. 이는 식품이 있는데 어떻게 해야 할지 전혀 모르는 경우 모델이 요리하는 데 도움이 될 수 있음을 의미합니다. 가지고 있는 음식의 스냅샷을 찍고, 채팅을 해보세요-GPT 집에 있는 재료로 무엇을 준비할 수 있는지 알려줄 수 있어요.

시각적 정보를 이해하고 해석하는 능력은 GPT-4 이미지 캡션, 시각적 질문 답변, 심지어 콘텐츠 생성과 같은 작업을 위한 강력한 도구입니다. 텍스트와 시각적 이해의 통합으로 GPT-4 광고, 디자인, 전자상거래 등 다양한 산업에 혁명을 일으키고 사람들이 지루하고 일상적인 작업을 수행하도록 도울 수 있는 잠재력을 가지고 있습니다.

고급 언어 모델 또한 텍스트, 표, 다이어그램 또는 기타 시각적 표현이 포함된 스크린샷과 문서를 '이해'합니다. 예를 들어, XNUMX페이지 분량의 연구 논문을 업로드했는데 이를 요약하고 설명해야 한다면, GPT-4 그렇게 할 수 있습니다. 

Bloomberg의 앵커 Jon Erlichman은 손으로 스케치한 디자인을 기능적인 웹 사이트로 변환할 수 있는 방법을 시연했습니다.

새로운 기술은 시각 장애인을 위한 환경을 설명하는 데 사용할 수 있으므로 이동 보조 장치로도 사용할 수 있습니다. 이를 위해 Open AI는 이미 다음과 같은 애플리케이션과 파트너 관계를 맺었습니다. 내 눈이 되라 예를 들어 식료품 쇼핑을 하는 동안 시각 장애인이 무언가를 봐야 할 때 도움의 손길을 제공하도록 설계되었습니다. 이 앱을 사용하면 "시력이 있는 자원봉사자와 전문가가 눈을 빌려 크고 작은 작업을 해결하여 시각 장애인과 저시력자가 보다 독립적인 삶을 영위하도록 돕습니다." 이제 다음으로 구동되는 가상 자원 봉사 도구도 제공합니다. OpenAI의 GPT-4.

이기는하지만 OpenAI의 GPT-4 현재 텍스트와 이미지를 입력으로 처리하는 기능을 제공하지만 이 모델에는 아직 오디오 및 비디오 입력을 처리할 수 있는 기능이 없습니다. 그럼에도 불구하고 이러한 방식이 다음 기술 반복에 포함될 수 있다는 징후가 있습니다.

더 읽기 :

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Agne는 메타버스, AI, Web3 산업 Metaverse Post. 스토리텔링에 대한 그녀의 열정으로 인해 그녀는 이 분야의 전문가들과 수많은 인터뷰를 진행했으며 항상 흥미롭고 매력적인 이야기를 발견하기 위해 노력했습니다. Agne는 문학 학사 학위를 보유하고 있으며 여행, 예술, 문화를 포함한 광범위한 주제에 대한 글쓰기에 대한 광범위한 배경을 가지고 있습니다. 그녀는 또한 동물 권리 단체의 편집자로 자원 봉사하여 동물 복지 문제에 대한 인식을 높이는 데 도움을 주었습니다. 그녀에게 연락하세요 [이메일 보호].

더 많은 기사
아그네 시메르만
아그네 시메르만

Agne는 메타버스, AI, Web3 산업 Metaverse Post. 스토리텔링에 대한 그녀의 열정으로 인해 그녀는 이 분야의 전문가들과 수많은 인터뷰를 진행했으며 항상 흥미롭고 매력적인 이야기를 발견하기 위해 노력했습니다. Agne는 문학 학사 학위를 보유하고 있으며 여행, 예술, 문화를 포함한 광범위한 주제에 대한 글쓰기에 대한 광범위한 배경을 가지고 있습니다. 그녀는 또한 동물 권리 단체의 편집자로 자원 봉사하여 동물 복지 문제에 대한 인식을 높이는 데 도움을 주었습니다. 그녀에게 연락하세요 [이메일 보호].

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진

Samourai Wallet 창립자들은 다크넷 거래에서 2억 달러를 촉진한 혐의로 기소되었습니다

Samourai Wallet 창립자들의 우려는 업계에 주목할만한 좌절을 의미하며 지속적인 ...

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
2024년 게임 개발의 AI 르네상스
AI Wiki 메타 버스 Wiki 교육 시장 소프트웨어 Technology
2024년 게임 개발의 AI 르네상스
2024 년 5 월 1 일
에스티로더의 새로운 AI 혁신 연구소 내부: 생성 AI가 뷰티 브랜드를 어떻게 변화시키고 있는지 자세히 살펴보기
생활 소프트웨어 이야기와 리뷰 Technology
에스티로더의 새로운 AI 혁신 연구소 내부: 생성 AI가 뷰티 브랜드를 어떻게 변화시키고 있는지 자세히 살펴보기
2024 년 5 월 1 일
Chainlink와 Rapid Addition, CCIP 기반 블록체인 어댑터 개발을 위해 협력
근무지에서 발생 뉴스 보도 Technology
Chainlink와 Rapid Addition, CCIP 기반 블록체인 어댑터 개발을 위해 협력
2024 년 5 월 1 일
BitSmiley, Alphanet V1 출시, 비트코인 ​​레이어 2 네트워크 Bitlayer 데뷔
뉴스 보도 Technology
BitSmiley, Alphanet V1 출시, 비트코인 ​​레이어 2 네트워크 Bitlayer 데뷔
2024 년 5 월 1 일
CRYPTOMERIA LABS PTE. LTD.