GPT-4 可以处理您对图像、文档、图表和屏幕截图的请求
简单来说
GPT-4 可以处理图像、文档、图表和屏幕截图的请求。 这是一个改进 GPT-3,它只处理文本。
GPT-4 在各种考试和测试中具有出色的表现,并且可以通过图像访问可能无法以书面形式获得的附加信息和详细信息。
OpenAI最新里程碑,新车型 GPT-4,可以接受包含图像、带有文本的文档、图表或屏幕截图作为输入的请求。 这比之前的版本有了显着的改进, GPT-3,它只能理解并输出文本。 有了这个新功能, GPT-4 给定由散布的文本和图像组成的输入,生成文本输出。
“在一系列领域——包括带有文本和照片、图表或屏幕截图的文档——GPT-4 表现出与纯文本输入类似的功能,”
OpenAI 中写道。
ChatGPT-4 其尺寸比其前身更大,这表明它接受了更大量的数据训练,并且模型文件中包含更多的权重,从而导致其运行成本更高。 最新的人工智能语言可以通过使用生成类似人类的文本 深入学习 并在大型数据集上进行预训练。
GPT-4 具有 表现出优于其他人工智能语言的性能 在各种考试和测试中,部分原因是它能够通过可能无法以书面形式提供的图像访问其他信息和详细信息。
新的 GPT-4 模型可以告诉你插图中到底描绘了什么,分析它,甚至解释它的含义。 在演示中, GPT-4 解释了 VGA 线连接到 iPhone 的视觉笑话。 它还可以解释展示“极端熨烫”的图片中的异常情况,您可以在下面查看。
然而,还有更有用的含义 GPT-4的新发现的知识。 演示中表明,PGT-4 可以根据图中所示的成分判断出可以烹饪什么。 这意味着如果您有食品但不知道如何处理它们,该模型可以帮助您烹饪。 给你的食物拍一张快照,然后聊天-GPT 可以告诉您可以用家里的原料做什么。
这种理解和解释视觉信息的能力使得 GPT-4 一个强大的工具,用于执行图像字幕、视觉问答、甚至内容创建等任务。 通过文字和视觉理解的结合, GPT-4 有潜力彻底改变广告、设计和电子商务等各个行业,并帮助人们完成枯燥、平凡的任务。
先进的 语言模型 还可以“理解”带有文本、表格、图表或其他视觉表示形式的屏幕截图和文档。 例如,如果您上传一篇三页的研究论文并需要对其进行总结和解释, GPT-4 是有能力这样做的。
Bloomberg 的主播 Jon Erlichman 展示了他如何将手绘设计转变为功能性网站。
这项新技术还可以用作助行器,因为它可以用来为视障人士描述环境。 为此,Open AI 已经与一个名为 是我的眼睛 它的目的是在盲人需要看东西时(例如在杂货店购物时)向他们伸出援助之手。 该应用程序让“有视力的志愿者和专业人士用他们的眼睛来解决大大小小的任务,以帮助盲人和弱视人士过上更独立的生活。” 现在,它还提供了一个虚拟志愿者工具,由 OpenAI“ GPT-4.
尽管 OpenAI“ GPT-4 目前提供了处理文本和图像作为输入的能力,但该模型尚未具备处理音频和视频输入的能力。 尽管如此,有迹象表明这些模式可能会包含在该技术的下一次迭代中。
了解更多:
- 采用的前 7 家公司 GPT-4
- GPT-4基于 ChatGPT 性能优于 GPT-3 570 倍
- 微软确认 Bing 可在 Advanced 上运行 GPT-4 型号
- GPT-4 与 GPT-3:新车型有什么特点?
免责声明
在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。
关于作者
Agne 是一名记者,负责报道虚拟宇宙、人工智能和人工智能领域的最新趋势和发展。 Web3 行业为 Metaverse Post。 她对讲故事的热情促使她对这些领域的专家进行了大量采访,总是试图发现令人兴奋和引人入胜的故事。 Agne 拥有文学学士学位,在旅行、艺术和文化等广泛主题的写作方面拥有丰富的背景。 她还志愿担任动物权利组织的编辑,帮助提高人们对动物福利问题的认识。 联系她 [电子邮件保护].
更多文章Agne 是一名记者,负责报道虚拟宇宙、人工智能和人工智能领域的最新趋势和发展。 Web3 行业为 Metaverse Post。 她对讲故事的热情促使她对这些领域的专家进行了大量采访,总是试图发现令人兴奋和引人入胜的故事。 Agne 拥有文学学士学位,在旅行、艺术和文化等广泛主题的写作方面拥有丰富的背景。 她还志愿担任动物权利组织的编辑,帮助提高人们对动物福利问题的认识。 联系她 [电子邮件保护].