ChatGPT热度还未散去,ChatGPT开发商OpenAI发布了更强大的GPT-4,堪称“王炸”产品。
当地时间3月14日,OpenAI公开发布大型多模态模型GPT-4,与ChatGPT所用的模型相比,GPT-4不仅能够处理图像内容,且回复的准确性有所提高。目前GPT-4没有免费版本,仅向ChatGPT Plus的付费订阅用户及企业和开发者开放。
(相关资料图)
来源:OpenAI官网
“这是OpenAI努力扩展深度学习的最新里程碑。”OpenAI介绍,GPT-4在专业和学术方面表现出近似于人类的水平。例如,它在模拟律师考试中的得分能够排进前10%左右,相比之下,GPT-3.5的得分只能排在倒数10%左右。
与此前的GPT系列模型相比,GPT-4最大的突破之一是在文本之外还能够处理图像内容。OpenAI表示,用户同时输入文本和图像的情况下,它能够生成自然语言和代码等文本。
目前图像处理功能还未公开,不过该公司在官网上展示了一系列案例。例如,输入如下图片并询问“这张图片有什么不寻常之处”,GPT-4可作出回答“这张照片的不同寻常之处在于,一名男子正在行驶中的出租车车顶上,使用熨衣板熨烫衣服。”
来源:OpenAI官网
在官方演示中,GPT-4几乎就只花了1-2秒的时间,识别了手绘网站图片,并根据要求实时生成了网页代码制作出了几乎与手绘版一样的网站。
除了普通图片,GPT-4还能处理更复杂的图像信息,包括表格、考试题目截图、论文截图、漫画等,例如根据专业论文直接给出论文摘要和要点。
GPT-4可对论文进行解读,来源:OpenAI官网
与此前的模型相比,GPT-4的准确性有所提高。OpenAI称,该公司花费6个月的时间,利用对抗性测试程序和ChatGPT的经验教训迭代调整GPT-4,从而在真实性、可操纵性和拒绝超出设定范围方面取得了有史以来最好的结果,“至少对我们而言,GPT-4训练运行前所未有地稳定,成为首个能够提前准确预测其训练性能的大型模型。”
OpenAI称,在公司内部的对抗性真实性评估中,GPT-4的得分比最新的GPT-3.5高40%,相应的“不允许内容请求的倾向”降低了 82%,根据政策响应敏感请求(如医疗建议和自我伤害)的频率提高了29%。
不仅是英语,该模型在多种语言方面均表现出优越性。OpenAI称,在测试的26种语言中,GPT-4在24种语言方面的表现均优于GPT-3.5等其他大语言模型的英语语言性能。其中GPT-4的中文能够达到80.1%的准确性,而GPT-3.5的英文准确性仅为70.1%,GPT-4英文准确性提高到了85.5%。
来源:OpenAI官网
不过, 与早期的GPT模型一样,GPT-4仍然存在一定的局限性。
OpenAI称,它并不完全可靠,可能会出现推理错误 ,“GPT-4缺乏对绝大多数数据切断后(2021年9月)发生的事件的了解,并且无法从中吸取经验教训……它有时会出现简单的推理错误,它会轻信用户明显的虚假陈述,有时它会像人类一样在难题上失败,例如在它生成的代码中引入安全漏洞。”
基于此,OpenAI提醒,用户在使用语言模型时应格外小心,最好辅助以人工审查、附加上下文、或完全避免在高风险情况下使用它。
值得注意的是,GPT-4虽然于14日才正式公开,但早在一个月前,微软的新版搜索引擎必应(Bing)就已经在GPT-4 上运行。微软表示,“如果您在过去五周内的任何时间使用过新版必应,那么您已经体验过GPT-4的早期版本。”
与免费的ChatGPT不同,GPT-4目前仅向ChatGPT Plus的付费用户开放,它也将作为API(应用程序编程接口)提供给企业及开发者,开发者需进入等候名单上,将该模型集成到他们的应用程序中。
OpenAI表示,已经有多家公司将GPT-4搭载到他们的产品中,包括语言学习工具软件多邻国(Duolingo)、移动支付公司Stripe和可汗学院(Khan Academy)。
更强更可靠!OpenAI公布GPT-4:可在考试中超过90%的人类
GPT-4来了!支持以图生文 OpenAI付款系统被挤爆 首批用户连夜写测评
ChatGPT进化到GPT-4!一文解读OpenAI模型的应用场景和商业模式
未来已来?GPT-4刚上线就引发马斯克恐慌 一文梳理其与3.5版本区别
ChatGPT成“西南偏南”热议话题 OpenAI联合创始人:未来AI更像一个全天候助手 将首先替代基于认知的工作
李雅庄矿:行为治理显成效 “5月份,李雅庄矿同比去年‘三
襄阳北编组站大桥为双独塔双索面混合梁斜拉桥,主桥长920米,宽37 5米
科笛将香港IPO股票发行价定在每股21 85港元,将净筹资3 927亿港元:科
售经理英文简写,销售经理英文翻译这个问题很多朋友还不知道,来为大家
来为大家解答以上问题,鬼吹灯之牧野诡事豆瓣评分多少,鬼吹灯之牧野诡
新型电力系统建设面临着保供压力突出、调节能力短缺、“双高”特性凸显
金融在科技创新和相关产业化过程中,如何发挥好纽带和催化作用?6月8日
相信大家对新款朗逸怎么设置锁车喇叭,朗逸怎么设置锁车喇叭?的问题都
养老金2023年调整方案已经在5月22日正式出炉了,今年养老金确定上涨3 8
6月1日晚间,利通电子(603629)发布公告,公司拟与上海世纪珑腾数据科技
太平人寿睿选稳赢两全险2023版好不好?太平睿选稳赢两全保险属于人寿保
由一汽奔腾NAT主办的“节能出行E动奔腾”2023年节能挑战赛青岛站在5月3
1、社会心理学因素近来研究发现,不良的生活环境或不恰当的教育方式可
1、蜂蜜可以放冰箱。2、蜂蜜可以常温保存,也可以冷藏,一般温度低于零
据重庆日报,6月8日上午,重庆市人民政府与中国移动通信集团有限公司签
看自己的实际情况选择。如果您想尽早享受年金收益,可以考虑将领取年龄
南昌新闻网讯日前,记者来到位于城南大道以西、南昌大道以北的京川村邓
在此基础上邀请相关专业人员参与论证预算构成,同时综合参考其他省份有
“希望通过宋锦记海洋科技食品加工园项目,让‘宋锦记’这个平潭老字号
金桥信息06月07日主力资金净流出8974 78万元,涨跌幅为10 01%,主力净
1、分脚大致两种用法,一是双劈掌,当然也可以单手劈。2、二是,在推手
近日,北京市医疗机构报告两例猴痘病毒感染病例,其中一例为境外输入病
隐形冠军是一个定义企业的流行词,源于德国赫尔曼·西蒙(HermannSimon)
中国经济网北京6月7日讯两市持续震荡分化走势,沪指小幅收涨,创业板指
1、中国重庆武隆国际山地户外运动公开赛(以下简称公开赛)是由国家体
X 关闭
X 关闭