OpenAI最新评估显示,GPT-40模型被评为‘中等’风险

   OpenAI发布了gpt - 40系统卡,这是一份详细的研究文件,概述了该模型在5月份公开发布之前进行的安全协议和风险评估。该文件阐明了OpenAI为减轻其最新多模式...

  

OpenAI发布了gpt - 40系统卡,这是一份详细的研究文件,概述了该模型在5月份公开发布之前进行的安全协议和风险评估。该文件阐明了OpenAI为减轻其最新多模式人工智能模型相关的潜在风险所做的努力。

在发布之前,OpenAI采用了一种标准做法,即利用外部红队(red teams),即负责识别系统漏洞的安全专家。这些专家探讨了与gpt - 40相关的潜在风险,例如未经授权的语音克隆、产生不适当的内容以及侵犯版权。

基于OpenAI的内部框架,研究人员将gpt - 40归类为“中等”风险水平。这一整体风险评估来自于四个关键类别的最高个人风险评级:网络安全、生物威胁、说服和模型自治。所有类别都被认为是低风险的,除了说服,其中某些gpt - 40生成的文本样本比人类书写的文本样本显示出更大的说服力潜力。

OpenAI发言人Lindsay McCallum r 米解释说:“这张系统卡包括由内部团队创建的准备评估,以及OpenAI网站上列出的模型评估和威胁研究(METR)和阿波罗研究(Apollo Research)等外部测试人员,这两家公司都为人工智能系统进行评估。”

该版本遵循了之前模型(如GPT-4, GPT-4 with vision和DALL-E 3)的类似系统卡出版物,展示了OpenAI在评估其人工智能系统时对透明度和外部协作的承诺。

这次发布的时机尤为重要,因为OpenAI面临着关于其安全实践的持续批评。内部员工和外部利益相关者都提出了担忧,包括参议员伊丽莎白·沃伦(Elizabeth Warren)和众议员洛里·特拉汉(Lori Trahan)最近的一封公开信,要求在OpenAI的安全审查过程中提高问责制和透明度。

像gpt - 40这样功能强大的多模式模型在美国总统大选临近之际发布,引发了人们对错误信息和恶意利用可能性的担忧。OpenAI的系统卡旨在通过强调该公司通过现实场景测试来减轻此类风险的积极努力来解决这些问题。

尽管OpenAI做出了努力,但要求提高透明度和外部监督的呼声仍然存在。重点超越了培训数据,涵盖了整个安全测试过程。在加州,监管大型语言模型的立法正在进行中,包括让公司对其人工智能系统造成的潜在危害负责。

本文来自作者[迎双]投稿,不代表怀缘榴立场,如若转载,请注明出处:https://wak.hy6.cc/zheh/202505-21.html

(1)

文章推荐

  • 利用冰块托盘自制冰棒的简单方法

      对于那些希望避免冗长且难以发音的配料表的购物者来说,超市的冰棒区可能并不友好。许多知名品牌的产品中含有高果糖玉米糖浆、人工香料和色素添加剂,更别提几乎没有真正的果汁了。不过,自己在家制作冰棒其实很简单,只需一些牙签和一个冰块托盘即可开始。网上有许多DIY冰棒的

    2025年05月22日
    0
  • 十大最具争议的《与星共舞》选手:肖恩·斯派塞与安娜·德尔维的故事

    《与星共舞》(DancingWithTheStars,简称DWTS)已经播出了32季,与其他任何电视竞赛类节目相比,它经历了更多的评委、主持人和有争议的角色。这部美国广播公司(ABC)的节目不怕惹毛,它邀请了一些最臭名昭著的名人出演被取消的演员、麻烦的运动员和丑闻缠身的政治人

    2025年05月22日
    0
  • 内塔尼亚胡与主要政治对手的争执使以色列战时内阁面临动荡

    据一名以色列官员说,以色列一名高级内阁部长周日前往华盛顿与美国官员举行会谈,此举引发了以色列总理内塔尼亚胡(BenjaminNetanyahu)的谴责。这一迹象表明,在与哈马斯(Hamas)开战近五个月后,以色列战时政府内部的裂痕正在扩大。本尼·甘茨(BennyG

    2025年05月22日
    0
  • 政府确定了对塔塔塔尔博特港工厂的5亿英镑救助方案

    据报道,在塔塔钢铁公司(TataSteel)关闭高炉后,政府正在努力敲定一项价值5亿英镑的塔伯特港(PortTalbot)工厂救援协议。一揽子支持计划是由前保守党政府起草的。该公司计划帮助塔塔公司建造电弧炉,以取代现有的燃煤工艺,以实现向更环保的生产

    2025年05月22日
    1
  • 政府必须终结虐待的恶性循环

      卡拉·麦基*著卡拉·麦基(KarahMackie)的故事揭示了代际虐待的现象;她今年24岁,来自NgāPuhiwhakapapa,是一名在国家看护中心经历过虐待的幸存者。7月24日,政府将发布皇家调查委员会的最终报告

    2025年05月22日
    1
  • 为何无效的减充血剂仍在市场上流通

    如果你在过去的20年里服用过非处方减充血药,你可能服用过以苯肾上腺素为主要活性成分的药物。你可能已经注意到,尽管服用了它,你仍然充血。美国食品和药物管理局的一个小组最近建议将其下架,因为它的效果并不比安慰剂好。但到底发生了什么,为什么还能买到?在上面的视频中,

    2025年05月22日
    0
  • 北爱尔兰虽早早领先,最终仍不敌西班牙队

      丹尼尔·巴拉德的进球让北爱尔兰一度看到了胜利的希望,但在马略卡岛,西班牙队在2024年欧洲杯的最后一场比赛中以5比1的比分取得胜利,这一结果让人清醒。比赛开始仅70秒,巴拉德便为迈克尔·奥尼尔的球队打入一球,然而10分钟后,佩德里的远射将比分扳平,西班牙队对

    2025年05月22日
    0
  • 前议员雷·霍姆伯格承认在欧洲与未成年人发生性关系。

      在周四,一位备受关注的前北达科他州议员在联邦法院认罪,因其前往欧洲意图与未成年人发生性行为。他曾是该州最有权势的议员之一。现年80岁的RayHolmberg来自大福克斯,于2023年10月被控,罪名包括意图从事非法性活动,以及接收和试图接收儿童性虐待材料

    2025年05月22日
    2
  • 信用卡奖励计划:真划算还是只是一场骗局?

    也许你打开邮箱,发现一堆不请自来的信用卡优惠。但你如何判断哪些值得,哪些不值得呢?以下是一些需要了解和考虑的事情:选对牌你希望得到什么好处?现金吗?点?英里?礼品卡?选一张你想要的卡片。我现在就有一家公司,它可以支付5%的杂货利息。我去年有

    2025年05月22日
    0
  • Days Gone工作室推出全新在线服务游戏

    关键的外卖BendStudio的下一个项目是一款即时服务游戏。索尼的子公司以前是co.确认他们正在开发一个新IP。游戏本身可能仍处于预制作阶段,这意味着它不会很快进入市场。根

    2025年05月22日
    1

发表回复

本站作者后才能评论

评论列表(4条)

  • 迎双
    迎双 2025年05月15日

    我是怀缘榴的签约作者“迎双”!

  • 迎双
    迎双 2025年05月15日

    希望本篇文章《OpenAI最新评估显示,GPT-40模型被评为‘中等’风险》能对你有所帮助!

  • 迎双
    迎双 2025年05月15日

    本站[怀缘榴]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 迎双
    迎双 2025年05月15日

    本文概览:   OpenAI发布了gpt - 40系统卡,这是一份详细的研究文件,概述了该模型在5月份公开发布之前进行的安全协议和风险评估。该文件阐明了OpenAI为减轻其最新多模式...

    联系我们

    邮件:怀缘榴@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们