研究发现：人工智能模型在识别废话方面存在困难

茹杰 • 2025年05月22日 23:57 • 百科栏目 • 阅读 5

　　　　在巴黎，9月15日——周四发布的一项研究显示，支撑聊天机器人及其他应用的人工智能模型在区分无意义的内容与自然语言方面仍然面临挑战。...

　　 Study: AI models struggle to identify nonsense

　　在巴黎，9月15日——周四发布的一项研究显示，支撑聊天机器人及其他应用的人工智能模型在区分无意义的内容与自然语言方面仍然面临挑战。

　　来自美国哥伦比亚大学的研究团队指出，他们的研究揭示了当前人工智能模型的局限性，并警告在法律或医疗领域使用这些模型仍为时尚早。

　　研究人员对9种人工智能模型进行了测试，向它们提供了数百对句子，并询问哪些句子可能在日常交流中出现。

　　此外，他们还让100名参与者对几对句子进行相同的判断，例如：“一个买家也可以拥有正品/一个精通高中圆周的人我漫步。”

　　这项研究发表在《自然机器智能》期刊上，研究团队将人工智能的判断与人类的判断进行了比较，发现了显著的差异。

　　像GPT-2这样的复杂模型，作为病毒式聊天机器人ChatGPT的早期版本，通常能与人类的回答相匹配。

　　然而，其他一些较简单的模型表现则不尽如人意。

　　研究人员强调，所有模型都存在错误。

　　该报告的作者之一、心理学教授克里斯托弗·巴尔达萨诺（Christopher Baldassano）表示：“每个模型都显示出盲点，将一些人类参与者认为是无意义的句子标记为有意义的。”

　　他补充道：“这应该促使我们深思，人工智能系统在多大程度上能够做出重要决策，至少在目前是这样。”

　　论文的另一位作者塔尔·戈兰告诉法新社，这些模型是一项“令人兴奋的技术，可以极大地增强人类的生产力”。

　　然而，他认为，“让这些模型在法律、医学或学生评估等领域取代人类决策可能为时尚早”。

　　他说，潜在的陷阱之一是，人们可能会故意利用模型的盲点进行操控。

　　随着ChatGPT的发布，人工智能模型在去年突然进入公众视野。自那时起，ChatGPT通过了各种考试，并被誉为医生、律师及其他专业人士的潜在助手。(法新社)

本文来自作者[茹杰]投稿，不代表怀缘榴立场，如若转载，请注明出处：https://wak.hy6.cc/wiki/202505-462.html

5 4

本文作者

茹杰签约作者

0 文章

1 粉丝

我是怀缘榴的签约作者[茹杰],本篇文章《研究发现：人工智能模型在识别废话方面存在困难》主要讲述了:　　　　在巴黎，9月15日——周四发布的一项研究显示，支撑聊天机器人及其他应用的人工智能模型在区分无意义的内容与自然语言方面仍然面临挑战。...

综合

NOAA冬季预测：寒冷天气，北方暴风雨，南方干旱

美国国家海洋和大气管理局预报员预测，美国南部地区将迎来一个温和干燥的冬季，包括密西西比河下游和西南部已经遭受干旱的地区，而太平洋西北部和五大湖周围的天气将比正常情况更冷、更潮湿。这一预测主要是基于这样一种预期:LaNiña——一种全球气候模式，与或许更为人熟知的

林沫夕
2025年05月23日
0
知识分享

利用加密技术的平台进行美国总统选举投注

剧情简介交易公司Wintermutetrading通过在加密市场上买卖数字资产来提供流动性，该公司正在与加密风险管理公司ChaosLabs合作，下周将推出一个博彩市场，重点关注比赛的结果。Gaevoy表示:“这将取决于交易

曹洛熙
2025年05月23日
0
常识科普

《星球大战》迎来首位跨性别角色：观众热议反响

《星球大战》宇宙中的一个新角色在该系列的粉丝中引起了不小的轰动。第一个跨性别的冲锋队员，名叫妹妹，出现在新书《星球大战:克隆人部队的秘密》中。根据X账户星球大战全息仪，雷克斯上尉在书中对妹妹的描述是这样的:“当我们中的一个人表达了她与其他士兵不同的

林沫夕
2025年05月23日
0
科技世界

Jannik Sinner药检不合格的喷雾剂含有“兴奋剂”警告

　　在意大利，非处方兴奋剂喷剂的包装上有一个红色圆圈，圈内有一条斜线，并用大写字母标注“兴奋剂”。今年3月，世界排名第一的网球选手詹尼克·辛纳(JannikSinner)因使用这种喷剂而两次未能通过药物检测。辛纳上个月成功洗清了嫌疑，将在周五的美国公开赛半决

树甜来了
2025年05月23日
2
知识分享

加州大学以33分战胜洛杉矶分校，后者仅得7分

加州614013------33

半亦
2025年05月23日
1
生活经验

Barakat综合征的20个关键知识点

巴拉卡特综合征，也被称为HDR综合征，是一种罕见的遗传性疾病，会影响身体的多个系统。HDR代表甲状旁腺功能减退、耳聋和肾发育不良。这种情况是由GATA3基因突变引起的。由于甲状旁腺功能减退、听力丧失和肾脏异常，Barakat综合征患者经常经历低钙水平。症状可能差别很大，甚至在家庭

采双
2025年05月23日
1
综合

土耳其计划对德国人钟爱的döner烤肉串进行规范

柏林(美联社)——牛肉和鸡肉在被切成极薄的条状之前，在垂直的吐槽上慢慢旋转，闪闪发光。两个厨师从咝咝作响的煎锅滑到温暖的烤面包机上，练习舞蹈。成堆的新鲜西红柿、卷心菜和红洋葱在五彩缤纷的画面中熠熠生辉。在柏林时尚的Mitte社区，有态度的烤肉串(KebapWith

位开心
2025年05月23日
1
生活经验

善良的力量：通过这些感人慷慨故事重塑你对人性的信念

在混乱和痛苦似乎主宰着我们的世界中，我们很容易感到不知所措和无助，但是特蕾西·科恩的这篇文章揭示了善良的深远影响，展示了一些温暖人心的故事，讲述了慷慨和关怀的小行为如何给需要帮助的人带来快乐和安慰。世界的现状是残酷的。战争持续不断，抗议不断，人们在每一个转折点上都在

翠桃
2025年05月23日
2
知识分享

新加坡总理李显龙：政府计划采取措施，帮助老年工人购置组屋并提供额外支持

　　　　新加坡，8月8日——新加坡总理李显龙在一年一度的国庆致辞中表示，为了给中央公积金(CPF)储蓄不足的老年人提供“额外帮助”，并保持住房负担得起，新加坡政府将对公积金制度和建屋发展局(HDB)计划进行调整。　　他说，更多的变化细节将在国庆大会上公布。

冬云
2025年05月23日
2
作者专栏

加文·罗斯代尔通过精选专辑《Loaded》庆祝布什乐队歌曲30周年

纽约(美联社)——收集布什总统最伟大的作品相对容易。说服主唱加文·罗斯代尔(GavinRossdale)这么做有点困难。“我从来没有真正想做一个，因为我一直认为这有点像一个告别，像sayonara，一个绝唱，”主唱和词曲作者说。“我不能再逆流而上了。我非常喜欢音

白容
2025年05月23日
1

发表回复

本站作者后才能评论

评论列表（4条）

茹杰 2025年05月22日

我是怀缘榴的签约作者“茹杰”！

回复
茹杰 2025年05月22日

希望本篇文章《研究发现：人工智能模型在识别废话方面存在困难》能对你有所帮助！

回复
茹杰 2025年05月22日

本站[怀缘榴]内容主要涵盖：国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

回复
茹杰 2025年05月22日

本文概览：　　　　在巴黎，9月15日——周四发布的一项研究显示，支撑聊天机器人及其他应用的人工智能模型在区分无意义的内容与自然语言方面仍然面临挑战。...

回复

研究发现：人工智能模型在识别废话方面存在困难

本文作者

文章推荐

发表回复

评论列表（4条）

联系我们