020-8888888
网站首页 关于BG视讯网 产品中心 新闻动态 成功案例 荣誉资质 联系我们
咨询热线
020-8888888
地址:上海市徐汇区淮海中路1469号
邮箱:

新闻动态

当前位置: 首页 > 新闻动态

AI进入普通人生活的深度互动:AI世代系列深度报道前奏

发布时间:2025-04-02 05:24:43 点击量:

Pengpai新闻记者Chen Canjie实习生Nong Lanchun Ouyang Sifan

编辑彭韦

【编辑笔记】

AI即将到来,它首次与人类进行了大规模的真实接触。人们对技术的快速迭代,期待未来以及恐惧可能的威胁感到惊讶。

目前,我们更关心的是,当AI进入普通百姓的生活时,会引起什么样的兴奋,人们与AI进行深入互动,直到他们参与其中。

日常家庭用水一个月多少吨_日常家庭套餐_tara家庭日常

当与AI互动时,人类也会看到自己。我们将启动一系列有关“ AI一代”的深入报告,以讲述AI时代的人们的故事。

设计白浪

当我仍然对DeepSeek有点熟悉时,我的同事Yijun已经在使用它来找到新闻主题。它可以总结热门话题,计划访谈周期和预算,甚至告诉她AI法官已被用来协助宣判。她搜索了一个参考链接,要求她在法庭上工作的朋友确认至少目前,人们遭受的惩罚无法由AI法官决定。

她试图用DeepSeek替换搜索引擎,但她发现反复验证来源的虚拟和真正的兴奋剂感到困惑:“这可以节省时间或增加信息负担?”

日常家庭用水一个月多少吨_tara家庭日常_日常家庭套餐

DeepSeek的面试计划者提供的照片

但是,AI“幻觉”,即那些细致的答案背后的漏洞,并没有减少她对DeepSeek的依赖。从修理热水器到如何在3个月内损失10公斤,“问DeepSeek”。她说,如果她在研究生院里使用此单击来提取论文的要点,那么她也许可以实现睡眠自由,但是,“这会让我失去处理信息的能力吗?”

无论如何,诸如DeepSeek和Chat-GPT等生成的AI正在渗透到日常生活中。随着技术的迭代,AI幻觉和“阅读随机答复”变得更加难以检测。 Openai首席执行官Sam Altman在2023年4月表示,他“特别担心该模型将用于大规模的虚假信息”。

因此,如果操纵AI的欺骗,商业和其他目的的答案是可行的吗? Fudan University计算机科学技术学院的教授Zhang Qi毫不犹豫地告诉我,该方法比想象的要简单得多,并且同样隐藏了。

“它倾向于服从用户”

幻觉是不可避免的,非诉讼律师张朱宾仍然将DeepSeek视为“第二大脑”。他从事跨境合规业务,并帮助公司出国,让DeepSeek首先使用大脑,例如比较不同海外城市的政策股息和生产标准。过去,至少需要半天的时间来列出美国OSHA标准(职业安全和健康标准)。现在只需半小时,“结果的80%-90%相对准确。”

此外,可以将可以移交给DeepSeek的行业白皮书的案例搜索,记录起草和研究。当他在2023年进入该行业时,如果他想使用AI援助,他只能安静地使用它,否则老板会认为这是不可靠的。 “在DeepSeek出现之后,如果您使用AI工作,老板会认为您非常聪明。”但是,对法律的引用和案件的核心仍然依靠他的底线来验证它。

在过去的两年中,法院在美国至少有七起案件中的律师被法院在法律文件中产生的虚假信息警告或惩罚。根据英国广播公司(英国广播公司)的先前报告,六个引用的案件涉及纽约律师史蒂芬·施瓦茨(Steven Schwartz)提起的民事诉讼中的虚构和虚假判决。他认为,这是他职业生涯三十多年来第一次使用CHAT-GPT:“不知道其内容可能是错误的。”

张朱宾说,到目前为止,DeepSeek的“幻觉”的原因主要集中在两个方面。一个是案例搜索,无法直接获得一些数据,因此必须手动倒带才能检查“北京大学魔术武器”和其他专业工具;另一个是对法律的解释,例如“阴和杨合约”和“抽屉协议”,这些协议很难清楚地分析。

Zhang Qi解释说,语言没有明确的推导和标准答案,例如数学,词汇的“特异性”也会影响AI幻觉。 “行业诽谤” AI很难准确识别。此外,AI更难记住华为总统和联想总统的前者,因为“联想”不是一个专有的名词。

面对幻觉,张·朱宾(Zhang Junbin)会喂更多的材料或调整迅速的词来询问DeepSeek,有时他确实正确地回答了,因此他推测它可以“修复错误”。

实际上,DeepSeek不了解“正确”和“错误”。 Fudan University计算机科学技术学院的教授Zhang Qi解释说,生成AI的答案只是一个“概率”问题,也就是说,在再次询问时,它可能会犯错,并且倾向于服从用户。即使您正确回答,也可以“误导”它来犯错。

AI具有幻觉的原因,即在学术界通常定义的“事实错误”,主要是由于该模型无法记住培训数据中的所有信息。尤其是在互联网上出现的专业知识和不受欢迎的知识的情况下,该模型容易出现错误。

日常家庭套餐_日常家庭用水一个月多少吨_tara家庭日常

Zhang Qi补充说,DeepSeek的在线搜索在一定程度上减少了幻觉。在同步抓取相关的网页信息之后,它已经从依赖自己的内存的“封闭纸质考试”变成了“开放式纸质考试”。在回答不受欢迎的问题时,例如“中国的第九河”,准确率也会增加很多。

为了减少AI幻觉,他说:“为了从数据和算法中找到解决方案,需要更多的高质量和多样化的数据以及更好的培训方法。”

民族学专业的Wei Yue说:“我不会向AI询问数据,我正在向数据提供数据。”在研究的第三年中,她对自己的论文感到焦虑,不得不考虑博士的重新检查。她希望Chat-GPT可以帮助她挤一些时间。在反复纠正它之后,她的问题很快被激怒并质疑:“文学评论都是错误的,但根本没有这样的文件。”

既然她已晋升为bo er,她将从官方渠道收集原始数据,以准确喂食CHAT-GPT和DeepSeek Limited学习材料,并亲自从官方渠道中收集原始数据。桌子令人眼花azz乱,将其扔给他们以完善它,然后跑进去并澄清单词和要点的数量。 “这种基本和乏味的工作可以完全取代AI。”但是她无法完全信任AI,最终仍然会审查它。

“我们的老师比我们更信任AI。”她的导师渴望分享如何驯服DeepSeek,该教程包括视频,公共帐户上的推文和PDF手册。以前,灯笼节上的导师想邀请她去吃晚饭,但是在她回到学校之前,她问了DeepSeek如何拒绝:“有时人们会感到愚蠢,并想用AI来改善我的情绪智力。”

当然,AI改变了她与导师的学术互动。有时,导师突然在晚上发送了一个研究项目。她不想熬夜,向AI提出问题,然后从答案中学习并与导师讨论。在谈论特定的研究方向和计划时,导师还将打开他的电话,说:“然后让我们询问AI。”

啊哈的时刻

我还要求DeepSeek根据“ Pengpai角色”列的样式找到该主题。其中一个引起了我的兴趣 - “候鸟老人”的跨境老年护理实验:中国越南边界上银头发的制度徘徊。它说,在中国越南边境的广西城市的一个城市中,一些老年人白天使用医疗保险购买医学,然后去越南晚上住在廉价的养老院里。甚至有人提到,退休的老师周穆莫(Zhou Moumou)开始了治疗肺癌的“徘徊”途径。

但是请注意,这个话题纯粹是一本小说。在检查了参考链接后,我发现它混合了诸如北部的老人,以冬季迁移南部,在广西的某个城市调整医疗保险以及中国越南边境贸易,并编制了一个肉类的故事。

当我指出它的错误时,它回答说,将来,假设内容将被明确标记,例如“根据现象,可能存在……”,以避免混淆事实和逻辑上的扣除;并优化信息集成过程并采用三个步骤的“事实证据推论”方法。

那么,DeepSeek在回答他的回答中表明事实和虚构是可行的吗?

“黑匣子尚未打开,因此从理论上讲尚不清楚。” Zhang Qi将DeepSeek的“读取和随机答复”定义为模型推理中的逻辑错误,因为大型模型本身是一个巨大的“黑匣子”。没有人可以解释为什么出现某个单词,并且不能准确预测。

因此,模型的推理也会引起幻觉。 AI公司Vectara专注于人工智能领域的高精度任务。根据IT发布的大规模模型幻觉的排名,截至今年3月,“推理” DeepSeek R1幻觉率为14.3%,而DeepSeek-V2.5和DeepSeek-V3幻觉率分别为2.4%和3.9%,对传统模型有偏见。

张Qi说,很难考虑AI的现实和不同的思维。 “推理是希望它分歧,一旦它分歧,它可能会带来很多错误。”互联网连接可以改善理论上的幻想,但是“许多问题来自网页”,该网页返回到旧的数据质量问题 - “垃圾进来,垃圾出现”。

在国外揭示了类似的案件。根据英国“监护人”的先前报告,新西兰超市连锁店Pak'nsave开发了一种AI来开发食谱。客户输入更广泛的家庭购物清单后,它建议含有漂白剂,“甲醇”吐司和冰饮料的“新鲜色调”鸡尾酒。显然,AI忽略了这些菜单对碳基生物致命。

这也是我关于生成AI的另一个问题:在给出答案然后重新推导之前,它可以在逻辑链中发现漏洞吗?

在官方的DeepSeek论文中,当研究人员训练DeepSeek-R1-Zero做数学方程式时,突然说:“等等,等等。

日常家庭套餐_tara家庭日常_日常家庭用水一个月多少吨

DeepSeek的“ AHA时刻”

在社交平台上,有许多网民赞扬这个“ aha时刻”,并相信AI反映了自己的错误,并像人类一样重新思考。

“在原始推理的过程中,在正常情况下,它不应具有反射逻辑。” Zhang Qi说,这必须返回到模型预训练和数据以找到原因。他认为DeepSeek具有反思能力,其逻辑仍然是数据驱动的“概率”。

之前测试DeepSeek时,他一口气进入80 1,并添加它们,中间夹有11个。结果,它没有计算550秒。 “这种问题并不困难,但是(研究人员)通常不会(特别)构建培训数据。”他还举了一个例子,谁是最大的9.9或9.11?草莓一词有几个“ r”,这种问题有时会使人工智能陷入困境。

因此,他认为,要专注于特定的应用程序方案以减少幻觉比允许AI具有一般反射功能更容易。但这也是非常“赚钱的”。此前,他和他的团队为一家公司制作了一个模型,该公司巧妙地认识了图表以提取日程安排和票务信息,这使数百万元人民币赚了数百万美元。 “如果您想使用户体验达到95分,则需要定制的培训。”

为了开发用于临床研究和科学研究的医学AI,开发人员Tang Min及其同事专门建立了数据库。她解释说,医学强调“基于证据”,因此不能“拆分”各种网页。她问chatgpt哪种药物是“淡淡的”。将其连接到互联网后,它将抗精神病药分析为胃肠道药物,“其搜索内容的质量相对较低”。

日常家庭套餐_日常家庭用水一个月多少吨_tara家庭日常

此外,他们不断调整模型体系结构以使AI的答案更接近参考,并且在验证后仍存在的错误直接阻止,“只是不会输出向用户输出。”她说,幻觉有了显着改善,但实际上,研发人员事先“消化”了它们。

尽管该申请已经过培训以避免依靠专业及时的言语,但唐·敏的主要建议是医务人员使用人工智能,“他们有判断的能力,我们提高的是他们的效率,而不是为他们做出决定。”

“技术之间存在对抗”

“ DeepSeek无法实现人类的灵活性。”在中级人民法院担任法官助理的陈·森(Chen Siwen)说,很难“理解”现实的因素。

去年9月,陈·西文(Chen Siwen)在该法院被录取后,他对AI的依赖加深了。起初这是一个商业问题。她担心如果问得太多,这会造成烦恼,但是AI不会。它总是在线和耐心。在新手期之后,她每天必须至少处理一个或两个案件,而且此案要复杂得多,因此她要求DeepSeek整理基本案例信息和法律参考。从效果的角度来看,她感到“缺陷不会掩盖优点”。

她说:“最重要的技能是尽可能简化问题。”例如,案例搜索,案件不断变化,但是其中包含的法律关系相对稳定。只有提取关键字并逐步询问他们,您才能得到所需的答案,但是要准确捕获关键字,案例体验是必不可少的。

这也是吴勒(Wu Le)担心的非诉讼律师。她从事该行业已有8年了,并从成千上万的类似文件开始了她的职业生涯。她周围的许多新移民都跳过了这一步骤,问了DeepSeek的问题。但是她认为,在早期阶段,“提出问题”不能与无聊的,但必要的积累分开,“这是链接在一起的。如果您没有足够的知识储备,那么在询问AI时就无法得到一个很好的答案。”

不管发问者的水平如何,很明显,越来越多的人开始将AI用作搜索引擎。

DeepSeek不仅是Wei Yue的论文助手。当她考虑毕业后回到南宁的家乡时,它可以分析哪种电车的电池寿命可以满足她的通勤需求;它还具有Nanning的未来住房价格趋势,甚至将其完善到不同城市地区的新和二手房屋。我的同事Yijun会要求它根据冰箱中的其余成分制作食谱。对于Zhang Qi的70岁父母,它将提出更多的医疗保健计划。

是的,DeepSeek的答案正在渗入我们的日常工作,但是它的答案是否可以被操纵?

Zhang Qi表示,它依赖于在线搜索,因此只要它可以影响搜索结果,就可以更改答案。 “这取决于商业化的逻辑。”就像持有流量门户网站的主要搜索和社交平台一样,它决定了用户可以看到的内容以及与流量密切相关的DeepSeek答案。但是它说的是更人性化和专业,它至少不会像某些平台一样在角落标记一个小的“广告”。

根据福克斯新闻(Fox News)的先前报告,2023年4月,在其前新闻主持人塔克·卡尔森(Tucker Carlson)得知埃隆·马斯克(Elon Musk)会发展真相之后,他说,AI很可能很可能改变以前的信息获取渠道并因此影响民主选举。 “它以一种非常不诚实的方式控制了我们对现实的理解……它可以用于政治目的并对我们撒谎。”

当时,埃隆·马斯克(Elon Musk)回答说,与选举相比,人工智能对人类文明的威胁可能更大。他“鼓励对人工智能的规范”。

全球事实验证平台“ Pengpai Mingcha”的同事Zheng Shujing告诉我,尽管AI正在降低使用成本,但它使虚假信息“更快,更快,更强大”,这为手动验证带来了前所未有的挑战。

幸运的是,她还将“技术对策”。 《时代》杂志的封面照片在互联网上流传,联合国秘书长古特雷斯站在血池里。通过反向搜索,她发现原始图片表明,古特雷斯站在膝盖长的水中,呼吁注意全球变暖。此外,还有一些平台可以明确识别图像是否已被PSED或视频包含AI生成的内容。

日常家庭用水一个月多少吨_tara家庭日常_日常家庭套餐

左侧是假P图片,右图是原始图片。 《时代》杂志使用古特雷斯站在水中的照片作为封面

“技术之间存在一种对抗。” AI仅上传照片,就可以在图片中为她迅速推测图片的地理位置。她说,AI伪造能力越强,越虚假的识别技术将被更新,“因此我通常是技术乐观主义者。”

张齐说,目前,国内大型模型制造商仍在专注于追赶性能,对安全道德部分的审查相对较弱。但是,Internet充满了大量的AI生成的错误信息,并且在被AI网络爬行后,信息生态系统将进一步污染。这种隐藏的危险“将来可能会被大量放大。”

为了提高为大语言模型编写教科书的效率,Zhang Qi习惯于破译材料,标记论点,然后将其交给AI进行连接。有时它被抛光过于文学,因此他必须手动“反向优化”并删除一些精致的单词。

总体而言,AI至少节省了他的写作时间的一半,但“中国写作能力的恶化也被同步了,”他说。

(在文章中,Yijun,Zhang Junbin,Wei Yue,Tang Min,Chen Siwen和Wu Le是假名)

Zhou Yuhua,此问题的高级编辑

Copyright © 2002-2025 BG视讯网 版权所有 Powered by EyouCms  网站备案号:冀ICP备07016787号    网站地图