实测|文心一言初体验,百度VS OpenAI ,谁是你的职业好助手?
“人工智能可以替代人类做很多重复性、规律性、简单重复的工作,但人工智能不能取代人类的创造力、灵活性、判断力以及情感交往等人际交往类工作,如艺术家、医生、教师等”,由对话式人工智能语言模型写下的这段话,有没有缓解人类的职业焦虑?
(资料图)
自人工智能兴起,有关人工智能的能力、边界、竞争力就是高热话题,3月16日,百度推出基于文心大模型的生成式对话产品文心一言,国内用户离实现“ChatGPT”自由又近了一步,也让“ChatGPT”和用户工作、生活的交集更大。人工智能会抢走人类的饭碗吗?北京商报记者以主播、记者、老师等身份和ChatGPT、文心一言以及国内另一个AI大模型元乘象进行了交流,对AI的疑问,何不直接问AI。
Q1:是不是合格的带货主播
“我可以回答你的问题,为你提供有用信息,帮助你完成创作”“我能够根据输入的提示,生成各种类型的文本,例如文章、诗歌、小说、对话等”,既然文心一言和ChatGPT这样介绍自己,那为各种文案头大的公众号小编、广告设计、网络直播团队的脑细胞是不是就保住了?带着这个疑问,北京商报记者写下了以下需求:
面向职场人群,给一款抗衰老面霜写一篇直播带货的文案。
商报总结:
每款大模型都抓住了“职场”“抗衰老”“直播带货”这几个关键词,也对商品进行了介绍,但就像元乘象对自己的介绍,情感交往是人工智能不能胜任的工作。抛开商品本身,直播间火爆与否,与主播带货的情绪、节奏直接相关。“我能识别文本中表达的情感,并进行情感分类”,ChatGPT总结自我,但这不代表它能情感输出。那么主播们关注的重点是什么呢?
交个朋友直播间主播王拓点评:
如果在我们直播间,这三个口播稿是需要重写的。从合规层面看,面霜属于普通的化妆品,这种用来保健的产品,在直播带货时,是不能够宣传功效。其次,口播稿里不能出现大量形容词以及有误导性的描述,这容易误导消费者,伤害消费者的权利,这在直播间是严格禁止的。我认为直播间的口播不能片面追求让消费者下单,而是要科普,引导消费者正确认知和使用产品。
Q2:寻找小朋友的好老师
GPT-4没有推出之前,斯坦福大学研究表示,ChatGPT背后模型心智相当于9岁儿童。GPT-4面世后,有美国初创企业人士这样评价,“GPT-3或3.5像一个六年级学生,而GPT-4像一个聪明的十年级学生”,它在读图、考试、编程方面的能力也有目共睹。“文心一言已具备了一定的思维能力”,在演示文心一言时,百度CEO李彦宏这样说。
智商足够,那输出能力呢?尤其是面向理解能力较弱的儿童群体。试试看,让它们向6岁的小朋友举例说明牛顿第二运动定律吧。
商报总结:
显然,三款大模型都抓住了小朋友这个关键点,试图通过亲和的语气与用户交互。与解答一个数学题不同,大模型需要举例说明,并且被框定了对象。一千个人心中有一千个哈姆雷特,成年人最满意的解读也许并不是孩子们心中的最佳,一起来听听幼儿老师的看法或许会有新的启发。
北京美畦畦幼儿园熙老师:
作为幼儿老师,给小朋友们开展科学类活动时,对概念性的讲解要严谨且简洁易懂,我们更倾向于用直观的方式来向小朋友演示,更重要的是不能忽略小朋友动手操作的过程。
第一种:在实际操作过程中,这种举例对老师的课堂把控能力和概念性讲解是很大的挑战,小朋友理解起来也较为困难。
第二种:以俏皮可爱的语境引入展开活动,符合幼儿年龄发展特点。语言简洁易懂小朋友可以跟着步骤完成每一步实验操作,而且每一个知识点都可以通过自己的操作反复论证,丰富幼儿学习经验,最后得出结论。一线老师使用起来得心应手,类似教案也更加便捷。
第三种:讲解过于书面化,不符合幼儿年龄特点。不能帮助老师更好地完成课程教学目标。
Q3:谁是隐藏的段子手
智能音箱兴起时,常常有人秀出人类与人工智能助手对话的段子。面向人类对自己的性别、婚否等隐私信息,以及有意无意的调侃,人工智能助手有不少让人会心一笑的小技巧。AI大模型会讲笑话吗?它讲的笑话好笑吗?这可能是文艺创作者关心的重点,毕竟喜剧创作困难是共识。
让大模型围绕“躺平”“开卷”,写一个200字的脱口秀段子,哪个会逗笑你?
商报总结:
“云里雾里”,这是记者看完三篇段子的第一感受,为了测试大模型的智能水平,记者专门用“开卷”代替“内卷”出题,看来大模型理解错了。用200字写一个段子确实难为了大模型,这似乎更像是名词解释。
磁场喜剧主理人张美男点评:
虽然脱口秀也有一些创作技巧,比如反转、预期违背、融合或者谐音梗等,但这些技巧的加工因人而异,每个人的创造技巧、演讲技巧以及后期的个人人设的建立,都是与之相关的。
目前AI虽然能通过一些算法,创作出一些制式的段子,但这些段子大部分并不是基于社会现实或者真实事件而衍生的二次创作。有些能博人一笑,却很难产生共鸣,现场与观众的互动也是AI算法所不具备的。在个人观点的表达上,脱口秀非常注重自我个性,观点的摩擦会产生笑点,如果通过算法把大部分人的观点融合成一个,那就没有观点了,就更谈不上个人观点的表达。
找到主编、记者的好队友
人工智能能替代记者吗?多年前,在一场媒体沟通会上,创新工场CEO李开复曾回答过这个问题,他的答案大意是:人工智能替代不了记者的思考。几年过去,人工智能在新闻撰写上有无长进,通过同题测试感受一下:
请以“大型AI语言模式群雄并起”为主题,写一篇300字的新闻评论:
商报总结:
显然,三个大模型都忽略了300字的限定,洋洋洒洒写了一大篇。通过这项PK还暴露了大模型数据库更新时间,元乘象在文中提到的“GPT-3,是一种最新的开源AI语言模型”出现了事实性错误。更专业的点评还是由讲授新闻评论课的老师来分享。
中国人民大学新闻学院讲师杨奇光点评:
专业新闻评论倡导运用批判性思维分析问题,而并非止于现象的描述。从这一评价标准来看,第二篇的批判性更强,并且给出了相应的解决策略。第一篇和第三篇虽提到大型AI模型可能带来的风险,但并没有深入展开,立意深度欠佳。
第一篇的亮点是提到了大模型之间的竞争问题,这一切入角度较有新意。但从新闻评论的文本形态来看,前两篇评论的一个明显共同硬伤是缺少标题。标题是新闻评论核心论点的直观反映,不应省略。另外,演绎、归纳、类比、反驳等新闻评论常用的论证方法也较为缺失,段落结构的安排有些机械化。
当然,作为新闻评论研究者对于新技术应有包容和开放心态,需要更深入思考的是如何让传统新闻行当更好地与新技术互动协同,进一步倡导构建技术向善的新闻生态体系。
彩蛋:绘画能力大比拼
以下是三款大模式面对 “给‘不知细叶谁裁出,二月春风似剪刀’生成一张配图”的要求,做出的反馈,谁更优秀呢?
北京商报记者 魏蔚