“孤陈的城市在长夜中埋葬/他们记忆着最美丽的皇后/飘零在西落的太阳下/要先做一场梦……”这是微软“小冰”在2017年5月出版的诗集《阳光失了玻璃窗》中的句子。据说,为了达成写诗技能,“小冰”“学习”了上世纪20年代以来519位诗人的现代诗,被训练超过10000次。人类如果要把这些诗读10000遍,则大约需要100年。
该诗集总策划表示,作为刚出道的诗人,“小冰”或许还有不足。诗集原版呈现了“小冰”所有的创作文字,没有润色改动。诗句中的错别字也有意保留,同时边上用括号标注。另外,部分诗歌可能读起来会感到有重复,“我们要让人工智能100%的原生态地呈现在大家面前。”
AI迟早会介入到内容生产领域中,首当其冲的,并不是文学创作如写诗,而是全天24小时生产各种资讯的媒体。从一些浅、快、短、格式化、需要与大量数据比对的资讯入手,AI正在替代编辑的工作。
我们检索了几类服务于不同媒体的AI产品,如下:
Reutres News Tracer在社交媒体“去伪存真”
近日,网易新闻“闻学社沙龙”以《人工智能将如何重塑新闻业》为主题,与专家学者共同探讨AI对媒体行业的影响。分享会中,路透社的市场开发经理王海明介绍了“Reutres News Tracer”。
过去两年,路透社一直在Twitter 上用一款工具来监测随时出现的各类新闻事件、检测社交媒体信息的真实性,这款产品叫“Reutres News Tracer”。
其工作流程为:搜集所有可能是新闻的信息,找到原始出处;找到第一转发者;进行可信度检测,通过交叉比对,对真实性进行标注,根据验证结果进行从0%到100% 的“打分”。
“Tracer”的功能亮点是:能够实时监测社交媒体上的新闻;用算法去问记者平时可能会问的问题,倒推新闻的真实性;通过算法和机器学习挑选出哪些是新闻,哪些是广告、谣言或一般性对话,并摘出要点,同时把相同类别的新闻相叠,组成数据;给记者和编辑提供可靠的素材和资源。
王海明曾用“Tracer”见证谣言“成真”:当时,传出某公司要上市的消息,点击量从800多逐渐增长,随后有大V或其它媒体转载,当被网站转载后,谣言变成了新闻,但又在 24小时后被澄清。他说:“我见证了整个过程,因为我收到第一新闻源特别早,整个假消息传播链条是一开始局限在小范围内,随着新闻网站的转发和大V转发而爆发的。”
聊天新闻机器人
目前在媒体界,较为主流的做法是将AI机器人作为新闻推送的工具,使其搭载社交媒体的互动属性。比如,每天自动推送新闻消息;用户根据给出的选项自主选择感兴趣的新闻;还可以发送关键词获取相关新闻。
CNN推出了“个性分发”。 聊天机器人向用户推送头条新闻,在推送下方有三个选项:Read Story、 Get summary、Ask CNN,用户可以阅读故事内容、了解故事梗概、向聊天机器人提问。
在推送新闻的基础上,一些媒体开发出了更加具有记者属性的AI产品:辅助报道、收集线索资料、向用户提问,收集对新闻事件的态度。
BuzzFeed开发的“Buzzbot”,旨在让“每个人的口袋里都有一个记者,每个人都可以向“Buzzbot”讲述正在发生的事情。”当用户打开对话框,“Buzzbot”会进行提问,比如,向用户提出有关民主党大会和选举的问题,根据用户的回答,将用户的选举态度记录下来,以此帮助记者和编辑分析选民的政治倾向和意见,完成采访及回收任务。
这款AI产品增加了用户的参与感,让每个人成为拥有第一手资料的前线记者。作为记者和编辑的资料和素材库,Buzzbot更像是“后援军”。
除此之外,还有更加专注垂直信息领域的产品,比如《卫报》在Facebook上推出的美食类聊天机器人“Sous-Chef”,当用户与它聊天时,主厨会介绍并推荐菜谱。
这是美国媒体Quartz于2016年初率先推出的聊天新闻软件界面
秒出稿的写稿机器人
2016年,《华盛顿邮报》开发的新闻撰写机器人“Heliograf ”正式上线。
11月,这款机器人报道了共和党人史蒂夫·金击败民主党人金·薇芙的新闻:“共和党人依然控制着众议院,只是失去了少数席位,依然占据着绝对优势。在许多共和党领导人担心两位数的损失之后,他们的命运出现了惊人的逆转。”这款机器人不仅完成了“基本工作”,还预测了选举趋势,被认为具备了该报记者的习作风格。
《华盛顿邮报》的记者和编辑们制作了叙事模板,其中包括各种潜在结果的关键词句,比如,“共和党人对众议院的控制权”,“民主党重新控制了众议院”。之后,将“Heliograf”与结构性数据源联系起来。当大选到来时,它与数据交换网站VoteSmart.org相连,“Heliograf”进行数据识别,与模板中的词句匹配、整合,保证在各平台上发布不同版本的报道。
2016年11月份,“Heliograf”创造了500多篇文章,点击量超过50万。当月,《华盛顿邮报》的总点击量为11亿次。
国内媒体紧跟AI潮,主打 “快速、模板化”的新闻写手
2017年8月初,九寨沟县发生地震后,中国地震台网机器人仅用25秒就编写出一篇新闻稿。稿件共540字,包括速报参数、介绍震中地形等内容。该机器人结合了数字技术和智能写稿编程系统:实时监控信息源;信息抽取;采用机器学习算法,以模板和抽取知识库中信息的方式撰写新闻。
更早在2015年9月,腾讯财经用机器人“Dreamwriter”发布了一篇关于8月份CPI的稿件,引用统计局的数据、并加入专家及分析师的分析和预测。之后,“Dreamwriter”被腾讯财经广泛应用。据团队人员介绍:“‘Dreamwriter’会根据算法在第一时间自动生成稿件,瞬时输出分析和研判,一分钟内将重要资讯和解读送达用户。”
今年4月的数据显示,“DreamWriter”在财经+科技应用的发稿量超过2000篇/天。
今日头条的头条实验室研发除了一款名为“Xiaomingbot”的机器人。其写作模板结合了最新的自然语言处理、机器学习和视觉图像处理的技术,通过语法合成与排序学习生成新闻消息。
有关2016年,里约奥运会的数据显示,“Xiaomingbot”每天的发稿量达到30篇以上。“奥运会乒乓球女子单打铜牌赛在里约会议中心-3号馆展开,世界排名第50的朝鲜选手金宋依对阵世界排名第8的日本选手福原爱,双方你来我往展开了激烈的较量。最后,耗时49分钟,金宋依以4:1拿下比赛。双方各局比分为: 11:7、11:7、11:5、12:14、11:5。”这是由“Xiaomingbot”所撰写的短讯。16天中,“Xiaomingbot”共完成超过450篇新闻稿,阅读量超过百万。
目前,AI机器人还不具备创造优质内容的能力,但距离这个目标还有多远?美联社已经在利用深度学习来自动生成有数据支撑的文章,其带来的好处是使媒体将资源转移到具有更高价值的新闻选题上。
《华盛顿邮报》数字产品开发副总裁、首席信息官赛利希·普拉卡什曾强调:“‘Heliograf’并不是为了淘汰记者,而是让新闻编辑室的效率更高。”现阶段,媒体行业者对AI的期待是提高效率,将记者从基础工作中解放出来,让他们完成更复杂的选题,让人来讲述只有人能讲述的故事。