第一章 人工智能来了(第2/8页)

图3中是我和小冰关于美国总统竞选的一段对话,有意思吗?在这样一个简单的对话语境里,小冰试图表现出不偏不倚的中立态度,而且,她在讨论严肃话题的时候,口气上居然有三四分的调侃和戏谑。

图3 微软小冰为代表的智能助理类应用

严格地来说,小冰的智慧程度还远远赶不上人类,更多时候,她只是在事先积累的人类对话库和互联网资料库中,查找最有可能匹配的回答。在不少特定的情形里,比如上下文较复杂的场合,小冰经常答非所问,或有意无意地顾左右而言他。但很难否认,小冰及类似的智能助理程序,已经展现出初步的与人类沟通的能力。

像小冰这样的智能助理应用有很多。苹果公司早在2011年就发布了i OS语音助理Siri;2012年,谷歌发布的Google Now将智能助理的概念带入了Android世界;2014年,亚马逊发布了基于Alexa平台,可以和用户聊音乐的智能音箱Echo;随后,2015年,百度发布了集成个人搜索助理和智能聊天功能的度秘;2016年,谷歌发布了智能聊天程序Google Allo;2017年1月,百度推出的基于自然语言对话的操作系统Duer OS则代表了国内互联网公司在建立智能助理开发与应用平台方面的自信。

新闻推荐和新闻撰稿

用手机看热点新闻是许多人每天都要做的事。像“今日头条”这样的新闻类应用之所以火爆,主要就是因为其采用了人工智能技术,应用程序可以聪明地归纳每个人看新闻时的不同习惯、爱好,给不同用户推荐不同的新闻内容。带智能推荐功能的应用如果做得好,用户就会觉得,越经常使用,机器就越懂得自己的“心思”,一段时间后,这个应用程序就不亚于一个量身定制的新闻管家了。

而且,AI的魔力还不止于新闻推荐。你知道吗,现在,相当数量的新闻内容,根本就是由计算机上的人工智能程序自动撰写的!

2011年,一个名叫罗比·艾伦(Robbie Allen)的思科公司工程师将自己创办的一家小公司改名为Automated Insights,这个新名字大有深意——罗比·艾伦立志研发人工智能自动写作程序,而公司新名字的首字母缩写恰好就是人工智能的英文缩写——AI。

借助一套名为“作家”(Wordsmith)的人工智能技术平台,Automated Insights公司首先与美联社等新闻机构合作,用机器自动撰写新闻稿件。2013年,机器自动撰写的新闻稿件数量已达3亿篇,超过了所有主要新闻机构的稿件产出数量;2014年,Automated Insights的人工智能程序已撰写出超过10亿篇的新闻稿2。

世界三大通讯社之一的美联社于2014年宣布,将使用Automated Insights公司的技术为所有美国和加拿大上市公司撰写营收业绩报告。目前,每季度美联社使用人工智能程序自动撰写的营收报告数量接近3700篇,这个数量是同时段美联社记者和编辑手工撰写的相关报告数量的12倍3。2016年,美联社将自动新闻撰写扩展到体育领域,从美国职业棒球联盟的赛事报道入手,大幅减轻人类记者和编辑的劳动强度。

想看看机器自动撰写的新闻报道是否表达清晰,语句通畅?下面是从美联社职业棒球联盟新闻稿中节选出来的几段:

宾夕法尼亚州立学院(美联社):第十一局,一二三垒有人,一人出局的情况下,迪伦·蒂斯被触身球击中,保送上垒。这是本周三州立学院鹿角队9︰8战胜布鲁克林旋风队的比赛中的一幕。

丹尼·哈茨纳通过牺牲打获得制胜一分。击球后,他成功跑上二垒但在跑向三垒时出局。

基恩·科恩在第一局中打出双杀,使旋风队以1︰0领先。但在第一局的随后时间内,鹿角队连得5分,其中,迪伦·蒂斯的触身球就直接送两人跑回本垒。

……4

自动撰写新闻稿件的好处不言而喻,这不但可以节省记者和编辑的大量劳动,而且可以在应对突发事件时充分体现出计算机的“闪电速度”。

2014年3月17日清晨,仍在梦乡的洛杉矶市居民被轻微的地面晃动惊醒。这是一次震级不大的地震,但因为震源较浅,市民的感受比较明显。地震发生后不到三分钟,《洛杉矶时报》就在网上发布了一则有关这次地震的详细报道,报道不但提及了地震台网观测到的详细数据,还回顾了旧金山区域最近十天的地震观测情况5。

人们在新闻报道的网页上看到了《洛杉矶时报》记者的姓名,但该新闻之所以能够在如此快的时间里发出,完全要归功于可以不眠不休工作的人工智能新闻撰写程序。地震发生的瞬间,计算机就从地震台网的数据接口中获得了有关地震的所有数据,然后飞速生成英文报道全文。刚刚从睡梦中惊醒的记者一睁眼就看到了屏幕上的报道文稿,他快速审阅后用鼠标点击了“发布”按钮。一篇自动生成并由人工复核的新闻稿就这样在第一时间快速面世。

机器视觉

人脸识别,这几乎是目前应用最广泛的一种机器视觉技术,是人工智能大家庭中的重要分支。近年来,随着深度学习技术的发展,人工智能程序对人脸识别的准确率已经超过了人类的平均水平。

很多公司都为员工发放用于出入公司的门禁卡。但在我们的创新工场,没有人佩戴门禁卡。创新工场的大门上装有一个高分辨率的摄像头,员工走近大门的过程里,与摄像头相连的计算机中安装的一套名为Face++的智能软件会实时采集人脸图像并与系统中存储的员工照片进行比对,系统认识的“熟人”可以自由通行,系统不认识的“陌生人”则会被拒之门外。

人脸识别不仅仅可以当保安、当门卫,还可以在手机上保证你的交易安全。不少手机银行在需要验证业务办理人的身份时,会打开手机的前置摄像头,要求你留下面部的实时影像,而智能人脸识别程序会在后台完成你的身份比对操作,确保手机银行程序不会被非法分子盗用。

广义上的机器视觉既包括人脸识别,也包括图像、视频中的各种物体识别、场景识别、地点识别乃至语义理解。所有这些智能算法目前都可以在普通手机应用中找到。

图4 用谷歌照片检索出我在2008年参加奥运火炬接力的瞬间

例如,今天主流的照片管理程序几乎都提供了自动照片分类和检索的功能。其中智能程度最高、功能最强大的非谷歌照片莫属。利用谷歌照片,我可以把我的所有照片和视频——没错,是所有照片和视频,不管是昨天拍摄的晚宴照片,还是十几年前为孩子拍摄的家庭录像——统统上传到云端,不用进行任何手工整理、分类或标注,谷歌照片会自动识别出照片中的每一个人物、动物、建筑、风景、地点,并在我需要时,快速给出正确的检索结果。