第五章 机遇来临:AI先行的创新与创业(第4/10页)

人工智能已经成为高科技企业制定战略规划时无法忽视的一部分。无论是依靠自身力量建立人工智能团队,还是通过收购、并购的方式获得相应的研发能力,高科技企业越早重视人工智能,越早拥有人工智能技术力量,就越容易掌控未来竞争。

科技“巨头”的潜在威胁

科技巨头全面拥抱人工智能,这当然是驱动技术革命的重要力量。但另一方面,科技巨头在人工智能领域的巨大投入也隐隐让专业人士为之担忧:AI时代,数据为王。谷歌等行业巨头坐享地球上最为丰富的大数据资源,利用这些庞大数据资源帮助人类克服挑战、解决问题当然最为理想,但谁又能从法律、道德等层面保证,对这些大数据资源的垄断不会成为行业巨头谋求一己私利的壁垒与工具?

硅谷著名投资人、网景公司(Netscape)联合创始人马克·安德森(Marc Andreessen)说,大企业在AI领域拥有几个巨大的优势147:

·懂得如何创建AI系统的人数非常有限。大企业可以为他们支付比创业公司更多的薪酬,就像雇用体育明星。大企业差不多可以把他们都收入麾下,留给其他企业的人才将少之又少。

·AI项目通常都非常大、非常复杂。这是全新的科技领域。亚马逊的Echo智能音箱是大约1500名工程师开发4年才完成的(注:马克·安德森这里说的工程师人数应该是有些夸大了,亚马逊CEO杰夫·贝索斯2016年5月在另一个场合的说法是:经过4年发展,Echo团队目前已有超过1000名员工148)。创业公司可没法投入如此多的资源。

·此外,还有对数据的需求。你需要巨大数量的数据集来创建AI应用。谷歌和Facebook之类的大型企业可以访问浩如烟海的数据资源,而创业公司则只能望洋兴叹。

2016年9月,谷歌(包括Deep Mind)、亚马逊、Facebook、IBM和微软等甚至结成了AI联盟(Partnership of Artificial Intelligence),并宣称:“我们相信人工智能技术必将改进人们的生活质量,并可帮助人类解决气候变化、粮食、不平等、健康和教育等全球性问题。为了更好地造福人类和社会,AI联盟致力于引导研究,组织讨论,分享观点,提供思想领导力,征询第三方建议,回答公众和媒体的疑问,并创建教学资源以推动包括机器感知、学习、自动推理等领域的AI技术普及。”149

巨头围绕AI技术结成伙伴关系,共同推动AI发展和合理应用,从这样的角度来看,这当然是件好事。但从另一个角度来说,巨头联盟只会加剧资源的进一步集中甚至是封闭。

我在参加瑞士达沃斯经济论坛时,曾和维基百科创始人吉米·威尔士等人讨论平台的力量。我们觉得,在国际化、资本、互联网趋势等共同作用下,未来的AI将会形成非常强大的平台,美国如谷歌、Facebook,中国如微信、淘宝。这些平台将汇集、整合原本零散的内容或应用,并因此大幅改善用户体验,使更多用户更容易享受到AI的巨大价值。

但专业人士和普通公众也有理由对这些集中了大量数据和计算资源的AI平台提出合理的质疑。例如,这些平台特别是巨头联盟的力量将特别强大,它们对整个科技圈的舆论影响将是决定性的。体量较小的平台发出的不同声音,很难在巨头世界里传达给普通公众。

同时,巨头围绕AI建立的平台也缺乏足够的透明性,较难与外界保持有效的沟通。一旦这些AI平台的利益与公众利益不符,在商业上也找不到可以制衡这些大平台的第三方力量。举个例子,假如Facebook借助庞大的社交网络资源,希望通过智能算法主动引导信息流动,并进而影响美国总统大选时的选民倾向,这在技术上几乎是完全可行的。我们当然知道,目前的谷歌、Facebook等巨头对人类的实际贡献远多于它们“作恶”的可能性,但从法律、道德角度,我们又必须想办法防范这一潜在风险。因为再友善的巨头本质上也是商业公司,巨大的商业利益永远是诱惑它们“作恶”的诱饵。

技术开源和数据开放方面,其实谷歌已经算是做得非常好的了。谷歌开源的Tensor Flow框架,已经成为业界深度学习的标准框架之一。谷歌在过去的几年时间里,连续开源You Tube 8M、Open Images、Audio Set等包含数百万份视频、图片、音频的标注数据集,为人工智能领域的科研发展提供“原材料”。但我们也必须知道,谷歌、Facebook这样的大企业很难主动开放那些关乎它们核心业务的网页标注、结果排序的特征、用户点击次数、广告转换指标等,对这些数据的垄断将AI世界里的大数据海洋分割成了一个个相互隔离的区域。

更糟糕的是,巨头建立的AI平台以及巨头之间的结盟关系,有可能让数字鸿沟变得越来越严重。信息在人工智能算法的组织、管理下,会更多地向有信息理解和处理能力的平台、企业、终端用户倾斜,接受过高等教育、积极参与网络生活的用户更加容易获得信息和人工智能应用的帮助,而教育水平低、较少参与网络生活的用户则难以找到可以改善自己生活的有效信息。想一想电子商务平台上的智能推荐算法:一个用户越是频繁购物,就越容易得到最适合自己的商品信息。类似的场景会在许多有真实信息需求的领域存在,信息或大数据世界里的富者愈富、穷者愈穷现象并不是危言耸听。

对于这样的“巨头风险”,我觉得我们应该从法律和制度建设层面,多做些有前瞻性的事情,包括:

·提高大数据和人工智能应用领域的透明度,鼓励公开那些不涉及用户隐私和商业机密的研发成果,鼓励开源。

·更多地鼓励利用区块链技术管理数据和信息流动,从技术和制度双方面打破科技巨头对大数据的垄断。

·成立有社会责任感的VC基金,专注于新兴的大数据和人工智能方向。

·多关注能够帮助落后人群获取信息、享受AI福利的平台。

·鼓励大众和媒体去监督行业巨头的商业行为。

在瑞士达沃斯,我受邀与麻省理工学院媒体实验室负责人伊藤穰一探讨巨头可能对AI的垄断。我的看法是,目前的体系会持续促使大型科技企业不断发展。它们有能力垄断资源、垄断数据,在商业利益和激烈竞争的驱使下,它们会不断地竞逐更为精进的技术能力,为公司赚取更大的利益。对于较小企业,进入AI市场的难度的确比移动互联网时代的创业高出非常多。我呼吁大力推动AI生态系的开放性。在创新工场北京总部和我们所投的创业公司体系中,已经启动了全新的AI技术相关研发工作。近期,创新工场也成立了人工智能工程院,带着孵化中国AI生态系的目标投入大量资源,招聘培训一批年轻工程师入门AI领域,展开可公开数据集的采集和标注。我们也积极寻求在中国和全球资本市场的融资和成长机会。