第13章 人工智能战略方针

1.1 起点:技术切入

技术切入是人工智能战略的基础部分,是设定人工智能战略的基本出发点。我们从一个案例来看一下人工智能技术的切入点有哪些。

图-1是百度AI平台对外的开放架构图,从图中可以看到百度包含对外宣称的ABC战略,包括智能云和百度大脑。智能云包含两个层次:大数据和云。云是提供硬件资源的,包括计算机服务CPU/GPU/FPGA,存储服务和网络服务等。大数据包括大数据分析,数据标注,数据采集等。百度大脑分为四个层次:算法层(深度学习的平台和深度学习),感知层(语音,图像,视频,AR/VR),认知层(自然语言处理,知识图谱,用户画像),平台层(AI开放平台)。

图-1百度AI平台对外的开放架构图图-1百度AI平台对外的开放架构图

从百度的ABC战略我们可以看到,百度在这里面覆盖了很多AI的技术点,包括语音、图像、视频、自然语言处理,知识图谱,用户画像等等。在这样一个平台下,百度对外输出了哪些AI服务能力呢?我们从图-2 百度的产品服务来分析一下。百度产品服务可以分为两个类型。第一个类型分为四部分:第一部分是语音识别服务(包括语音识别,长语音识别,远场语音识别);第二部分是语音合成;第三部分是语音唤醒;第四部分是视频技术。另一个类型包括文字识别,图像识别,人脸识别,图像搜索,图像审核,增强现实,语言处理技术,文本审核,理解与交互技术unit,机器翻译,数据智能,知识图谱和开放的数据集等。

图-2百度的产品服务图-2百度的产品服务

1.1.1 人工智能技术切入的技术点

从上面百度的案例我们可以看人工智能技术的切入点有自然语言处理,文字处理,文字的识别,包括有人脸的识别,语音的处理,语音的识别等技术。

1.1.2 人工智能技术切入的战略逻辑

百度的这些技术能力对外是开放的,为什么在没有获得经济利益的时候对外开放呢,背后关于战略思考的逻辑有两点:一是当前技术有瓶颈,技术并没有真正掌握。二是没有找到合适的场景。

1.1.3 人工智能的技术切入价值和意义

即使有了技术能力,但是没有合适的场景,而且没有实现突破的时候,通过卡位来进行“占坑”。通过卡位占领流量入口,这就是人工智能技术切入的一个动机,也是它的价值和意义所在。

1.1.4 技术切入面临的问题瓶颈

人工智能技术切入的战略方针带来价值和意义的同时,也存在一些问题,第一个问题是在投入大量的人力,物力,财力的情况下,什么时候能获得商业利益?第二个问题是,人工智能时代,如果仅仅做技术切入能实现自己的商业意图吗?这两点可以留给读者思考。

1.2 重点:数据融合

数据融合是人工智能战略的重点,进行数据融合第一点我们要理解实践,提升我们的思考能力以及理解能力。第二点就是了解人工智能需要融合哪些数据,在这里面关键的一个点叫领域知识图谱。第三点是了解人工智能怎样进行数据融合,这个背后涉及到知识图谱的构建。

我们先看一个以数据融合作为人工智能战略的典型案例。人工智能时代把数据作为自己战略的公司最典型的就是谷歌,在人工智能时代,谷歌选择了两个重大的技术方向进行储备。第一是人工智能的深度学习,第二是知识图谱。图-3是2016年,谷歌所发布的人工智能的六大战略。通过这个案例我们来分析一下谷歌这家企业对外输出的产品和服务,然后推导一下他所定位数据融合作为人工智能战略的一个思考逻辑和出发点。

图-3 Google人工智能六大战略图-3 Google人工智能六大战略

谷歌人工智能的六大战略中,排第一位的就是知识图谱。其它的几项包括语音助手,自然语言处理,翻译,语音识别,图像识别。在这里面我们看到,谷歌把数据融合,把知识图谱的建设看得非常的重。谷歌基于他的知识图谱,也就是数据融合以后的产品形态,对外输出了什么样的服务呢?下面我们从三点分析一下知识图谱在谷歌的典型应用

我们可以看到他所融合出来的知识图谱所用的第一点就是在搜索引擎上面。一个例子是谷歌之前的一篇泰姬陵的输入的论文。从图-4我们看到,谷歌搜索引擎在输泰姬陵的时候,会自动把与泰姬陵本体相关,以及泰姬陵这样一个词所代表的客观存在的内容抽取出来,然后展示给我们这里展示给我们的不仅仅是关键词相关的内容,而且包括这关键词背后所代表的实体对象,这样更有利于大家找到正确的内容。

图-4谷歌搜索引擎中泰姬陵的输入图-4谷歌搜索引擎中泰姬陵的输入

第二点就是是恰当的摘要信息。在图-5中我们看到搜索居里夫人的时候,分左右两部分,左侧是自然搜索结果,这是当我们在没有知识图谱的时候,纯依赖于关键词的匹配度计算出来的。右侧部分是基于关键词所触发的背后的知识内容,在这里就是人物的属性信息。我们可以看到这里把居里夫人的出生日期、子女、教育程度等等相关的信息做了一个摘要。这种做法的的好处就在于不只展示若干条网页的搜索结果,还会把对应的真实的关联的人的信息一次性展现出来,这样就相对提升了人获取信息的知识的便捷性。

图-5 谷歌搜索引擎中居里夫人的输入图-5 谷歌搜索引擎中居里夫人的输入

第三点就是有更深更广的应用。当我们构建知识图谱的时候,会有更深层次的应用。这里我们举的一个例子就是美国动画片《辛普森一家》。在这里我们看到导演的父母,导演其他的亲人也是从事导演的工作,从这里我们可以看到通过知识图谱的应用可以获取更多的信息和知识。

1.2.1 人工智能为何要进行数据融合

谷歌这样一家公司为什么要把知识图谱作为他的人工智能时代的一个重要的思考点呢?我们可以通过解读谷歌知识图谱的认知来进行分析。我们前面提到知识图谱是用来提高思考能力的,这里思考能力就意味着理解世界,思考能力的提升也需要去理解世界,对搜素引擎而言,谷歌的定位就在于从连接信息的搜索引擎转变为连接知识的引擎,这个背后就在于提升人工智能的理解能力,这点是做知识图谱最关键的一个切入点。因为人工智能不可能仅仅在于可以用语音和你说话,或者我能听到你的语音,但是我不知道你在讲什么,没有办法做到理解,也没有办法做到反馈,这种情况下人工智能是没有任何价值的。这也就是谷歌在设计人工智能战略的时候的思考点。

图-6 谷歌数据融合的思考逻辑:思考能力/理解世界/搜索引擎/知识引擎图-6 谷歌数据融合的思考逻辑:思考能力/理解世界/搜索引擎/知识引擎

1.2.2 人工智能知识图谱的应用

接下来我们分析一下知识图谱都可以用在哪些地方。上面提到的是知识图谱在搜索引擎领域的应用,搜索引擎方面,除了谷歌,还有百度和微软必应。知识图谱的另外一个应用是聊天机器人,另外还有目前我们接触比较多的各种智能音箱,以及决策支持,最典型的就是IBM的沃森的医疗机器人系统,还有就是包括私人助理,智能硬件,智能家居相关的场景里面,在这里面的作用的一个关键点就是提升理解能力,提升思考能力。前面我们提到以知识图谱作为人工智能战略的典型的公司,以及这家公司他的人工智能战略里面数据融合这一项所对外输出的一个服务能力。

思考:当我们去构建知识图谱的时候,到底是构建一个通用的领域知识图谱,还是构建行业的知识图谱?图-7列出了常用的思考点,在这里希望大家能够引入自己的思考,以自己的方式来正确地看待这件事情。从现在对于智能交互的一个认知,往往我们把它定位成聊闲天,或者叫弱智,或者表现非常差,这个背后最关键的因素就在于领域知识图谱的建设能力尚未取得突破性的进展。这是一个小小的提示。

图-7思考:我们选择建立哪一种知识图谱?图-7思考:我们选择建立哪一种知识图谱?

1.3 核心:场景驱动

人工智能战略的核心,就是场景驱动。人工智能时代选择产品场景驱动的典型案例,最典型的就是小米。在2017年小米的开发者大会上提到小米的小爱可以控制8500万台设备,也就是说小米有8500万智能设备分布在不同的网民的家里。中国一共13亿人口,按照3个人一个家庭,这个数目相当于4亿家庭左右,大概占中国总家庭数的四分之一。小米虽然不怎么讲人工智能,但是却默默地在智能家居的场景的方方面面进行了卡位。也就是说以后想进军智能家居这块的企业,都不能绕开小米。

图8:小米的小爱可以控制的人工智能设备数量图8:小米的小爱可以控制的人工智能设备数量

在这样的战略指导思想下,小米都有哪些产品和服务出现呢?一个简单的例子,就是小米的智能音箱。小米的智能音箱以最低的价格先卡位到用户的家里,这样就相当于掌握了流量的一个入口,然后既可以通过这个入口输出对应的服务能力。服务对应的是场景。小米提供了哪些相应的人工智能的场景呢?从图-9可以看到,小米智能音箱目前已经支持的功能包括音乐,娱乐,天气,闹钟,新闻,广播消息,相声小品,精品小说,脱口秀,路况,算数,时间,查找手机,评书,留言,儿童故事,备忘,单位换算,股票,汇率,公开课,亲戚称呼,问答百科,闲聊笑话等等。这里的每一个功能都对应一个业务场景,如果我们从这一视角来看,小米已经做了非常多的工作。但同时我们也可以看到,他所提供的这些相关的内容,还远远不能作为解决人的日常生活中的某一项特定的需求的东西,只是一个辅助。

图-9小米的产品:智能音箱图-9小米的产品:智能音箱

小米在互联网中以场景作为驱动切入人工智能,他的战略目标和战略思考逻辑是什么呢?在移动互联网时代,搜索是重头戏。在人工智能时代,搜索的模式就是问答机器人,问答机器人除了会说话,关键点还落在他回答的内容方面。由此我们可以看到,小米在人工智能时代的战略布局的关键点就在于服务能力的输出。

图-10人工智能时代的搜索模式:问答机器人图-10人工智能时代的搜索模式:问答机器人

思考:在人工智能时代,场景驱动的典型的案例,除了小米,还有阿里(产业人工智能)以及一些其他的人工智能公司。这些场景驱动的人工智能企业,他们会成功吗?

提示:这个背后就涉及到人工智能产品的价值评估的模型的问题,可以考虑引入马洛斯的人的需求层次模型,看这个产品到底作用在人工智能的哪个需求层次上面,然后这样的一个定位,人们是否会对他有相应的欲望和诉求。

图-11 思考图-11 思考

1.4 关键:流量变现

人工智能战略的最关键的一个点就是流量变现。关于人工智能的商业模式,到目前为止还没有任何一家公司真正把这方面内容定义清楚,所以这部分我们定位成一个开放性的话题。这部分本书作者通过自己的过往经验对这个问题做一些自己阐述。

人工智能商业变现的第一种模式,也是目前主要存在的一种模式,就是收取技术服务费。靠收取技术服务费最典型的一家公司就是科大讯飞,科大讯飞主要在语音识别和语音合成这一块,他的语音识别和语音合成都是收费的,而且是按照流量进行收费。但是目前这种模式存在一个问题,当人工智能被作为一个新兴行业,几乎被所有人都认可,成为一个风口的点的时候,会有大量的资本和公司涌进来,会有砸重金希望通过免费的模式赢取市场空间的一些公司出现,这样导致原来通过收取技术服务费的方式已经不可再持续。这里最典型的公司就是百度,百度在一个开放平台的开发者培训活动上宣布的内容重点就是“免费,免费,免费!”这里的免费包括百度对外输出的语音识别技术,人脸识别技术等等。这就意味着在人工智能时代,收取技术服务费这种方式不可再持续下去。收取技术服务费这种方式不可持续的一个原因就是一个行业内有公司宁愿通过砸重金来抢占这块领域和市场。另一种原因就是技术门槛太低,无论是语音识别还是人脸识别都不是一个绝对的门槛。门槛降低就导致随时有新的挑战者进来,就没有办法形成一种技术壁垒。

图-12百度宣布人工智能技术实行免费模式图-12百度宣布人工智能技术实行免费模式

人工智能商业变现的第二种模式,就是内容分发的费用。内容分发是指通过对外提供一种智能设备,可能是音箱,也可能是其它的终端,但是不希望在设备上赚钱。一个简单的例子是小米的智能音箱——小爱。一个从其他渠道曝光出来的小爱音箱的销售价格减去制造成本,只有一亿元的盈利空间,相当于它的销售价格减去制造成本等于1,这基本上是不赚钱的。为什么在不赚钱的情况下小米还愿意做这款产品呢?这背后隐藏的意图是有两方面,第一就是用低价的设备区抢占市场,就是卡位。第二就是设备终端免费,然后通过提供的服务这种模式来获取商业利润。

内容分发这种模式到现在我们看的到的,尤其是在智能音箱这块,就是喜马拉雅的小雅。我们都知道喜马拉雅是一个语音平台,在他的平台上面会有这样或者那样的各种音频节目,这些音频节目有免费版本,也有收费版本,但是对于专业的内容,就是价值密度比较高的内容,其实是收费的。这就相当于说音箱是一个载体,通过音箱来享受我的语音服务,通过语音服务进行收钱。其实这种模式从长远来看是一个价值付费或者内容付费的一种方式。这种方式从长远来看发展空间是比较大的,也是认可度比较高的一种模式。

图-13 内容分发模式的典型案例——喜马拉雅小雅图-13 内容分发模式的典型案例——喜马拉雅小雅

人工智能变现的第三种模式,是通过构建智能机器人的应用商店,然后为这些智能机器人去导流,形成规模化的人工智能交互流量,并通过流量来进行变现。这一点比较领先的公司有两家:一是Facebook,这家公司的Messenger已经开放了机器人开发的借口;另一家是微软。微软开发了一个框架叫Bot Framework(图-14),来提供人工智能问答机器人的开发。开发的问答机器人是可以和微软的现在的线上交流产品(Skype),以及搜索产品(必应)进行调度和关联。当有相应的检索或者交流需求,就可以调取相应的机器人,从而获取相应的服务,形成一种流量,然后在这些机器人的界面里面,可以嵌入一些商品或者广告信息。这些模式从长远来看发展空间比较大的,是符合互联网产品/人工智能产品的要求的。因为人工智能产品的商业模式目前来讲并不太确定,但是过往的互联网/移动互联网商业模式最基本的原则就是“羊毛出在猪身上”。这种模式,我个人认为会成为未来主流的一种商业变现模式。

图-14 微软Bot Framework平台图-14 微软Bot Framework平台

Facebook的Messenger platform(图-15),也是支持机器人开发,然后会把机器人嵌入到Facebook的Messenger服务里去。可以通过搜索相应的机器人,叫起对应的机器人服务,和对应的机器人进行交流。

图-15 Facebook的Messenger platform图-15 Facebook的Messenger platform

人工智能的第四种商业模式就是对外输出AI服务。最典型的案例就是IBM的沃森机器人(图-16)。它本身提供的是精准医疗服务,既有关于医疗知识的问答,又有关于医疗疾病的诊断,包括癌症的诊断,还有其它的等等。这样的一种模式其实是人工智能真正的落脚点,我们来看纯人工智能技术本身,他的最终的落脚点会在AI服务这部分。

图-16 IBM沃森机器人图-16 IBM沃森机器人

本书中我们也提到人工智能的三个层次:交互层,思考层,服务层。AI服务变现就相当于利用AI的能力来对外输出,让它变成一种商业服务,比如IBM的沃森机器人。另外一个是腾讯的觅影系统,也是关于医疗疾病诊断的。还有另外一种,他不是一种机器人,而是人工智能的一种诊病方式,就是关于皮肤病诊断的,他可以利用图像处理技术自动识别2000多种皮肤病,而且诊断准确率能高达95%,这些都是AI服务变现的一种方式。这种方式下,可以通过远程提供医疗服务解决两个问题,一是解决医疗资源在不同地区差距的问题,另一种就是解决人的自诊的问题。通过提供这些服务收取一定的费用,是以后可以发展起来的一种模式。

以上这些都是作者个人基于行业知识做的一个总结,这种总结的判断依据来源于人工智能版的产品价值链模型的设计。这个模型的设计,在当前的形势下没有人完整地提出。这里作者把互联网时代关于产品价值链模型的评估拿过来作为我们的一个参照。我们可以尝试着基于这样一种东西,来做人工智能产品的价值链模型。图-17是马斯洛的需求的层次模型,当我们把马斯洛的人的需求层次模型与互联网相结合的时候,我们可以通过在互联网的不同发展阶段或者不同的产品定位上面,寻找哪些需求是有足够发展空间的。马斯洛的人的需求模型里面,需求包括胜利需求、安全需求、被接纳的需求、自尊的需求以及自我实现的需求,这里面一个层次是生理需求和安全需求,这些需求几乎是100%被人所需要的,这个很好理解,因为人总要吃饭,总要睡觉,有一个相对安全的环境,这是100%的。第二个层次是社交的需求、满足被人发现的需求、关系建立的需求,这个只有40%的人有。另外一个层次是自我实现的需求,这类人实现了小康之后,会有高层次的需求,比如满足收到膜拜的需求、满足发挥影响的需求,这类人占5%。需求达到100%,也就是说用户去获取这些需求的动机的比例相当于占100%。需求为40%,说明有少部分人有这种需求。需求为5%,说明只有极少部分人有。由此我们可以分析,当我们做一个互联网产品的时候,我的用户在关注什么?他的视线被什么所吸引?然后对应的去开发相应的产品,就一定会受到用户的欢迎。人工智能类的产品也有同样的发展标准,你要做的这款产品是要满足人的生理需求、安全需求、被接纳的需求、自尊的需求,还是自我实现的需求,你的产品定位在哪个层次,就意味着有多少用户群体对你的产品有刚性的需求,你的产品有多大的成长空间,有多大的被接受度。

图-17人工智能版的商业价值模型图-17人工智能版的商业价值模型

问题:我们在这里提出一个问题,就是关于人工智能商业变现的一种思考方式:人工智能版的产品价值评判的模型,读者可以自己动手来做一下。