人工智能将会给下一代智能手机带来些什么?

来源:中华机械网  字号:   发布时间:Mon Feb 13 16:50:16 CST 2017

         一、人工智能为什么如此迫切

  1.1面对信息爆发,人工智能将是解决信息精准定位的关键

        信息爆炸,还在继续扩张:2007年推出首款智能机以来,移动互联网得到了迅猛的发展,Facebook、微信、微博、电商、导航、直播、滴滴、O2O、支付等包围着我们的日常生活。人们每天拍摄数以亿计的照片并在网上分享,美国4大APP(Facebook、Whatsapp,Instagram,Snapchat)每天分享的照片量就超过30亿张;微信月活动用户近5亿,每天将有不计其数的信息发送。

        不管是历史,还是未来,我们使用智能机消费大量信息的同时,也制造了大量信息,而且这种信息的快速扩张仍在继续。据华为GIV预测,从2015年到2025年,人均移动流量将会增长30倍。

        从大量信息中精准找出你需要的信息,真正体现信息的价值:信息过度膨胀,同样给我们造成很大的麻烦,如信息质量参差不齐、大量垃圾信息,导致我们需要花费更多的时间从大量的信息中找出我们需要的信息。当前的方法如何找到你需要的信息,局限性非常大,如在一个购物网站搜索商品,首先通过关键字搜索出过多的结果需要人为过滤;其次不同人、不同的环境通过相同的关键字搜索出来的是相同的结果,这些结果无法感知人的需求和所处环境;最后有些难以用关键字描述的更是难以提供有效的结果。这些局限性严重影响信息的使用效率,同时随着信息膨胀,效率会越来越低下,会导致信息价值越来越低。

        因此在这个信息爆炸的时代,需要机器真正的连接信息端和需求端,它即深度的掌控信息,又对人的需求充分了解,这样才能精准提供人们需要的信息,提升信息的价值和发挥机器的作用,人工智能将在这个过程中发挥重要的作用。

  1.2关键技术突破,给人工智能应用提供了基础                 人工智能整体并不陌生,从1956年提出人工智能以来,已经有了60年的历史,一些关键能力的突破,正在促进人工智能大规模的应用。第一个因素就是全场景大数据,为人工智能提供了基础。移动互联网进入人生活的方方面面,积累了庞大全场景的数据,和人工智能相结合,数据有效地被挖掘,才能创造出更大的用户价值和商业价值。另外人工智能本身,认知和感知方面也得到了突破:

  l 认知的突破:以神经网络学习为基础的机器学习得到了突破并进行了应用,AlphaGo是机器学习突破的一个重要的关键事件。

  l 感知技术的突破:机器学习和语音、图像先结合,大大提升了自然语言能力、以及图像图识别能力。语音识别方面,机器的语音识别正确率已经达到了90%。图像识别方面,利用深度学习算法再次提升了图像识别的准确率,如Facebook的DeepFace人脸识别达到了97%,已经超过了人类,Facebook每天也有数亿张照片运用此技术进行在线图像识别。

        这些关键技术的突破,为人工智能打下了良好的基础。未来人工智能是从现在人学习机器各类操作转换成机器像人一样,听懂、看懂、会思考。

  二、人工智能对智能手机和移动互联网带来革命性的改变

        对于我们使用最频繁的智能手机和移动互联网,人工智能注入后会发生什么样的变化?

  Smartphone + 人工智能 = 智慧手机

  移动互联网 + 人工智能 = 智慧互联网

            1系统革命:具备自学习和无监督学习能力

        首先我们看看传统的系统,其实是一个迭代系统,根据用户需求,发布一个系统满足用户需求,当用户需求不能满足时,优化系统,再发布一个新的系统,其系统开发是迭代优化过程,人在此过程中有非常多的干预:

        而人工智能系统放弃了迭代式系统的想法,是自我学习的系统,用户使用系统产生数据,数据+人工智学习算法对模型进行优化,模型整合成系统把功能提供给用户,用户使用过程中又将产生数据,整个系统实现自我循环,自循环的过程将是系统不断学习和提升智能的过程。

  深蓝和AlphaGo诠释出两个系统的本质区别:

        深蓝:1997年击败了世界国际象棋冠军卡斯帕罗夫,但是在1996年深蓝曾经败给了卡斯帕罗夫,是随后IBM工程师对系统进行优化的结果。分析深蓝的结构,其系统是专门为国际象棋设计,包括1)走棋模块:负责生成可能的走法;2)评估模块:对盘面上所有棋子当前所处的位置计分;3)搜索控制器:能快速削减搜索的规模。深蓝的国家象棋算法需要专业国际象棋人员设计(引入象棋大师Joel Benjamin做咨询),同时找了更多国际象棋做陪练,并不断人工优化系统和算法,是个迭代的过程。

        AlphaGO:2016年战胜世界围棋大师李世石,其影响更加深远。因为围棋有19*19格,复杂度远比国际象棋高,同时AlphaGo引入神经网络算法和强化学习方法,是一个自我学习的人工智能系统。其自我训练分成3个阶段:1)AlphaGo对于围棋规则一无所知,只是毫无目的地模仿专业棋手手法,形成自己的策略;2)AlphaGo开始与自己下棋:将过往训练迭代中的策略与当前的策略对弈,自我强化训练;3)第三阶段,AlphaGo在自我对弈中,从不同棋局中采样不同位置生成3000万个新的训练数据,用以训练对局面评估,从而可以在比赛进行过程中预测棋局未来可能的发展。对于AlphaGo,除了预先输入历史棋谱(大数据)和围棋规则,AlphaGo对围棋一无所知,也不需要专家设计和测试,而是通过自我学习提升围棋水平。其整个系统非常符合自我学习的自循环系统:棋谱数据+规则—>深度学习和强化学习—>围棋系统—>自我对弈、和人对弈产生新数据的自我循环。

        智慧手机将是一个自我学习的自循环系统,实现人工智能从低级到高级的发展:从婴儿开始认知世界、不断的记录身边的信息,到小帮手,可以通过沟通理解这个世界,再到秘书、分身、最后发展成教练。未来三年到五年,系统有望成为我们的帮手,同时某方面的能力将更强。

  2.连接革命:从比特连接到认知连接

        现在我们每天从智能机可以看到图片、信息、可以听到语音、可以在网上购物,但是这些信息对于机器只是0和1的比特流,所有的认知如图片的内容、语音的内容、文字的理解等,都需要通过人来处理,如在相册中寻找照片,我们需要逐张寻找;购物过程中我们需要去寻找哪种商品。这样的效率非常低下,低下的原因就是机器没有认知能力,所有认知方面的信息都需要人的周转。人工智能就是提升系统的认知能力,看懂世界、听懂世界、理解语音和文字,只有这样数字世界和物理世界才能实现认知连接,知识不需要从人进行周转,而是机器自己处理,这样大大提升人机效率。

        机器要达到这一能力,需要改变现有的计算模式,从定量和准确的计算,转变为定性和模糊的认知计算。机器从0和1的基本算术上升到语音、视觉、知识、思考和决策等认知层面的理解。

        这对整个智能机的软硬件架构带来根本性变化,软件的OS将不是以计算为基础,而是以AI为核心的OS。硬件计算能力需要具备大数据并行运算能力,硬件系统必须升级改造以适应这种变化,虽然现在业界对于AI芯片有GPU、FPGA和ASIC路径,其目标是一样的,就是大数据并行运算支撑AI的深度网络学习能力。

  3. 人机交互方式革命: 交互由GUI转变为CUI(Conversational User Interface),机器根据上下文更能理解人的需求

        当前智能机的交互方式是触摸式图形操作为主,用户通过触摸和搜索找到需要的功能、信息和服务,随着移动互联网功能增强和信息爆炸,对这种便捷的交互方式提出的很大的挑战:

        操作繁琐性增强:手机的功能需要按照树形方式组织,随着手机功能多导致需要多层才能进入所需要的功能,有些功能隐藏较深难以查找;如果同时需要两种以上功能时,手机频繁的切换带来操控困难。

        触摸方式导致机器很难明白用户的意图,同时机器也难以主动和用户进行交流来了解用户需求:如用户需要搜索需要的东西,只能依赖关键字,而关键字往往不能一次性的有效的表达出用户的真实想法,这使得用户需要不停尝试新的关键字,即使关键字有效,也会出现很多搜索的结果需要用户自己去排查。

        CUI为对话式交互,是机器和人通过交流,通过更自然的方式理解人的用户行为和意图,执行人的指令和为人服务,CUI是自然交互和人工智能相结合的产物。

        CUI目的就是更好理解用户需求基础上提供信息和服务,其需要具备下面的关键能力:

        多种对话的认知能力:语音、文字、图片的认知能力,可以通过语音和文字了解人想说什么,通过图片识别可以判断出图片的内容,这样才人和机器有同一认知基准。

        上下文的理解和组合理解:机器与人的对话和人与人的对话类似,需要通过多轮对话,才能正在了解用户的意图,同时在对话中,机器有主动的沟通能力。

        建立个性化的知识图谱:用户的行为的一致性和因果关联性,因此机器需要通过学习建立用户的知识图谱,通过知识图谱才能深入洞察用户需求。

        通过环境感知洞察用户意图:用户的意图和用户的环境是相关的,如外出购物,到中午了,用户最关心的是吃饭问题。

  4商业模式和入口方式革命:智能助手将成为智慧手机第一大入口,同时商业模式发生重大变化,大量APP将消失,服务将原子化

        随着移动互联网的发展,APP也得到了蓬勃发展,数量也是急剧提升,Android和苹果的APP数都超过了200万的数量,大量的APP给用户和商家造成很多的负面影响:

        APP绑架用户,虚假繁荣:大量的APP给用户造成困扰,甚至产生不必要的资源消耗,用户真正需要的是内容和服务,而不是APP。如用户想看视频,不同节目位于不同的APP,就需要装多个不同的APP,如优酷、爱奇艺、乐视、腾讯视频、百度云等;再如用户打车,这需要装滴滴、优步、神州等APP,目的就是希望高峰时段能打到车。

        大量低频APP遭用户抛弃,给商家服务和内容的推广造成不利的影响。有数据显示,中国应用市场上的APP,85%的用户会在1个月内将其下载的应用程序从手机中删除,而到了5个月后,这些应用程序的留存率仅有5%。

        即使对高频APP,其越来越重,功能越来越复杂,大量功能是用户不需要的,用户会抱怨手机存储越来越少,运行越来越慢。

        入口过多,每个APP都是用户的一个入口,同时操作多个功能导致APP频繁切换。

        从上面APP的困扰可以看出用户需要的是功能和服务,而不是APP,而且用户入口越少,用户越容易操控。随着人工智能的注入,智能助理+智能平台将解决这个问题,并将颠覆现在的商业模式:

        智能助理+智能平台将有什么重大改变呢:

        智能助理成为用户第一大入口:智能助理将从用户开机开始接手用户入口,成为和用户统一交互、统一展示结果的窗口。智能助理统一和用户交流,洞察用户需求,提供用户需要的信息、服务、以及对手机的操控。所有的操控将不会分散到各个APP中进行,用户将会逐步忘记APP的存在。

        商业模式将发生改变:大量的APP将消失,随之替代是一个一个原子化服务。这些服务原子将和智慧平台对接,智慧平台成为周转和组合服务的平台。这对智慧平台也提出了更大的挑战,不仅需要洞察用户的需求,又要根据用户需求组合和提供服务。智慧平台将成为智慧互联网的关键核心,将成为价值分配的中心。

        用户享受一站式服务:智慧平台有服务的组合能力,用户从繁琐的操作中释放出来,享受一站式组合服务。如我要出差,机器通过对话理解用户需求后,帮助预定机票、酒店、出租车、购买出差礼品的组合服务,而不需要用户逐个操作。

(责任编辑:薛锋)[打印本页][关闭窗口]