人机交互专题报告

 人机交互专题报告-编程之家 (2013-12-06 19:57:10) 人机交互专题报告-编程之家转载

  分类: 寻找牛股

人机交互专题报告

2013年9月7日 来源:齐鲁证券

http://blog.sina.com.cn/s/blog_a816de580101eoaj.html

 

投资要点

人机交互变革将是继个人计算机、互联网、云计算、大数据之后的第五次信息技术领域的重大技术革命。2010年1月我们在业内率先提出云计算将是未来3-5年内最值得期待的技术革命,并提出“浪启中华”投资组合,截至目前,无论产业基本面还是上市经营情况都有力验证我们对云计算本土化的判断前瞻性和专业性。而如今,我们再次率先提出人机交互变革将是信息技术架构体系中感知层(或终端层)的重大技术变革,并且我们认为人机交互变革将引领信息消费的新高潮,其变革水平对信息消费的杠杆效应不亚于云计算、大数据的综合效应,其市场空间远大于云计算和大数据的落地空间;我们再次提醒投资者高度重视人机交互变革所带的产业辐射效应,为此,我们精心编写了人机交互专题之二,以飨读者。

科技与需求双轮驱动下人机交互技术的高速发展,使其实现了鼠标、多点触控、及体感技术的三次重大革命。而体感交互又是继个人计算机、互联网、云计算、大数据之后的第五次信息技术领域的重大技术革命。人机交互的发展主要体现在交互理念的变化及交互设备的升级,而交互设备的升级需要重点关注:(1)体感设备逐步标配化中的爆发式增长机会;(2)移动互联网高速发展下可穿戴智能设备的市场空间;(3)多模智能交互设备的发展趋势。

人机交互设备市场规模增长前景广阔,2014年全球规模将达千亿美金。细分领域的投资价值:首受其益并且潜在投资价值最高的是智能电视,截至到2014年底市场规模将达到400-700亿;目前应用最广泛的是游戏,潜在规模将达到200亿;与市场关注热点最紧密联系的是医疗穿戴和3D打印,预计市场规模分别将达到30亿和120亿。

投资逻辑:人机交互技术产业的投资主要在于供应链本土化及交互技术的应用:其一,体感技术的全套方案应用提供商成为投资首选,中长期受益最大;其二,体感技术应用平台提供商,包括智能电视平台提供商及智能语音平台提供商;其三,体感应用提供商及体感配件供应链的本土化;

 

而体感应用提供商及体感配件供应链的本土化逻辑如下:①体感应用提供商中长期受益:可穿戴消费类电子、游戏设备及医疗领域应用的普及;智能终端的渗透率提升,最终成为标配模块;②供应链本土化:激光探测器、摄像头、红外LED、红外带通滤光片、通讯模块、语音识别及人脸识别等传感及识别类潜在供应商或给国外企业及国内效仿产品供货;③潜在应用提供商:金融、工程、虚拟雕刻、全息投影、3D打印等领域的商业化;(4)全球体感技术龙头企业。

推荐组合:

(1)首推体感技术全套方案提供商数码视讯;

(2)体感技术应用平台提供商:乐视网(智能电视平台提供商)和科大讯飞(智能语音平台提供商);

(3)体感技术应用提供商及供应链的本土化:光迅科技(国内光器件产业龙头)、水晶光电(全球窄带滤光片领先企业)、同洲电子(体感装置集成商);

(4)全球体感技术龙头:Leap公司(全球体感设备领先企业)、InvenSense 公司(全球体感技术行业龙头)。

 

人机交互专题报告-编程之家

 

一、人机交互技术的变革和发展趋势

 

1、人机交互基本概念

人机交互(Human-Computer Interaction,HCI)主要是研究人和计算机之间的信息交换,它主要包括人到计算机和计算机到人的信息交换两部分。是与认知心理学、人机工程学、多媒体技术、虚拟现实技术等密切相关的综合学科。人与计算机之间的信息交换主要依靠交互设备进行,主要包括(1)人到计算机的交互设备:键盘、鼠标、操纵杆、操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、以及压力笔等;(2)计算机到人的交互设备:打印机、绘图仪、显示器、头盔式显示器、以及音箱等。

人机交互的交互技术分类:(1)基本交互技术;(2)图形交互技术;(3)语音交互技术;(4)体感交互技术等。

 

2、人机交互的三次革命:鼠标–>多点触控–>体感技术

科技与需求双轮驱动下的人机交互三次革命。随着信息技术的高速发展,人机交互技术实现了三次重大革命,(1)鼠标;(2)多点触控;(3)体感技术。

鼠标:苹果设计的世界第一款大众普及鼠标“Lisa”,它在位置指示上比键盘更加人性化,是“自然人机交互”的始祖,随后鼠标逐步成为计算机的标配;

多点触控:苹果将多点触控推向大众。颠覆了传统的“交互模式”,带来全新的基于手势的交互体验。

体感技术:Kinect被誉为第三代人机交互的划时代产品。它利用即时动态捕捉、影响识别、麦克风输入、语音识别等功能,实现了不需要任何手持设备可进行人机交互的全新体验。

 

3、人机交互的发展趋势:理念变化与设备升级并行

从历次人机交互革命来预测人机交互的发展趋势,人机交互的发展主要体现在交互理念的变化及交互设备的升级,(1)交互理念:①被动接受信息—>主动理解信息;②满足基本功能—>强调用户体验。(2)交互设备:主要取决于输入、输出的变化,①方式自然化;②内容多样化。

智能交互技术:基于大数据和云计算推动下的人机交互技术是发展大趋势,通过对交互数据的大量处理形成“交互素材”数据库,搭建智能交互云平台,在此平台下用户和计算机通过各种设备实现自然的交互行为。

 

二、交互设备的发展趋势和应用展望

从鼠标、键盘等传统交互技术到触屏、语音控制、体感控制、眼球控制等高级交互技术,用户交互体验的升级主要依赖于交互设备的发展。我们认为,人机交互设备的发展重点关注:(1)关注体感设备逐步标配化中的爆发式增长机会;(2)关注移动互联网高速发展下可穿戴智能设备的市场空间;(3)关注多模智能交互设备的发展趋势。

 

关注一:体感设备逐步标配化中的爆发式增长机会

体感交互设备:是一种通过用户的手势、肢体动作等动作与周边的装置或环境互动,而无需使用任何复杂的控制设备。肢体所做动作会被体感传感设备感知,并通过数据处理和算法得知人体具体动作轨迹并反映在装置或环境中,通过体感设备无需接触即可与虚拟空间进行互动。

体感交互发源于游戏行业,近几年得到高速发展:

Wii:体感控制设备的概念最早来源于日本任天堂公司于2006年11月推出的Wii家用游戏机,自Wii推出半年后便占据游戏机市场销量第一的宝座,1年后实现600万台主机和1700百万片游戏软件。

Wii包含两部分硬件:放在电视机前的传感器和握在手中的控制器Wii remote。通过Wii remote顶端配置的CMOS镜头探测传感器两侧的红外线发光源来确定自身运动轨迹,并借助自带陀螺仪测算加速度,实现体感控制。

PS move:索尼于2010年9月推出自主研发的体感游戏设备PS move;

Kinect:微软在2010年11月推出体感游戏设备Kinect,Kinect是目前市场上效果最佳的体感设备,其硬件设备主要包括红外投影机、用于脸部识别和全身定位的摄像头、用于语音解释的麦克风和空间定位的深度传感器。Kinect上市后短短2个月便售出800万台,超过了苹果iPhone、iPad同等上市时间内的销售数字,截至去年1月Kinect累计售出1800万台。

 

人机交互专题报告-编程之家

 

Leap Motion:由美国Leap公司开发并于2013年推出的面向Windows PC及Mac平台的体感设备,包括一个类似U盘的可连接电脑的传感器和一套复杂的软件平台。Leap公司三年市值达5亿美元。

工作原理:采用红外LED照亮传感器上方的一片区域(约25-600毫米约0.23立方米空间),此时手部在覆盖区域的动作将被模拟人眼的双摄像头捕捉,将手部位置的实时数据通过高速USB通讯芯片反馈给终端,从而分析出手势的变化并反应在操作中。类似于Kinect工作原理基础上,精确度提高到0.01毫米以内,时间延迟只有5-10毫秒,用户丝毫觉察不出这极短的延迟,体验到的只有动作同步的流畅

应用领域广阔:本地系统包括几乎所有一切具备独立运算能力的设备,包括PC、笔记本电脑、平板电脑、车载电子设备、智能手机,因而Leap Motion应用领域也不仅限于游戏、医疗,也可以是金融、工程、虚拟雕刻、全息投影等领域。

体感交互革命将打开数千亿级人民币市场空间:未来体感控制设备将成为计算机、智能电视机、平板电脑以及智能手机等设备的标配,潜在市场空间将超过数十亿台,平均单价以400元计算,市场空间也高达数千亿人民币市场空间。

 

关注二:可穿戴设备未来几年进入百亿美元市场

可穿戴设备简介

可穿戴技术:主要探索和创造能直接穿在身上、或是整合进用户的衣服或配件的设备的科学技术,利用该技术可以把多媒体、传感器和无线通信等技术嵌入人们的衣着中,可支持语音控制、手势控制等多种人机交互方式。基于可穿戴技术的智能交互设备称为可穿戴智能设备。

可穿戴设备分类:可穿戴设备主要分为可穿戴消费类设备、可穿戴企业和通用设备、可穿戴医疗保健设备、可穿戴工业和军事设备等四大类。目前可穿戴设备产品主要集中在健身及保健、信息、医疗及卫生保健、以及工业及军事四个领域。

人机交互专题报告-编程之家

全球可穿戴设备频发,催生产业链将持续高景气:可穿戴智能设备作为继智能手机、平板电脑等智能终端之后的重要创新方向,随着Google Glass、iwatch、智能腕带、以及可穿戴心脏监测设备等明星产品的陆续推出,逐渐引起关注并成为市场热点。近期,多款产品陆续发布引起市场较高关注度:

9月4日,三星在德国柏林国际消费电子展(IFA)上发布智能手表Galaxy Gear,其搭载1.63英寸屏,800MHz单核处理器,接听电话、发短信,支持S Voice语音控制;

9月4日,高通在2013 Uplinq大会上发布智能手表Toq,其可借助专用应用和蓝牙与Android智能手机相连接,可接听电话、查看短信和通知信息,还可以控制音乐播放、天气、股票信息等功能。

 

全球可穿戴设备市场规模持续扩大。根据IMS Research数据显示,自2012年开始可穿戴设备出货量复合增速64.96%,可穿戴设备市场的出货量2011年是1400万台,到2016年会增加到增长到1.71亿台。据ABI Research预测,2018年可穿戴设备年出货量将达到4.85亿台。据Gartner预测数据显示到2016年穿戴设备市场规模将达100亿美元。我们认为,支撑可穿戴设备爆发式增长的基础已具备,主要有以下三点:

①用户基础:用户需求的爆发式增长,主要集中在消费类可穿戴智能终端,并逐渐向医疗与保健等其他领域延伸;

②平台基础:移动互联网的高速发展为可穿戴智能终端搭建好运行平台,使其成为继智能手机之后的新一代移动智能终端;

③内容基础:App应用程序量及下载量的飞速增长。根据Gartner统计数据,预计到2016年,全球App下载次数会达到3000多亿次,其中,免费应用的比例93%。

 

关注三:多模态交互设备的发展趋势

多模态交互设备是语音交互、体感交互、及触控交互等多种交互模式并行的交互设备。基于多模态交互设备的人机交互:通过交互设备中的多种跟踪模块(人脸、手势、姿态、语音、及韵律)采集用户信息,并理解、处理、及管理后形成虚拟用户表达模块,与计算机进行交互对话,能够极大提升用户的交互体验。

谷歌眼镜引领多模交互时代到来。2012年4月,谷歌公司发布的一款“拓展现实”眼镜,它具有和智能手机一样的功能,可以通过声音控制拍照,视频通话和辨明方向以及上网冲浪、处理文字信息和电子邮件等,通过眼睛对各种功能进行选择。

 

四、人机交互产业链分析:感知技术成为人机交互发展瓶颈

从人机交互过程来讲,可分为四步:通过传感器直接或间接与人接触获得感知信息;通过建立模型对感知信息进行分析与识别;对分析结果进行推理达到感性的理解;将理解结果通过合理的方式表达出来。以上四步构成了人机交互的全过程。

从功能实现看,人机交互作为一个闭环的模式识别系统,应该包括感知信号的获取、感知信息的分析与识别、感知信息的理解和信息表达等功能四个环节。当感知信息与标准信息存在差异时,将发出指令给予修正或反馈信息给予告警和提示。在这四个方面的环节中,从功能实现角度看,感知信息的识别和感知信息的理解是核心技术的关键所在。

从技术实现过程看,信息获取和信息识别环节属于感知层的范畴,而感知信息的理解和信息表达属于应用层的内容。交互设备实现信息的获取,而嵌入芯片实现信号的模式识别,然后通过后台计算机或分布式计算平台建立数学模型、提供强大的运算系统,从而实现感知信息的理解,最后转入应用层,调用相关应用程序,满足用户的最终需求。从信息技术的成熟度而言,感知技术比网络技术、计算机硬件和软件技术的发展要滞后许多,潜在市场空间也将数倍于其他三个环节,所以感知技术已成为人类运用信息技术深入探索和认识客观世界的瓶颈。

 

人机交互专题报告-编程之家

感知技术、智能识别、云计算、大数据是实现人机交互的智能化的前提和基础。其中,感知技术是实现人机交互的信息非失真采集的重要环节。

感知设备是信息获取的关键环节:体感传感器工作原理主要是通过双摄像头模拟人眼捕捉经过红外LED或红外激光照射手部、姿态、人脸等部分影像,利用双摄像头的视觉差分析手势、姿态等部位的变化;

智能识别的核心是数学模型和软件实现:常见的智能识别包括手势识别、骨架识别、语音识别、表情识别、眼部识别、情感识别等,其核心是数学模型的建立和软件实现,并具有自学习、自适应的闭环控制功能。

以云计算为基础的信息存储、分享和挖掘手段,可以经济地、有效地将这些大量、高速、多变的终端数据存储下来,并随时进行分析与计算。

大数据的核心是预测,通常被视为人工智能的一部分,它是把数学算法运用到海量的数据上来预测事情发生的可能性。

 

感知层一:传感设备

 

摄像头:

 

上世纪末兴起的终端产品数码化热潮,掀起光学镜片和摄像头发展的新一页。DVD播放器、数码相机及智能手机等消费电子产品的需求日益扩大,使光学镜片和摄像头的需求迫切。而生产光学镜片的入行门槛是相当高的,大多厂商都需要具备长时间的技术积累,是集技术密集、资本密集和劳动力密集的产业,目前,亚洲主要的摄像头零件及光学膜供应商主要包括:凤凰光学(600071)、欧菲光(002456)、水晶光电(002273)、康得新(002450)、裕兴股份(300305)和香港的舜宇光学,台湾的大立光电、亚洲光学、今国光学、玉晶光电以及日本的Enplas、Kanto、Konica和Hoya。其中水晶光电作为全球唯一两家生产红外窄带滤波片的生产厂家之一,将积极主动布局人机交互传感设备产业链。

德国和日本生产商是光学镜头和摄像头市场的先驱,但由于最年竞争加剧和降低生产成本的压力上升,不少摄像头现在都是在中国大陆和台湾地区,以订单方式进行,因此,中国已成为镜片和摄像头主要的国际生产中心。

红外LED:

可能限制体感技术发展的因素中,最重要就是3D测量,具体体现在光路设计,一般体感交互都采用红外LED作为信号采集源光源,普通的的红外线LED外形和一般的可见光LED相似,但却是发出红外线。根据红外LED芯片的特性,依据不同波长可以得到更广泛的应用。

 

目前红外LED高端产品几乎都从国外进口,主要红外LED制造商有台湾的光磊科技(2340.TW)、鼎元光电(2426.TW),德国的西门子,国内的公司主要有联创光电(600363)和深圳奥德伦科技(非上市),其中联创光电专注于红外LED市场,其募资投向就有红外LED器件产业化项目,其用于夜视系统中的主动红外摄像技术,与体感交互设备的红外成像原理一致。伴随着体感交互设备发售预热,公司的市场关注度也有望逐步提升,公司募投加码红外LED领域,潜在进口替代优势凸显。人们通常认为,红外LED是一个很小的市场,中国地区500家大型LED厂商中只有20%在生产红外LED,而且多数厂商红外LED产量只占其总产量的10-20%。事实上,由于电子和工业领域方面的需求仍然强劲,产业普遍预期红外LED产业将继续稳步发展,生产厂商的数量也将大幅增加。

芯片:

目前以Leap Motion为代表的人机交互传感设备,通信芯片需要实时的将所拍摄的视频流信息传到智能终端,识别芯片需要通过复杂的算法将用户动作含义提取出来,所以芯片可以说是整套体感设备的“神经中枢”,极具重要地位。一般人机交互设备存在两种工作模式:一是利用智能终端本身的独立运算能力将视频流信息分析得出用户手势动作信息,整个过程只需通信芯片这一高速的传输媒介;二是拥有专门的感应芯片,获取和处理用户的操作信息。无论是哪种芯片,目前绝大部分都是源于进口,技术要求过高以至于国内很少有公司能设计出满足客户要求的芯片,更多的是采用为国外厂商代工的商业模式。

新岸线作为大陆唯一具有自主研发的通讯和计算能力的芯片提供商,在2013CES发布了采用3D手势操控的电视机顶盒CubeSense Box,为智能家庭和互动娱乐带来最具科技想象力和经济可行性的解决方案。CubeSense Box亮点之一就是摆脱了传统遥控器,利用人体3D手势实现对电视界面的远程操控,其奥秘就在于内部配置了一颗高精度的深度感应芯片CubeSense。该芯片由新岸线自主设计研发并具备全部专利,基于人类双目视觉的立体成像原理,突破性地仅采用两颗普通的摄像头就实现对3D空间中人体手势的感知。CubeSense Box另一亮点在于其整体方案的完整性,已经实现深度感应芯片与双核ARM A9 CPU芯片的硬件整合,因而无需另外再接高性能、高功耗的其他主控芯片。

麦克风:

麦克风一般包括两种:传统的驻极体麦克风和新兴的MEMS麦克风。目前,实际使用的大多数麦克风都是驻极体麦克风(ECM),这种技术已经有几十年的历史。为了给用户带来全新的体验和独特的人机交互方式,越来越多的产品开始采用MEMS麦克风,取代传统的ECM。以智能手机为例,智能手机制造商正在它们的产品中增加更多的MEMS麦克风来支持更先进的功能,如语音输入和噪声抑制,这一功能对支持语音输入的智能手机来说是至关重要的,如iPhone的Siri。iPhone领先采用了MEMS麦克风技术,并一直在稳定增加使用的MEMS麦克风数量,从iPhone 4S的2颗麦克风架构到iPhone 5背部采用3颗MEMS麦克风来实现高清晰度视频录影,以增强产品的竞争力。据iSuppli数据显示,去年全年MEMS麦克风出货量在20.5亿颗左右,同比增长57%。预计今年出货量将在26.6亿颗的水平,未来三年内快速增长势头不减,到2016年达到46.5亿颗。

目前MEMS麦克风供应商主要分布在欧美国家,集中度较高,前五大企业分别为意法半导体、Knowles Electronics(楼氏)、AKM(旭化成)、InvenSense和TI。目前国内唯一进入全球前十的MEMS麦克风供应商为瑞声科技(AAC),主要产品为MEMS麦克风,国内上市公司共达电声(002655)和歌尔声学(002241)也是MEMS麦克风生产商。MEMS麦克风是国内MEMS发展较快、规模较大的主要品类,未来几年也将跟随行业高景气进一步扩张规模。

MEMS传感器:

MEMS传感器属于高端传感器,是目前火热的穿戴设备产业链中的非常重要的一环。MEMS又名微机电系统,主要包括传感器和执行器两类,广泛应用于汽车、智能手机、平板和人机交互设备。目前,各类传感器功能性的融合将成为传感器的发展方向,未来可穿戴终端产品的前景也将取决于传感器等产业链上游技术的提升,MEMS创新应用将是人机交互不断深入的源泉。

我国传感器行业发展落后,国内传感器需求,尤其是高端需求严重依赖进口,国产化缺口巨大,目前传感器进口占比80%,传感器芯片进口占比达90%。国产化需求迫切。

中国传感器的市场近几年一直持续增长,增长速度超过15%。2012年中国传感器应用四大领域为工业及汽车电子产品、通信电子产品、消费电子产品专用设备,其中工业和汽车电子产品占市场份额的42%左右,市场规模达到160亿元,传感器整个市场突破500亿元。

我国传感器尽管市场需求高,发展迅速,但是也存在着技术水平偏低、种类欠缺,研发能力差等问题。我国目前有1688家企事业从事传感器的研制、生产和应用,但从事MEMS研制生产只有50多家,而且规模和应用都较小。在国际市场上,德国、日本、美国、俄罗斯等老牌工业国家的企业主导了传感器市场,许多厂家的生产都实现了规模化,有些企业的年生产能力达到几千万只甚至几亿只。相比之下,中国传感器的应用范围较窄,更多的应用仍然停留在工业测量与控制等基础应用领域。

 

感知层二:本地系统处理(软件算法)简介

手势识别:

当前,人机交互技术已经从以智能终端为中心逐步转移到以用户为中心,是多通道、多媒体的交互技术。手势是一种自然、直观、易于学习的人机交互手段,以人手直接作为智能终端的输入设备,人机间的交互将不再需要中间媒体,用户可以简单地定义一种适当的手势来对周围的机器进行控制。

基于手势识别的人机交互,是一个利用摄像头采集手势局部图像特征来进行描述、识别和控制的过程。具体来说,手势交互的基本流程为:首先通过摄像头拍摄手势图像视频流,将视频流转化成图像帧;接着从图像中根据特定的算法提取出手势的形状、特征和位置信息,建立分类准则对手势进行识别;再跟据手势形状和位置进行坐标或者动作命令映射,以得到特定的系统命令;最后根据需求驱动一定的系统动作。具体流程图如下图所示。

 

人机交互专题报告-编程之家

姿势识别:

姿势是身体的某一部分和其他部分之间的一种静态关系。身体及各个关节点的位置定义了一个姿势,即关节点之间的相对位置就能确定一个姿势,姿势的类型和复杂度与识别算法的复杂度成正比。可以通过关节点位置的重叠交叉或者关节点之间的角度进行姿势识别。

以微软2010推出的Kinect为例,说明姿势识别的工作原理:Kinect传感器有三个镜头,中间一个RGB彩色摄影机,左右两边镜头分别为红外线发射器和红外线CMOS摄影机所构成的3D结构光深度感应器。该传感器通过黑白光谱的方式来感知环境,探测出物体到传感器的物理距离。它收集视野范围内的每一点,并形成一幅代表周围环境的景深图像,接着Kinect对景深图像进行像素级评估,来辨别人体的不同部位,采用分割策略将人体从背景环境中分离,再通过人工智能系统来处理大量的数据,识别手、脚及身体的其他部位,最后根据追踪到的20个关节点来生成一幅“数字骨架”。之后无论当你向左或向右移动甚至跳跃时,你的“数字骨架”都会保持一致的动作,就像照镜子一般,此姿势识别的交互体验相比之前游戏控制器的自由度拓展了非常大,一般游戏控制器的自由度都是预先设定好的,比如键盘、鼠标、更多自由度的遥杆、带重力感应的手柄及更为先进的数字手套,而Kinect的骨架跟踪系统可以实时跟玩家的运动保持一致,,这其中的自由度和变换是无法穷举的,这也给姿势识别应用创造了无限遐想的空间。

今年7月17日,英特尔用4000万美元收购了以色列姿势识别软件开发商,以增强自身在感知计算方面的实力。虽然Omek并不开发传感器,但是英特尔的目标是尽可能兼容各种设备,使开发者把Omek的手势识别和姿势跟踪技术运用到生活和游戏上面。

 

语音识别:

2008年之前,从事语音技术研究还停留在学术研究领域,掌握语音核心技术的包括清华大学、中科大、中科院声学所、中科院自动化所等大学科研单位。从2008年开始,伴随移动互联网的快速发展,语音识别才真正形成了一个产业,另外,借着云计算的春风,大大释放了语音识别引擎的负荷压力,使得语音识别应用更具可行性。

2011年10月4日,iPhone 4S对外发布,其中新添了一款让用户倍感新奇的功能软体——Siri,大受用户欢迎,瞬时掀起了一股智能语音识别浪潮。这是一款智能语音识别软件,通过它用户不再需要一层层打开App寻找目标应用,只需对着iPhone说话,就可以让其实现短信查收、拨号,甚至是地图搜索、天气预报、航班查询等不可思议的功能,真正将iPhone变成了一个智能机器人,你的声音就是对它的命令。

国内语音识别产业相关公司主要分两种:1)独立的语音技术提供商,如科大讯飞、云知声、灵声科技、智能360等;2)互联网平台公司,如百度、搜狗、腾讯、阿里等。

表情识别:

表情识别是人机交互与情感计算研究的重要组成部分。由于人脸表情包含丰富的行为信息,因此对人脸表情进行识别有利于了解人类的情感等心理状态,从而促使人机交互更加有效、更加人性化。表情识别涉及心理学、社会学、人类学、生命科学、认知科学、生物学、病理学、计算机科学等众多研究领域,可见,表情识别的进展对提高人工情感智能水平和改善人机交互系统具有重大意义。

表情识别的模型为:识别人脸表情既而感知人的情感和意图,再生成与之对应的表情与人进行交互。现在对于识别表情既而感知人的情感和意图的技术探究愈发活跃,主攻技术方向主要包括3部分:表情数据库、表情特征提取及表情分类方法。

 

2010年卡梅隆用顶尖的CG和3D技术创造了天神下凡似的巨作《Avatar》,顿时红遍全球,英特尔则紧跟时代潮流,趁热打铁推出了一款“Avatar表情模拟”嵌入式技术:当用户自拍时通过Vedio算法,抽象化人脸表情,生成一个虚拟的头像,当你紧皱眉头的时候,你的虚拟头像也在紧皱眉头,当你微笑的时候,它也在微笑,从而将你的喜怒哀乐表情淋漓尽致地体现在虚拟头像上。有了这项表情交互技术,当用户视频聊天时,如果不太想让对方看到自己的真实长相,可以通过该技术发送虚拟头像,这样可以更好地保护自我隐私。

眼部识别:

随着数字图像处理技术在计算机视觉、模式识别和人工智能领域的应用逐步扩大,眼球作为人体的重要器官和人物体征之一,包含着非常丰富的信息,许多基于眼部识别的系统大量出现,目前已经应用与生物识别、医疗辅助和人机交互等领域。

眼部识别是指以静态图像或者动态视频流为对象,通过识别算法检测或识别出眼球的位置区域、虹膜信息、瞳孔中心甚至视线方向等眼球相关信息。市场应用实例方面,三星Galaxy S4的Smart Pause智能暂停和Smart Scroll智能滚动赚足了市场眼球,这两个技术都是利用眼部识别就行控制,其中智能暂停主要用于手机观看电影等视频时,前置摄像头将跟踪用户眼球来判断用户是否注视着屏幕,一旦视线离开屏幕,系统就判定用户不在观看或已离开,从而自动暂停视频播放。三星在加强硬件性能和丰富软件种类的同时,还不断在人机交互上追求智能化、人性化,引领着终端创新的潮流。

情感识别:

随着互联网特别是移动互联网的飞速发展,人们日夜与电脑、手机为伴,“人-人互动”逐渐减少,“人-机互动”不断增多,相应地,人们对人机交互技术也提出了更高的要求,即情感需求。因为人类之间的交流与沟通是自然而富有情感的,因此人们期望与之交互的机器也具有类似于人的观察、理解和生成情感特征的能力。随着情感计算等技术的不断发展,情感交互成为高级信息时代人机交互的主要发展趋势,如下图所示。

人与人进行交流时,是通过人脸表情、语音情感、肢体动作等来感知对方的感情。因此情感交互可以从人脸表情交互、语音情感交互、肢体行为情感交互、生理信号情感识别等方面进行探索。

 

应用层:人机交互应用前景广阔,全球2014年将达千亿美元

智能终端,人机交互的载体

人机交互这个词或许对大多数一点都不陌生,生活中到处都能看到与机器系统的操作、控制甚至对话,可以说是比比皆是,比如人们通过电话与对方通过,或者是智能手机系统中不断重复的“会说话的Tom”,但是这其实只是人机交互的低端层次,真正意义上的人机交互应该是人与机器之间的交互、互动,人机交互系统中很关键的一步是系统对用户的理解,并能够智能地反馈用户,这时的交互界面将是用户友好的,而像前者所提及的手机及智能游戏只是用户与机器之间实现初步的“通话”,并未实现真正的互动,双方真正地交互要求用户发出一系列的指令,而机器能按顺序逐一理解并完成所指定任务,这才是真正的人机交互。

近年来人机交互最为广泛的具体实施载体即为智能手机,中国互联网络信息中心调查显示,截至2012年12月底,我国手机网民达到4.2亿户,占国内全部网民的74.5%,比2011年上升了7.5%,中国也继美国之后成为全球第二大移动应用市场,拥有应用商店60多家,其中最大的应用商店Apple iTunes中应用软件数量多达80多万,下载量更是突破了500亿次。在应用商店和开放的应用开发平台的经营模式下,基于移动互联网的手游、电商、音乐、影音、评价等领域的商业价值被快速挖掘。

自智能手机1996年面世以来,截至2012年底,全球智能手机用户数量超过了15亿部,也就是平均五个人就有一部智能手机,同时智能手机市场还存在着巨大的增长潜力,尤其是在发展中国家,如中国、印度和非洲国家,预计到2015年,智能手机用户将突破35亿,这种普及程度使得利用手机联入移动互联网的用户越来越多,触摸控制、语音识别、体感操控等新型人机交互应用也应声推成出新,以智能语音市场为例,预计到2013年年底,中国市场智能手机用户将突破8亿规模,以平均每款智能语音软件5元/款估算,2013年中国智能语音市场至少将达到40亿元的市场规模,2015年全球智能语音市场至少将达到175亿元。

体感交互是继云计算、大数据之后的又一次科技革命,典型代表Leap Motion首先即从PC终端开始刮起这阵革命旋风。美国Leap公司开发的面向Window PC及Mac平台的体感设备Leap Motion于今年7月22日发售,其工作原理与微软于2010年推出的Kinect类似,但技术更为先进,性能更是Kinect的200倍,精确度提高到了0.01毫米,时间延迟只有5-10毫秒,让用户丝毫感受不到有任何的控制延迟,有的只是动作同步的流畅。

Leap Motion将体感引入到PC、笔记本、平板、智能手机领域,这给予了PC游戏另一广阔的体验渠道,更强调用户与游戏间的互动,不同于以往游戏的二维操作方式,拓宽了年轻一族PC游戏的操作方式和品种款式,极大地满足了他们对新鲜体验的需求。目前Leap Motion已与HP、华硕部分高端机型达成了捆绑销售的合作,预计如果Leap Motion成为PC和智能电视的标准配置,实现类似于触摸屏的技术革新,市场规模将达到400-700亿。

今年5月7日,乐视超级电视在五棵松万事达中心全球首发,与之前其他的电视类产品不同,乐视超级电视集硬件、软件和内容完美结合,是一款真正意义上的智能电视,同时具有超高的性价比。除了电视、上网功能的完美结合外,乐视还集成了目前最先进的智能语音交互技术,用户通过带有麦克风的遥控器,就可以轻松自然地实现操控、输入、搜索等功能。该项语音交互技术由第三方语音企业云知声作为外援提供技术支持提供,从现场的演示效果来看,语音识别准确度和识别效率都已达到很高的水准。另外,乐视还配套推出Pro Xtion体感套件通过顶置USB接口与超级电视兼容,可以利用红外线感应器与Prime Sense可调整深度侦测技术进行精确画面捕捉和追踪使用者的实时动作,实现手势侦测和全身侦测,让用户直接在超级电视上玩体感游戏,并支持多人游戏识别功能。

 

乐视网作为互联网企业敢于挑战目前似乎固若金汤的电视行业,说明智能电视已成为互联网企业觊觎的猎物,不仅乐视,阿里巴巴、PPTV、小米等也推出了机顶盒产品,而在此布局更早的谷歌、苹果也早已瞄准了智能电视这块“肥肉”。

引入语音识别或者体感技术的智能语音电视不仅能听懂用户说话还能迅速作出反应,甚至是直接与用户对话。用户凭借语音指令、手势操作可以轻松完成音量调节、换台操作、电视节目查询、游戏操控、网络浏览搜索、文字输入等服务,还可以提供天气、股票、航班、热点新闻等信息,让用户“自由自在”看电视。据预测,2013年智能电视出货量将达到1500万台,2016年智能电视出货总量将超过4000万台,智能电视存量将超过1亿,年度市场规模将超过1200亿元。

高形态人机交互提升康复效果,保障治疗洁净度

传统的康复医疗既枯燥又乏味,不但会引起患者的厌烦情绪,更影响康复医疗的疗效,相比而言,融合体感交互、语音交互、视控交互等的人机交互的互动机制和沉浸感受却可以使患者沉浸在另一个虚拟的世界中,在交互的过程中通过采集患者的动作、语言形成康复信息数据库并及时反馈医者来调整或监督康复训练。例如,针对运动障碍患者肢体运动不便,认知障碍患者在空间认知、智力和记忆上存在障碍,鼠标、键盘等传统输入设备不适用的特点,可以开发基于Leap Motion体感技术的运动功能康复训练模块、空间认知障碍康复训练模块、智力障碍康复训练模块和记忆障碍康复训练模块,实现医疗康复训练的评估与指导,这对于患者早日顺利康复将起到非常重要的作用。

在介入放射学等治疗中,影像引导在外科医生的工作中起着关键作用,然而由于消毒问题,外科医生必须避免接触鼠标、键盘等输入设备,这就不得不借助“代理”来浏览数字影像,也就是通过手术小组的其他成员找到合适的影像进行平移或缩放来辅助主治医生,这非常枯燥而且浪费时间,而基于语音识别和体感交互等非接触型互动解决方案则恰好能为外科医生解决这方面的困惑,让外科医生重获对他们所依赖的关键数据的掌控权,来真正改善病人护理和临床治疗效果,这也是Leap Motion等体感设备除了游戏娱乐之外的价值体现。

 

此外,随着人居环境的日益恶化、食品安全的日益担忧,越来越多的人开始关注自己的健康,而可穿戴医疗保健设备恰恰能够实时监测个人的健康状况,并可以形成系统的个人健康信息数据库。因此,随着穿戴式血压测试仪、无线血糖测试仪、胰岛素泵和心率检测器等典型产品的广泛应用,医疗保健领域一直被业界认为是可穿戴设备市场最大的市场之一,据Frost&Sullivan预测,2015年中国智能穿戴设备市场规模可达26.1亿元。

刷新游戏体验新方式

电子游戏最开始的输入方式来自于计算机键盘,后来衍生出的专业电子游戏机以手柄或操作台的形式来进行电子游戏内容。后来,随着科技进步以及增强玩家游戏体验的需要,相关的游戏公司开发出了专业化,特异化的游戏输入设备,当下最潮的游戏体验方式非体感游戏莫属。很多游戏玩家之所以喜欢甚至沉迷于游戏当中,在乎的就是那种体验,那种身临其境、闯关杀敌的畅快感觉,而体感游戏就是通过控制手势、肢体、语言来感受电子游戏,和传统的键盘手柄游戏绝对是完全不同的感受,肢体在空中所做动作通过体感传感设备被获取,并通过数据处理和算法得知人体具体动作轨迹实现动作解读理解,并最终按照玩家的“指令”反馈在游戏中,通过体感设备无需接触即可与虚拟游戏进行互动。

体感游戏的概念最早来源于日本任天堂公司于2006年11月推出的Wii家用游戏机。自Wii推出半年后便占据游戏机市场销量第一的宝座,这也使得索尼和微软深切感受到体感技术的革命性,两者分别在2010年9月和11月先后推出自主研发的两款体感游戏设备PS move和Kinect,其中Kinect上市后短短2个月便售出800万台,超过了苹果iPhone、iPad同等上市时间内的销售数字,截至去年1月Kinect累计售出1800万台。上个月,美国Leap公司开发的面向Windows PC及Mac平台的体感设备Leap Motion更是在微软Kinect的基础上更进一步,将性能提高到极致,给予用户更完美的体验感受。

 

未来,更多的体感游戏将采用嵌入式应用,以嵌入式技术为手段,以智能电视、高清电视、机顶盒为硬件平台,搭建嵌入层,并把体感游戏植入各种机型电视机平台,为不同电视机平台全方位解决嵌入式体感游戏方案。

新型人机交互方式向商用领域“浸润”

今年4月10日-12日,第一届中国电子信息博览会在深圳举行。由工业和信息化部指导,19家单位联合发起成立的中国语音产业联盟组团参展,将神奇的智能语音体验带到了现场,全面展示了智能语音技术在移动互联网、教育、智能电视、车载终端、玩具等方面的新产品、新应用,这也预示着新型人机交互方式已经向商用领域“浸润”。

在车载环境下,用户的注意力主要集中在驾驶,人与车的交互必须在不影响驾驶的前提条件下进行,这给体感交互、语音交互等新型交互方式提供了广阔的应用空间。今年年初,现代汽车公司在其推出的一款概念车中配备了车载音频手势控制系统,其中驾驶员可以通过手势来控制音量。丰田和微软也正在联合研究这种汽车技术。另外,沃尔沃汽车公司为其概念车配备了相关的汽车感应系统,其中该感应系统可以通过红外摄像机实时监测驾驶员视线方向,系统在感应到驾驶员视线落在车载中控显示屏上时,系统会自动将车载中控显示屏点亮。同样,语音识别技术也可以提供安全便捷的交互方式,用户只需动口,就可以满足在行车过程中的相关需求。以国内年销2000万辆汽车,20%的替代覆盖率测算,体感技术授权按500元/辆,语音技术授权以30-50元/辆测算,市场规模合计将达到20亿,预计到2016年配备智能交互的汽车出货量将达到1500万辆,存量接近3000万辆,年度市场容量将达到200亿。

人机交互技术应用非常广泛,不单单是前面提到的手机、电视、玩具、汽车等领域,也包括即将兴起的智能客服、智能订单、智能营销等智能语音服务。随着互联网的发展,许多企业客服放到互联网上,比如QQ、微信、旺旺,现在都是键盘交互,以后可以通过语音交互,减少人工客服成本。这些与语音工具进行实时对话的应用,属于在线应用(B2C)。另一个非常重要的应用领域是离线应用(B2B)。离线应用是通过与大数据技术的结合,对海量语音数据进行处理、挖掘和分析,开发和利用其中的价值。语音数据也是大数据,比如呼叫中心,每天的电话数据非常惊人,随着中国人口红利的消失,呼叫中心的智能化日益迫切。据Ascent Group 2010年IVR研究报告,2016年电信、金融、电力等重点行业呼叫中心市场规模预计达到30万线以上,这些数据如果不能被有效处理,就无法被应用,反之如果利用语音识别技术将这些数据转化成文字等符号性表示,就可以被进一步地挖掘、检索和利用。这么做存在两方面的价值,一是监控客服质量,提高企业服务水平;二是语音分析,通过语音识别和数据挖掘技术,可以更全面地了解实际情况,从而帮助决策层和管理层进行科学研判和趋势预测。

虚拟交互技术开创信息技术革命第三纪元

与智能终端的结合只是体感革命的开始,其真正划时代的跨跃在于嵌入全息投影的应用,届时隔空打字、空间操作、虚拟雕塑、模拟手术等全新概念将不仅停留在想象之中。随着体感设备控制度的进一步可靠精准,未来医护培训可以借助三维全息投影将虚拟治疗对象投影在手术台上,受训人员对其进行扎针训练甚至手术治疗,电脑终端实时监测操作步骤及操作位置,并对受训人员操作准度进行统计测评;另一方面,在真实手术过程中医生不需要反复脱带手套便可直接隔空操作医疗仪器,提高手术时效性和洁净度。

通过微型投影、体感技术、环绕音响和MEMS传感技术的融合,完全可以生成一个逼真的,集视、听、触等多种感知的虚拟环境,用户通过使用各种交互设备,同虚拟环境中的实体相互作用,使之产生身临其境感觉的交互式视景仿真和信息交流,此虚拟交互加强了人们对数字化内容的理解,在给予人们真实感受的同时,使人能从数字化虚拟中得到更加丰富准确的信息。展望未来,虚拟交互将与人类更加贴近,对应的应用服务也必将日趋多元化,从而影响到生产制造、娱乐生活的方方面面。假如说PC开创了信息技术革命时代的第一纪元,互联网开创了信息技术革命的第二纪元,那么这第三纪必定属于虚拟交互技术。

 

五、投资策略:体感交互市场空间大,美股概念股先行

 

投资思路一:关注全球体感技术龙头公司

历次人机交互的重大变革伴随重要产品的推出,从Wii、Kinect、苹果为代表的智能终端到Leap Motion体感设备,产业链相应上市公司股价均表现不俗。2009年智能设备开启了电子行业的牛市行情,伴随智能手机、平板电脑等持续高成长,电子细分板块触摸屏、TFT面板、金融IC卡等各领风骚,成为投资者青睐的领域。年初以来电子行业热捧的谷歌眼镜、苹果Iwatch、Leap Motion等穿戴式消费电子及体感设备反映了消费电子创新的方向,并得到投资者的追捧,人机交互相应概念的重点公司的市场大幅上涨:

Leap 公司:全球体感设备领先供应商。公司开发的面向Windows PC及Mac平台的体感设备Leap Motion已于7月22日发售。在业内人士看来,这场新的技术革命可能成为2013年度最火热的产品之一,其意义不亚于2010年的触摸屏。Leap公司自7月初股价涨幅为131%。

InvenSense 公司:全球体感技术行业龙头企业,唯一能提供全方位运动感测人机界面解决方案的供货商。为如智能型手机、平版电脑、游戏遥控设备、智能型电视与配戴式感测用品等的消费性电子产品提供运动感测追踪组件的领导供货商。主要产品为如陀螺仪、加速器、电子罗盘、压力传感器等的运动传感器。InvenSense 公司股价自5月初上涨103%。

CardioNet 公司:全球技术领先的可穿戴心脏监测设备生产商。主要产品为MCOT™远程心脏监测设备,通过一个可穿戴式小型传感器为患者提供24小时的全天候监测服务,用户的信息会通过传感器收集后被自动传输到公司的监控中心用以进行分析,并为用户的主治医生提供诊断和治疗管理所需要的日常报告或统计分析。CardioNet 公司股价自年初至今上涨305%。

 

投资思路二:体感技术的全套方案应用提供商成为投资首选

体感技术的全套方案提供商受益者最大:具备从体感设备到体感应用的解决方案提供商,不但可以通过卖设备获利,更重要的利润空间来自于用户的海量数据价值,重点推荐数码视讯。而同洲电子对智能电视人机交互研究与商业模式变革的拓展进程值得重点关注。

目前数码视讯在体感技术投入方向主要为姿态识别和手势识别,主要应用在体感游戏,现有研发人员40多人,其中60%以上为研究生毕业,与清华大学联合成立未来视讯技术研究所,清华大学提供核心的算法,数码负责软件实现。截至目前公司已申请多项国内首创技术与专利,所有核心技术均为自主知识产权方案。

 

公司在体感技术领域的定位是从传感器装置、模式识别、云计算平台、体感游戏的应用的一体化方案,预计明年能够实现商用,初步满足智能电视和机顶盒的需求,后期会开发与计算机、平板电脑、智能手机的体感装置,国内市场空间在数百亿人民币。

体感设备元器件采购:摄像头主要买舜宇光电、玉晶光电,红外激光器比较低端,国内很多厂商可做,光栅设计采用国内某些研究所方案,水晶光电负责生产,而滤波片是水晶光电提供。

中长期,公司深化广电领域,实现从前端业务、CA、超光网,向OTT终端与平台等云管端一体化布局;通过多种方式在平台运营和影视传媒等信息服务领域逐步发力:一方面大力拓展数字电视支付以及OTT平台运营,另一方面通过自制或外延式扩张进入影视制作, 游戏, 互动电视增值服务等领域;具备从算法、终端到体感游戏等应用的体感产品的研发,体感产品有望在四季度出样机。

投资思路三:体感技术应用平台提供商

体感技术作为人机交互的第三次革命,将从以智能终端、游戏、医疗、互动教育、3D打印等为代表的应用平台开始,形成革新技术应用的预期,带来相关应用板块的大幅拉升。

人机交互设备市场规模将达到数千亿,其中首受其益并且潜在投资价值最高的是智能电视产业链,截至到2014年底市场规模将达到400-700亿;目前应用最广泛的是游戏,潜在规模将达到200亿;与市场关注热点最紧密联系的是医疗穿戴和3D打印,预计市场规模分别将达到30亿和120亿。

推荐应用平台提供商:乐视网(智能电视平台提供商)、科大讯飞(智能语音平台提供商)等。

 

投资思路四:体感应用提供商及体感配件供应链的本土化

随着需求的拉动,上游感知传感设备配件供应商将受益,包括摄像头、红外LED、红外窄带滤波片、通讯芯片以及MEMS传感器供应商等。

人机交互技术革新对国内感知设备配件供应商将可能通过以下两种方式加以影响:1)随着体感设备在国内市场的逐步打开,国外领先公司将原材料采购向国内转移,类似于苹果、三星公司的触摸屏供应商,国内潜在供应商包括红外LED、摄像头、红外带通滤光片、USB芯片厂商或将受益;2)国内研发团队仿制形成本土化体感产品,并与国内平台应用商合作,从而打造整条体感设备产业链。无论是两条路径的哪一条实现,国内相关配件供应商都将受益。

体感应用提供商重点推荐九安医疗。而设备供应链重点推荐激光感应器、激光传感器、以及红外激光器等消费类光学器件本土化:光迅科技(国内光器件产业龙头)、红外窄带滤波片推荐水晶光电(全球窄带滤光片领先企业),潜在受益程度最大。其他相关标的也不同程度受益:联创光电、舜宇光学(HK)、高德红外、汉王科技、川大智胜等。

 

重点组合:数码视讯、水晶光电、光迅科技、乐视网、科大讯飞、同洲电子

人机交互主题投资组合:(1)体感技术全套方案提供商:数码视讯;(2)体感技术应用平台提供商:乐视网(智能电视平台提供商)、科大讯飞(智能语音平台提供商);(3)供应链的本土化:光迅科技(国内光器件产业龙头)、水晶光电(全球窄带滤光片领先企业);(4)全球体感技术龙头:Leap公司(全球体感设备领先企业)、InvenSense 公司(全球体感技术行业龙头)。综合考虑业绩确定性、治理结构以及核心技术掌握,重点推荐:

数码视讯:国内从体感设备到体感应用的全套方案提供商。公司在体感技术投入方向主要为姿态识别和手势识别,主要应用在体感游戏,现有研发人员40多人,与清华大学联合成立未来视讯技术研究所,清华大学提供核心的算法,数码负责软件实现,截至目前公司已申请多项国内首创技术与专利,所有核心技术均为自主知识产权方案;

水晶光电:具有给微软Kinect供货窄带滤光片的经验,是全球范围内仅有的两家能够批量生产的企业,其中窄带滤光片对边缘衰减要求严格,对镀膜工艺要求较高,产品附加值远高于比蓝玻璃红外滤光片,潜在市场空间不低于20亿元,是普通红外截止滤光片的3倍,未来发展空间广阔;

光迅科技:国内光器件产业龙头。是国内最大的光通信器件供货商,为光通信设备商和运营提供关键原器件和子系统产品。从业务发展前景来看,公司有望实现向物联网、人机交互的光器件,光模块领域延伸,完成从投资品生产商到消费品生产商的战略转移;从国家战略的层面来看,国家对光电子,高端光器件产业本土化的大力扶持,为公司的发展奠定了坚实的保障;

乐视网:国内唯一一家流媒体上市公司,也是一家从内容到终端到渠道全覆盖的综合文化企业,在A股具有独特性;乐视超级电视集硬件、软件和内容完美结合,是一款真正意义上的智能电视,同时具有超高的性价比。除了电视、上网功能的完美结合外,乐视还集成了目前最先进的智能语音交互技术,用户通过带有麦克风的遥控器,就可以轻松自然地实现操控、输入、搜索等功能。另外,乐视还配套推出Pro Xtion体感套件通过顶置USB接口与超级电视兼容,让用户直接在超级电视上玩体感游戏,并支持多人游戏识别功能;

科大讯飞:国内最大的智能语音技术提供商,在移动互联网、云计算等相关产业的发展推动下,在呼叫中心信息服务、智能语音教育、车载增值服务、以及智能语音家电等众多市场呈现爆发性增长潜力公司于12年发布了新一代“语音云”平台及示范性应用产品“讯飞语点”,其语音云用户呈现快速增长,全年移动应用下载和激活数量超过1.2亿;

同洲电子:国内三网融合与四屏合一领军企业,在全球首创电视映像触控技术。产品涵盖关键前端系统、网络、核心软件、中间件、运营支持系统、内容服务、增值业务、数字电视机顶盒、数字电视一体机、IPTV机顶盒、卫星通讯、安防电子等产业,推出涵盖手机、PAD、电视、机顶盒的飞系列智能终端。

 

人机交互专题报告-编程之家

 

 

 

分享: 

3

0