东北大学1999届校友苏州思必驰信息科技有限公司董事长、CEO高始兴

发布者:李佳佳发布时间:2022-11-02浏览次数:304

语音交互 创造未来

未来整个物联网人工智能世界一定是对话的世界,人机对话的世界就是万物赋能对话。”在高始兴眼里,未来所有的端都要有对话的能力,这就需要一个能灵活定制各种需求的全链路一体化对话平台。

校友简介

高始兴,1999年毕业于东北大学复合材料专业,后赴英国留学获得英国剑桥大学商学院硕士学位。并以distinction的最高等级优异成绩毕业。拥有计算机和管理双硕士,是国内最早的互联网创业者之一,拥有多年IT和互联网公司创业和管理经验。他与剑桥大学等英伦校友在剑桥高新区创立了AISpeech(思必驰),后归国创业。高始兴曾带领团队打造了国内教育领域最大的语音技术提供商(现驰声信息科技,已被网龙集团收购),2015年至今,先后孵化、投资了车萝卜、先声教育等人工智能生态企业。创业十余年,高始兴带领思必驰从教育领域转型物联网智能终端,并成为行业领先的语音人工智能公司,获得多轮数亿元的融资。

思必驰信息科技有限公司成立于2007年英国剑桥高新区,创始人均来自剑桥大学,2008年高始兴及其团队回国,公司落户苏州。思必驰专注于人性化的智能语音交互技术,是国际上极少数拥有自主产权、中英文综合语音技术的公司之一,包括语音识别、语音合成、自然语言理解、智能交互决策、声纹识别、情绪识别等。其语音识别、声纹识别、口语对话系统等技术曾经多次在美国国家标准局、美国国防部、国际研究机构评测中夺得冠军,代表了国际前沿技术水平,被中国和英国政府评为高新技术企业。

思必驰成立至今,先后获得联想之星、启迪、阿里巴巴、元禾控股、中民投资、深创投、富士康、MTK等多方投资,并先后获得剑桥大学商业计划奖、剑桥大学Downing基金、英国政府研发基金、国家电子发展基金、工信部电子发展基金、科技部创新基金、苏州科技计划领军企业基金等支持。20185月,思必驰完成5亿元第四轮融资,自2016年年底开始,思必驰近百人铁军团队封闭研发,历时大半年推出国内领先的全链路智能对话定制开放平台——思必驰DUI开放平台,覆盖多应用场景和丰富的第三方内容资源,内置国内最专业的语音及语言技能库,为物联网、移动互联网和互联网的开发者提供单项技术服务和完整的、高可用定制的智能对话交互解决方案。

思必驰坚持产学研一体化的发展模式。与上海交通大学成立专属联合研究实验室,与苏州市人民政府联合成立“思必驰-上海交大苏州人工智能研究院”,同时,致力于智能语音语言及人机交互前沿技术研发,不断强化技术商业化应用及成果转化,是国内极少数拥有原始创新能力和基础创新团队支撑的AI公司。

思必驰拥有完全自主产权的全系列语音及语言交互技术,从感知到认知,形成人机智能交互的完整技术链条,包含语音识别、语音合成、语音识别++、语义理解和智能对话等核心技术。

思必驰拥有优秀的底层技术研发实力,其语音识别技术支持丰富音频信息分析和挖掘,可完成实时云识别、抗及远场识别、大词汇识别和本地语音识别等。

思必驰不仅关注语音控制,更关注人机对话式交互。目前多轮交互、打断纠错等技术处于国际领先水平,为产品提供专业深化的场景解决方案,为企业提供启发式对话的智能服务,同时,开放DUI全链路智能对话定制平台,推进语音语言技术的应用规模化。

在传统移动互联网时代,流量入口被切分为很多块,应用市场、各种App、社交网站、资讯网站等但是,未来的流量入口会有颠覆性的变化,高始兴的设想是,在物联网,很多流量入口将会消失,不会再有App、输入法、安卓市场等,这些分散的流量入口会汇聚成一个大端,形成一个流量入口。“未来可能就是你买了几个不同的端,不同的端代表不同的服务,中间是一个大的人工智能系统在运转。”他的另一个想象是,未来下载的不是App,而是Avatarstore(阿凡达),安卓市场会演变成虚拟人物市场,每个虚拟人物背后代表不同的服务。

因此,“未来一定会走向对话智能”。对话智能意味着机器更懂人类的想法,在人机对话中,当机器听不懂时,它能主动询问人类,并知道如何提问,以求更好的理解,这是一种完全自然的语言交互而现在的交互系统大多是结构式,用手机订餐馆时,需要选择菜系、位置等,像填空一样必须按照系统提供的结构去填,这种方式不能满足人性化需求。高始兴认为未来的人机对话应该是:“我晚上要和女朋友吃饭,帮我订个浪漫的餐馆。”未来人机交互体验应该是追求人性化的方向。同时,未来的人机交互不只是自然语言交互,还会加入图像人脸识别等多模态,这也是一个趋势。

思必驰公司一路走来,创业至今,已成为行业领先的语音人工智能公司。面对成绩,高始兴并不满足。总结经验,他感悟良多,他认为,技术创新型企业要实现良性发展,至少需要具备以下因素。

首先要有战略耐心。技术型创新企业和产品型创新企业的发展模式是完全不一样的,产品型企业是单点驱动,抓住机会迅速做大爆发;技术型创新企业从技术原型到产品demo到最终推向市场,迭代循环的周期特别长,任何一个节点的失误都可能会导致创业失败。当越过了很多障碍以后,曾经解决问题的方法和能力都将成为企业的核心竞争力。

其次要有正确方向由于技术型企业的创业周期长,所以方向必须要选择正确。方向对了,再曲折的道路也不会远;一旦方向选错了,在这么长的周期下,走到最后损耗的不只是时间和资本,更重要的是耗费了时机和人心。

再次要有合理团队。人工智能创新企业想要成功,团队里既要有科研人员,也要有成熟的企业家而纯粹的技术创新型企业往往容易发展变形为科学家的实验室,创业不是从A推导到B的简单过程,最重要的是要能够在各种干扰因素中抓住关键点,在遇到挫折的时候及时清醒过来,而这些往往是科学家们看不到的,所以,团队一定是科研、市场、产品、战略运营的组合。

最后还要多轮驱动、齐头并进。“虽然技术是核心驱动力,但产品化和商业化也需要良性发展,如果技术指标非常好,产品体验特别差,就是四不像了。”高始兴说。从技术维度上讲,物联网时代由于干扰因素很多,如噪声、距离,这促使语音交互在不同的场景化上需要一个大幅提升。同时,交互技术要从语音输入、合成这类基础的感知智能走向认知智能,让设备像人一样思考,把语音识别与合成、声纹识别、自然语言理解技术融合在一起,把智能设备打造成为机器人。从产业化维度上讲,思必驰将语音交互技术赋能给各个产业,比如思必驰为车载系统、智能电视、智能音响等合作客户提供个性化的技术服务,包括DUI开放平台、企业级智能服务、人机对话操作系统、人工智能芯片模组等,并在赋能这些智能终端后,进一步丰富后端服务资源,用以满足用户多样化需求。高始兴进一步解释道:“语音交互是一个媒介手段,是一个入口,是一个平台。从互联网——移动互联网——物联网的年代演进中,语音逐渐成为人类和所有设备交流的手段,所有信息的输入输出几乎都会逐渐以语音为主,所以,这个入口会产生非常大的价值。语音是一个平台,由此可以衍生出很多的应用方向,从机器人行业到智慧政府、金融、医疗、教育等行业,通过AI+让传统行业提升产业效率和产品价值,降低运营成本,优化配置。

面对未来,思必驰依托人工语音智能交互技术,在传统与新兴的多个工业制造领域行业产业进行AI+综合布局。高始兴踌躇满志,在国家经济转型升级和产业动能转换的历史进程中,致力于把人工智能产业打造成江苏省另一张靓丽的名片和风景线。