【微访谈】中通网络董国杰:人工智能未来或成为人类智慧的“容器
在此情况下,微软、苹果、Facebook、微软、阿里等在内的资本巨头纷纷开始抢滩市场,作为全国领先的SaaS服务提供商,中通网络也于2015年开始在此蓝海中竞逐。
据了解,目前人工智能领域内的研究包括机器人(300024)、语言识别、图像识别、自然语言处理和专家系统等方面,依托10余年专注客服领域的沉淀,中通网络迅在原有语音基础进行了人工智能方面的深入研究,迅速掌握语音识别、语音合成、自然语言处理与理解等相关技术,并独立开发出了“风语者小懂”机器人。不难看出,中通网络在人工智能领域,已经迈入了关键的转型期。
(“风语者小懂”机器人)
据悉,“风语者小懂”基于声学模型和语言模型的ASR引擎可以从声学特征、音素搭配学特征、词汇特征、韵律学特征、语法特征五大方面进行特征提取其ASR语音识别技术对中文的性能指标达96%,居于国内中文语音识别领域的尖端水平,TTS语音合成技术基于庞大的转录语音库,实现了媲美真实人声的播读效果。
目前“风语者小懂”主要应用于通信、金融、电子政务、电子商务、教育、智能家电、汽车交通等多行业领域,合作用户有中国电信、中国移动、拉卡拉、泰和财富、团购王、新华保险(601336)等众多名企。
从开始切入人工智能领域到短时间交出完美答卷,中通网络对于人工智能方面有何独特的见解?未来在人工智能方面会如何进行布局?针对这一系列问题,《
网》对中通网络创始人董国杰进行了一次深入访谈。(中通网络创始人董国杰)
网:据了解,公司原先是网络通讯业务这一块的,自2015年开始步入人工智能领域,请问公司跨界做人工智能出发点是什么?
董国杰:互联网+已经成为过去,人工智能新纪元已经来临。随着大数据已成形,算法经过多年的累积和迭代已经相当成熟,人工智能发展所需的必要条件已经满足。因此希望利用人工智能技术创造企业核心生产力,帮助众多企业建立统一完善的智能服务平台。
网:目前人工智能业务板块方面,大多是网络公司皆在涉及,请问通讯网络和人工智能有什么共通性?中通网络布局人工智能领域有何独特优势?
董国杰:通讯网络和人工智能都是基于大数据、互联网、云计算等技术为人类社会提供信息化服务,在这一点上去切入会比较快。
作为一家已经在新三板挂牌的企业,我们在人工智能领域会更加专注,公司将在既有的ASR和NLP引擎基础上,通过对垂直领域的个性化定制以及算法的不断优化,继而延伸发展成集行业大数据、会员管理系统、智能呼叫中心等于一身的全新客户服务生态圈,相比大公司的保守,我们的创新意识比较强。
网:目前公司人工智能团队构建如何?在布局之初遇到过哪些困难?您是如何克服的?能否给我们详细讲讲。
董国杰:目前我们拥有一批精通ASR技术和NLP技术的专家团队,除此之外我们还与中科院进行声学实验室进行语音语义领域研发与探索。
在布局之初,遇到的困难相对较多,首先做人工智能领域,风险相对较高,需要的资金投入巨大,我们的压力可想而知;其次,我们缺乏高端的人才,尤其是包括算法,机器学习、信息科技以及数据学领域。这其中自然言处理技术研究相当困难,到目前为止,市面上很多人工智能企业都是处在研发阶段,缺乏有力的数据,目前也没有统一标准以及行业成功案例可以借鉴,所以我们是摸着石头过河。
我们主要是与众多科研院所深度合作,走词汇中心、多语言规则的路线,购买一些需要的数据进行训练。
网:中通网络目前已经自主研发出人工智能产品“风语者小懂”,请问其研发过程中一般会遇到哪些问题?
董国杰:“风语者小懂”研发制造非常复杂,牵涉众多研发领域。首先,构建一个高并发、高可用的客服机器人需要一个很好的技术架构,这一点上我们参考了淘宝的架构体系并对之进行了调整。其次,一个集微信、APP、web页面三维一体的即时通信软件在市面上也是很少见的。
由于客户的通信手段多种多样,为了满足大多数人良好的体验,构建这样一个即时通信体系是必须。我们这个方面进行多轮的尝试,市面的开源版本稳定性都很差。有的看似合理的方案,应用到实际中就会崩溃。真正以浏览器为核心构建的IM在市面是很少,即使龙头老大腾讯的IM也是CS模式(有客户端)。我们IM构建还是具有一定的先进性,前台采用较新HTML5的技术、后台对于不同端来的信息采用不同的处理;最后将所有消息最终利用redis数据库进行缓存,在确保消息稳定性的同时,实现了消息确认、消息重发、消息排队等机制。
网:与其他市面上产品相比,风语者的竞争优势何在?下一个系列产品打算从哪几个方面去升级?
董国杰:相比其他竞品,在遇到未知问题时,小懂机器人能利用无监督学习模式自动实现问题发现、答案预提、知识转化三个环节。风语者首次将应用图形学的CNN(卷积神经网络技术)、RNN(循环神经网络)技术用于自然语言识别。
对于下一系列产品的升级,首先,我认为应该提高产品的并发性,即便是有再多的用户同时使用,也能保持超高稳定性;其次,产品的易用性增强,我们的产品不仅要保障客服人员操作灵活方便,还要提供更多的辅助工具、统计工具、监控工具等;接着,提高风语者机器人的准确性,不仅要保证用户问到的问题都能及时反映,还应保证问题回答的准确、可靠;最后,提高产品的通用能力,除了客服服务,还会为用户提供更多增值服务,让用户拥有更多的自由选择权和产品自由配置的空间。
网:未来三到五年内计划怎么样去布局市场?
董国杰:未来我们希望能够实现AI+Customer Service(提供包括客服语音号码接入,在线文字、语音服务互动,移动服务与管理);AI+智能硬件(为汽车、智能家居、智能硬件、玩具、机器人等提供人机交互引擎,基于自然语言处理、知识库和云计算等技术);AI+智能语音助手(通过智能对话与即时问答的智能交互,为用户提供全方位最贴心的生活信息服务)等几大方面的布局。