招聘对话达观数据陈运文:做中国智能文本RPA的 No.

对话达观数据陈运文:做中国智能文本RPA的 No.


  中新网上海新闻7月24日电(曹卉)  RPA解放人的双手,可应用于“大量重复”和“规则明确”的事件处理中;NLP担任人工智能里的大脑角色,它需要真实理解文字背后的含义。RPA+NLP,这是人工智能领域的趋势,也会成为全球最重要的经济组织形式。

  最早听说陈运文,是在一个创投机构的询问中,“你知道达观数据现在多少估值啊?应该不低吧”。当时我打趣,能让投资机构惦记的企业,一定有过人之处。

  然而达观数据最容易跃入媒体眼前的,并不是创始人陈运文这个人,虽然他是科技部“万人计划”专家,2014年带队还获得了ACM CIKM Competition等一系列技术竞赛的国际冠军,底层技术型气质让他更专注于产品开发与市场拓展。创始人话说得少了,便成了企业红,人在幕后。他倒乐在其中,站在他的角度来回答媒体提问时,会骄傲的说,“创业三年多,我们盈利了”。

  盈利其实是蛮折磨投资机构的字眼,商业故事、商业可想象空间、商业创新科技都不等于商业变现。而至始至终,达观数据在人工智能领域的地位就没有动摇过:图像识别有商汤、旷视、云从、依图等;语音识别有科大讯飞、云知声、思必驰等;而在文本语义理解领域达观数据跑在行业最前列。

  但盈利放在资本市场解读,其实又是很传统的字眼;讲惯了故事和估值的资本市场,从某种意义上认为,当下的盈利不是最重要的,重要的是未来,强调的是可想象空间。如果像达观数据一样把可想象空间和已经盈利二合一,投资机构定会再次眼前一亮。或许应了当初2017年软银赛富决定投资达观数据5000万A轮融资时对陈运文说的一句话,“小伙子,I like you”。

  陈运文是我见过的创业圈里最不焦虑的CEO之一,不单单是因为企业技术门槛够高,融资进程足够顺利,归根到底要得益于当初创业时的团队建设。

  他决定从腾讯出来前,就已经拉到“十人帮”和其一起去“试水”。还没有资本加持,要说服百度、腾讯、盛大出身的工程师们放弃高薪,一起组成一支前途并不确定的团队并不是一件易事。创业这件事拉开弓弩就没有回头箭,只能往前走,承担所有的风险与得失。他把“十人帮”归于战友情,大家都愿意和他一起走一条难走的路途。 

  达观数据这艘船驶帆三年多了,陈运文团队在产品技术层面,从NLP(自然语言处理)扩充到了RPA(机器人流程自动化)领域,他们认为这样更容易将企业大量业务场景以智能化的方式落地实现。

  今年6月份,美国估值超过70亿美金的 RPA巨头企业UiPath和特朗普团队签署了“白宫培训协议”,承诺在未来的5年内为RPA行业培训75万名工作者。这也让陈运文更加看好文本智能RPA的市场。“RPA 在西方已经有了很多场景的应用。但相比于英文,中文更灵活,复杂的语法结构使得技术上有着更大的难度和挑战。达观擅长的就是聚焦在中文领域的文本智能化处理。”

  眼下陈运文认为最重要的事情是让企业继续稳健地发展,并做好战略布局。7 月底达观数据也将在北京举办智能RPA产品发布会,这也是达观数据针对中国本土企业和用户使用习惯完全自主研发的 RPA产品。陈运文理想的达观数据,是成为中国文本智能处理领域的 NO.1。“希望未来,凡是有文字自动化处理的地方,就有达观数据的智能流程机器人。” 

  文本挖掘,有着巨大社会价值

  中新网上海:垂直到文本智能处理技术这个领域,技术发展到什么程度?

  陈运文:以前纽交所大厅里有大量的交易员,但现在却空空荡荡,大量的工作已经由计算机完成。软件机器人在今天已经有能力处理大量的文字资料,以金融行业大量的数据报告举例,文本处理机器人可以做到自动阅读分析,自动判断。在政府、金融、法律行业、传媒等各大行业都发挥巨大的作用。

  中新网上海:能否理解,各行有各行特定的机器人员工?各自适用不同的领域与语境?

  陈运文:是的,各行各业都有其特定的软件机器人。不同领域的机器人就像不同岗位的员工,完成属于他们各自领域的业务流程操作。这些行业的机器人,本质上都是一个计算机文字处理系统,它们需要垂直行业的语言模型来做积累学习。比如说处理法律文书的智能机器人如何看法律条款?金融领域智能机器人如何审阅招股书?不同领域的语言模型本身有所差异,这也是我们为什么投入大量研发精力去训练这些智能文本机器人。 

  中新网上海:这些技术被创造出来,给社会的最大价值是什么?

  陈运文:对软件产业或信息产业来说,对社会最大的价值是提升效率。