“NLPCC于2012年创建,每年举办一次,从2014年起成为自然语言处理及中文计算领域的国际学术会议。NLPCC 2021重点关注人工智能和大数据领域的自然语言分析和理解任务,继承往年NLPCC 会议的优势活动形式,本次会议组织了主题演讲、论文报告、专题报告、研习会、专题小组、技术评测、创新展示等多种学术活动。”
金秋十月,硕果累累。10月15日-17日,由中国计算机学会主办、自然语言处理专业委员会承办的第十届CCF自然语言处理与中文计算国际会议(NLPCC 2021)在青岛召开。
思必驰副总裁/智能服务事业部总经理初敏博士出席会议,并做了《场景驱动的创新-通过话语分析和培训机器人对销售过程进行建模和改进》主题演讲。思必驰语言与知识团队的论文《基于向量投影距离和抽象三角条件随机场机制的少样本自然语言理解》被NLPCC 2021学术大会收录并做口头报告。
思必驰团队论文再登学术舞台
在现实生活中,NLP(自然语言处理)主要用于词法分析、句法分析、实体和关系挖掘、文本摘要、情感分析、主题提取、机器翻译、自动问答、语言建模和我们可以想到的所有与语言相关的任务。NLU(自然语言理解)被认为是NLP的一个子方向,主要侧重于语义理解:让计算机理解文本的真正含义[1]。
数据稀缺问题是自然语言理解(NLU)里的一个重要挑战,尤其是对于一些新的目标领域。少样本NLU技术可以在源领域中训练NLU模型而直接(不需要微调)将模型应用到任意目标领域,因此少样本NLU对于缓解数据稀缺问题至关重要。《基于向量投影距离和抽象三角条件随机场机制的少样本自然语言理解》一文,为这一难题提供了新的解决方向。
“在本文,我们为少样本NLU提出了向量投影距离和抽象三角条件随机场,用于提升原型网络的性能。向量投影距离利用了上下文词向量在标签向量上的投影映射作为‘词-标签’相似度,其等价于一个归一化的现象模型。抽象三角条件随机场则为意图分类和语义槽解析的联合任务学习领域不可知的标签转移参数。广泛的实验表明我们提出的方法可以显著性由于强基线系统。特别是,我们的方法在不利用目标领域微调的限制下于两个中文和英文评测基准(Few-Joint和SNIPS)上取得了最好的性能水平。”
服务数字化助力企业提质增效
随着时代的发展,AI渗透各行各业,被用以辅助提高工作效率。
初敏博士在《场景驱动的创新-通过话语分析和培训机器人对销售过程进行建模和改进》主题演讲中表示,像汽车、住宅类消费品价格不菲,对此类企业而言,其往往要花费大量的广告宣传费用,获客成本较高。然而,目前数字化营销管理主要集中在线上环节,对营销转化非常关键的线下销售服务过程,尚缺乏数字化掌控手段。销售过程是否友好?是否专业?是否及时准确地理解了客户的需求?这些都不得而知。
图2
就此,思必驰创建了一个能够将面对面的销售过程数字化的解决方案。通过提取销售过程的场景、话题、卖点和用语等关键信息并进行NLP分析,创建可用于培训的机器人,完成对销售过程的自动化、智能化指导与分析,并成功在多个客户的试点门店部署实施。
图3
最后,初敏博士表示,AI技术的应用落地任重而道远。思必驰虽然完成了数据闭环方案并在全国数百个试点门店部署,但在探索中发现了很多未知的挑战。思必驰诚挚地向与会的各位学者与同学们发出邀请,期待大家的加入,也期待能够同大家在NLP领域里开展广泛的合作。
参考文献:
[1] Sciforce 《NLP vs. NLU: from Understanding a Language to Its Processing》AI 研习社