发布日期:2022.02.17
译见未来 | 云译专题讲座第2期『融合知识的自然语言处理』顺利举办
+ 查看更多
发布日期:2021-10-09 09:47
译见未来 | 云译专题讲座第2期『融合知识的自然语言处理』顺利举办
原创 云译科技 深圳云译科技有限公司
9月29日下午,由云译科技主办的「机器翻译与人工智能」线上讲座第2期顺利举行。本次讲座主要面向高校外语系师生、专业译员及其他翻译行业相关人员,邀请他们通过腾讯会议的方式参与互动。
云译科技是专注于自然语言处理技术研发与应用的国家级高新技术企业,在行业内深耕多年,技术团队研发实力已跻身业内第一梯队。本次讲座十分荣幸地邀请到厦门大学信息学院人工智能系副教授、云译科技技术总监陈毅东老师作为主讲嘉宾。

本次讲座以「融合知识的自然语言处理」为主题,陈毅东老师围绕数据驱动的语言处理模型,结合与语言资源、语言学知识、先验知识相关的数个尝试,展示了自然语言处理与深度学习相结合的现行成果。
讲座伊始,陈毅东老师首先介绍了自然语言处理的概念和重要性。陈毅东老师介绍到,自然语言处理是一门涉及到计算机科学、人工智能与计算语言学的交叉学科,其最为关注的是交互,即服务于人。目前而言,自然语言处理主要借助计算设备来实现算法和目标的达成,却又不仅仅局限于计算机,人机协同在自然语言处理中具有十分重要的地位。
语言处理与人工智能的关系始终密不可分,以图灵测试为例,其最基本的前提是要求“智能”系统具有自然语言处理的能力,否则便不视其为具有思维能力的“智能”系统。人工智能发展的标准是人们期待着有朝一日,计算机能够具备人的思维,而语言正是思维最密不可分的载体,语言承载了人类历史上80%以上的知识,让机器掌握自然语言处理的能力显然至关重要。

随后,陈毅东老师从机器翻译的三个阶段观察自然语言处理方法的演变。首先出现的是规则方法,由人总结语言学知识,并直接提供给机器;第二个发展是统计方法的出现,是人在语言学知识指导下总结特征,并交由机器自动学习。而随着神经方法的出现,机器开始具备自动学习的特征。
随着谷歌替换了神经网络引擎后,越来越多的翻译行业从业人员意识到,机器翻译已经今非昔比,并开始重视机器翻译在行业中的应用性,可以说,机器翻译从各方面都取得了巨大的进展。但不可否认,目前的机器翻译技术仍存在缺陷,以字幕译制为例,在很多双语字幕中存在着不少令人啼笑皆非的翻译错误,这些不足都源于自然语言处理的诸多「难点」。

陈毅东老师提到:「数据驱动的翻译系统不能很好地识别语言逻辑,这就导致目前的系统无法处理好需要翻译的字句,也导致了机器翻译的频频“踩雷”,大大限制了机器翻译在一些关键、重大场景的应用。」
机器如何界定语言思维中的概念,如何识别未录入词、老词新用和违背语法的词句,甚至是不合乎语义约束的搭配,这些难点限制了自然语言处理的发展。尽管深度学习已经渗入了自然语言处理领域,但现行的学习深度却有待加强。
想要攻克自然语言处理的难点,实现深度学习与自然语言处理的更“深度”结合,融入知识是至关重要的途径。众多学界研究专家也在纷纷向着这一方向努力,陈毅东老师分别介绍了张钹院士、周志华、周明、宗成庆等多位前沿研究学者的观点,他表示,知识、数据、算法和算力四大因素的结合,能够构成更强大的人工智能,引入更多知识,对于自然语言处理的研究至关重要。

接着,陈毅东老师还向听众介绍了厦门大学自然语言处理团队近期在融合知识的自然语言处理方面的若干思考与尝试。
在讲座的最后,陈毅东老师与线上的听众们展开互动,并对以下问题给予了详尽的解答:
- 如何及时获取与学习网络用语、新词以及处理旧词新义的情况?
- 如何自动识别并修正文本中包含的错别字?
- 目前常用的分析器是什么?
- 同一语句因语境产生的多种语义该如何解决?
……
云译科技作为一家专注自然语言处理技术研发与应用的国家级高新技术企业,深耕语言服务行业数十余载,所积累的丰厚行业经验将支持着我们迈向更广阔的全球市场,为全球行业用户、企业用户、个人用户提供全方位的机器翻译与语言科技解决方案。
感谢诸多嘉宾与听众对本次云译科技线上讲座的支持,云译科技通过举办此类机器翻译讲座,既能够让对机器翻译有所关注或感兴趣的人获得了解这一领域的机会,也能通过前沿技术的交流,展示云译科技追逐人工智能机器翻译浪潮的信心,以精尖技术高效构建一个突破跨语言沟通障碍的信息世界。
如果您对机器翻译乃至自然语言处理相关技术感兴趣,欢迎扫描下方二维码关注云译科技公众号,期待与您在下一场讲座再会!


机器翻译引擎定制
