2016-12-05
世界知识产权组织(WIPO)于2016年10月31日宣布,已开发出一种以新的突破性人工智能技术为基础的专利文件翻译工具,纳入现有的WIPO Translate,该工具是利用先进的神经网络机器翻译(neural machine translation)技术,可将高技术性专利文件转为文体和句法都更接近一般用法的第二种语言,表现优于过去以其他技术建立的翻译工具。
WIPO已初步「训练」这个新技术来将中文、日文及韩文专利文件翻译为英文,2014年这3种语文的专利申请案约占全球总申请量55%,现在使用者可以在WIPO网站的公共测试平台(http://patentscope.wipo.int/translate/demoNmt.jsf)试用中/英翻译。
翻译的高精确度是透过训练神经网络机器翻译工具的结果,是以中国大陆知识产权局(SIPO)提供WIPO PATENTSCOPE数据库的专利文件中6千万个句子,以及这些案件向USPTO申请时的英译本进行比对。
WIPO计划将神经网络机器翻译服务扩充到法文专利申请案,接着再扩及其他语文,PATENTSCOPE数据库整合了网络上免费提供的其他翻译引擎,并继续在使用现行的统计式翻译技术下翻译质量良好的语言。WIPO已将此翻译软件分享其他国际组织,包括联合国会议管理服务、粮食及农业组织、国际通信联盟、国际海事组织、国际贸易组织及对抗艾滋病、结核病和疟疾,目前联合国的翻译系统系与WIPO的统计式翻译版本整合,未来几个月将升级至神经网络版本。
神经网络机器翻译是一项新兴技术,系利用以前翻译过句子的庞大神经网络模式来「学习」,与过去「词组为本」(phrase based)的统计模式相较,其特异性在于它译出的字句更自然。在最近的测试中,WIPO-Translate的神经网络翻译质量在如日/英或中/英这些差异大的语言 (distant language pairs),也比其他非WIPO的翻译服务好,由于此WIPO工具是专门训练用于专利文件,而非各种不同的文本,故翻译质量较高。
注:
PATENTSCOPE数据库在国际专利合作条约(PCT)申请案公开当日开放全文格式数据,亦提供成员国专利局的专利文件,可用多国语文以关键词、申请人姓名、国际专利分类及其他方式检索,收录约5千8百万笔资料。
相关连结
WIPO推出先进的专利文件翻译工具( http://www.wipo.int/pressroom/en/articles/2016/article_0014.html )