経済産業省
文字サイズ変更

特許庁と独立行政法人情報通信研究機構(NICT)は特許文献の機械翻訳に関する協力に合意しました

本件の概要

特許庁と独立行政法人情報通信研究機構(NICT)は、外国語特許文献の機械翻訳の必要性の高まりを受け、中国語、ASEAN言語等の機械翻訳の精度向上及び活用促進のための協力を進めることに合意しました。 これにより、民間の特許文献機械翻訳サービスの高品質化や、特許庁での機械翻訳活用による特許審査の効率化、高品質化などが期待されます。

1.背景

従来から件数が多かった欧米の特許出願に加え、非欧米諸国、特に中国の出願が近年大きく増加しており、外国語特許文献の調査の必要性がますます増大しています。このような中、外国語特許文献を人手で翻訳して調査することには、コスト等の面で限界があることから、今後、特許庁もしくは民間において、様々な外国語特許文献の調査環境を整備していくためには、高精度な機械翻訳の活用が不可欠といえます。

2.特許庁とNICTの協力

特許庁とNICTは、特許文献の機械翻訳の精度向上及び活用促進を目的とし、①英語以外の欧州言語、ASEAN言語等の特許文献の機械翻訳、②米国、欧州等の英語特許文献の英日機械翻訳を用いた検索環境の検証、③特許文献をもとに作成した中日対訳コーパス(*1)の高品質化及び対外提供等について、以下のとおり協力を進めることで合意をしました。

①英語以外の欧州言語、ASEAN言語等の特許文献の機械翻訳
特許庁とNICTは、英語以外の言語の特許文献の機械翻訳の精度向上及び活用促進について今後具体的に協力するため、必要な方策について調査、検討を進める。 特に、ASEAN言語のうちタイ語、ベトナム語及びインドネシア語については、原語文献の収集方法等について今年度中に特許庁が調査を実施し、その結果をもとに、それらの言語の機械翻訳の精度向上策について、平成27年度中に検討を進める。

②米国、欧州等の英語特許文献の英日機械翻訳を用いた検索環境の検証
特許庁は、NICTが今年度中に作成する米国、欧州等の英語特許文献の機械翻訳文を、他の検索キー(分類等)とあわせて試験的に先行技術調査に用いるなどし、高度検索システムの検討に活用するとともに、翻訳の不備等の情報をNICT に対してフィ ードバックし、翻訳品質の向上に役立てる。また、NICT は、特許庁から貸与された文献データをもとに対訳コーパス(*1)を作成するなどして、英日機械翻訳の精度向上策を講じる。この対訳コーパスは、民間にも提供する予定である。

③特許文献をもとに作成した中日対訳コーパスの高品質化及び対外提供
NICTは、特許庁の平成24年度と25年度の調査研究事業(*2)において特許文献をもとに作成された約1億3000万件に及ぶ大規模な中日対訳コーパス(*1)について、中日機械翻訳での活用を想定した品質検証を平成26年10月末までに実施し、必要に応じて品質の改善(翻訳に悪影響を及ぼすデータの削除等)を図る。品質検証及び品質改善が実施された対訳コーパスのデータは、民間にも提供する予定である。

*1 「対訳コーパス」:異なる言語の翻訳関係にある文と文の対。機械翻訳の方式の一つである統計的機械翻訳においては、対訳コーパスを学習させることにより、システムの構築や翻訳精度の向上を実現できる。
*2 平成24年度調査研究事業の報告書:
http://www.jpo.go.jp/shiryou/toushin/chousa/h24_chunichi_honyaku.htm外部リンク
平成 25年度調査研究事業の報告書:
http://www.jpo.go.jp/shiryou/toushin/chousa/pdf/tokkyohonyaku_hyouka/sankou02.pdf外部リンク

これらの協力が実現することにより、特許文献由来の高品質な対訳コーパスの普及などによる民間の特許文献機械翻訳サービスの高品質化や、特許庁での機械翻訳活用による特許審査の効率化、高品質化などが期待されます。また、NICT は研究開発成果の社会還元を積極的に進めており(*3)、特許庁との協力によって得られた機械翻訳の精度向上等の成果についても、民間会社に対する技術移転など社会での活用に積極的に取り組んでいく予定です。

*3 NICT の知的財産ポリシー:
http://nict.go.jp/out-promotion/intellectual-property/policy.html外部リンク

特許庁は、上記①~③以外の事項についても、NICTとの間で協力を進めることを検討するとともに、他の研究機関、民間企業等との間でも同様の協力の可能性を検討し、外国語特許文献の調査環境の整備を図ってまいります。

担当

特許庁 総務部 総務課 特許情報企画室

公表日

平成26年7月28日(月)

発表資料

経済産業省 〒100-8901 東京都千代田区霞が関1-3-1 代表電話 03-3501-1511
Copyright Ministry of Economy, Trade and Industry. All Rights Reserved.