日本語副詞に関する日英対照データの調査結果に基づき、 日本語の副詞が英語でどのように翻訳されているかを明らかにする。 我々が開発した日英機械翻訳システムを例にとり、 現在、日英機械翻訳で副詞がどのように翻訳されているか、 また、今後どのような方式が必要となるかを議論する。
副詞、機械翻訳、コーパス
This paper gives a systematic description of how Japanese adverbs are translated into English, based on a study of data about Japanese adverbs in a bilingual corpus. We show how current Japanese-to-English machine translation systems translate adverbials, using our own system as an example, and discuss what new methods are needed beyond these.
Adverb, Machine Translation, Corpus
| 1. はじめに | |
| e="chap-2."> | |
| 2.1 副詞→副詞 | |
| 2.2 副詞→副詞以外 | |
| 2.3 副詞+他の文要素→英語表現 | |
| 3. 機械翻訳における副詞翻訳の現状 | |
| 4. ALT-J/Eにおける副詞翻訳 | |
| 5. 副詞翻訳の改良 | |
| 6. おわりに | |
| 文献 |
我々は言葉を使用する時、副詞(句)という名のもとに、 種々の文法的機能や意味を持たせ、文の豊かな意味内容を表現している。 副詞(句)は、その文法的機能の多様性と複雑さのため処理が難しく、 また、それが文の意味の骨格をなすものではないということから、 自然言語処理において、これまであまり研究が進んでいない。
本稿では、日英機械翻訳における副詞翻訳について述べる。 副詞句翻訳の問題点としては、大きく分けて、
| (1) | 副詞句の文法的機能の多様性と意味の多義性 | |
| (解析での問題点) | ||
| (2) | 英語副詞句の語順処理 | |
| (生成での問題点) | ||
| (3) | 副詞的意味の内部表現 | |
| (知識表現での問題点) |
などを挙げることができる(12)。 ここでは、副詞的な意味の日本語と英語の表現の違いに関して 日本語の副詞の観点から見た日英対照データの調査結果を中心にして、 その翻訳での言語現象から見た問題点を考察する。
また、我々が研究開発している日英機械翻訳システム ALT-J/E(5)(10)を例にとり、 日英機械翻訳における副詞翻訳の現状および改良案について述べる。
日本語の副詞を翻訳者がどのように訳しているか調査した。 日英対照データとしては、外国人のための基本用例辞典(第三版) <総文数: 28,899文>(1)の副詞の用例を 翻訳者に翻訳してもらったもの1を使用した。 副詞という品詞がつけられている単語の用例のみを調査対象としたので、 「今日、明日」などの時詞や、「中心に」のような「名詞+に」による副詞的表現、 「早く」のように、形容詞の連用形による表現、 「きれいに、立派に」などの形容動詞や形容動詞型名詞に「に」がついている副詞的表現などは、 調査対象とはしなかった。
副詞エントリ数 362 副詞用例文数 1,906 延べ調査副詞数 1,914
図1、図2、図32にその結果を示す。
日本語の副詞が、英語で副詞(句・節)として表現される場合が54.7%、 英語で副詞(句・節)以外で表現される場合が28.8%、 日本語の副詞が単独で英語で何かに翻訳されるのではなく、 他のもの(動詞、形容詞、形容動詞、名詞など)と一体となって、 何らかの英語表現に翻訳される場合が16.5%であった。 単純に日本語の副詞を英語でも副詞(‘in advance’のようなイディオムも含む)で表現する場合は 48.1%と全体の半分以下であった。 単純なword-to-word方式の翻訳では、副詞による単純な副詞的表現でさえ、 半分以上翻訳に失敗することがわかる。
| <副詞(句・節) 1,047 (54.7%)> | ||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||
副詞以外に翻訳されるものとしては、形容詞が26.1%で最も多く、 次いで動詞の22.0%、以下、接続詞、決定詞、代名詞、名詞などと続き多岐にわたっている。 また、日本語の副詞が英語と対応がとれないような場合も10.2%(全体の2.9%)とかなり多い。
| <副詞以外 551 (28.8%)> | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
[形容詞として翻訳される場合]
日本語の副詞が形容詞として翻訳される場合は以下のような 場合がある3
| (1) | 名詞修飾する場合 52 (36.1%) |
| 「した」、「とした」、「するような」などを伴う場合 30 (20.8%) <57.7%> | |
| あっさりしたデザイン | |
| → a simple design | |
| 「な」、「の」などの助詞を伴う場合 19 (13.2%) <36.5%> | |
| かちかちな菓子 | |
| → hard candy | |
| 「たる」を伴う場合 3 (2.1%) <5.8%> | |
| ごうごうたる爆音 | |
| → A noisy roar | |
| (2) | 日本語と英語で構造が変化し、それに伴い形容詞となる場合 46 (31.9%) |
| 父は頭がかちかちです | |
| → My father has a hard head | |
| (3) | 述語型 38 (26.4%) |
| 「している」、「だ」、「です」などが伴う | |
| あの奥さんはしょんぼりしている | |
| → That woman has been dejected | |
| (4) | その他8(5.5%) |
一番多いのは、「した」のような形式的動詞や助詞や助勤詞を伴い 副詞ではあるが全体としては形容詞的な働きをする場合である。 次に多いのは、日本語と英語の言語表現習慣の違いや発想の違いから 文構造に変化が生じる場合である。 その次は「している」や「だ」や「です」が伴い状態などを表す形容詞となる場合である。 特殊な場合としては、日本語用言が英語でイディオム述語となり、 述語修飾の副詞が、イディオム内の名詞を修飾する形容詞となる場合などもある。
| 仕事がなくて甚だ困っている | |
| → I'm at a complete loss for lack of a job |
ところで、「な」や「の」のような助詞を伴う副詞がすべて形容詞として翻訳されるわけではない。 例えば、以下のような場合は、日本語と英語の言語表現習慣の違いから、 文構造が変化し、結果的に英語でも副詞として訳される。
| 副詞に「な」がついても形容詞化されない例 | |
| 私の祖父はもう相当な年です。 | |
| → My grand father is very old. |
[動詞として翻訳される場合]
動詞に翻訳される場合も大きく以下のように分けることができる。
| (1) | 構造変換型 |
| しくしく痛むんですか | |
| → Is it a gripping pain? | |
| (2) | 述語型 |
| 髪を洗ったら、頭がさっぱりした | |
| → When I washed my hair, my head felt refreshed | |
| (3) | 様相型 |
| どうやら遅刻しないで済んだ | |
| →I managed to arrive at school just in time |
[接続詞として翻訳される場合]
接続詞となる場合は、「ても」、「なら」、「たら」、「ば」、「と」などの接続助詞や 「時」、「以上」、「場合」などの名詞による接続表現とともに条件を表す場合がある。 また、「ついでに」や「左様」のように副詞を接続詞的に使っている場合もある。
| (1) | 条件を表す場合 |
| もし危険があるならば、早く逃げなさい | |
| → Get out quick if there's any danger | |
| もし痛みがなかなか取れない場合には、医者に早く行きなさい | |
| → Go immediately to a doctor if the pain will not go away | |
| (2) | 接続詞的な副詞 |
| 東京に来たついでにちょっとお寄りしました | |
| → As I came up to Tokyo, I just called on you | |
| もう君には金を貸さないから、左様心得ろ | |
| → I won't lend you any money, so try to understand |
[決定詞として翻訳される場合]
決定詞として翻訳されるのは、主に、「たくさん」や「少し」などの数量の程度を表す副詞である。 距離や時間などの程度を表す副詞や「こ・そ・あ・ど」を使った程度を表す言い方も 決定詞として翻訳される場合がある。 日本語と英語の言語表現習慣の達いや発想の違いから文構造に変化が生じる場合と、 助詞「の」などが伴い形容詞的表現になる場合がある。 ただし、程度を表す副詞は英語でも基本的には程度を表す副詞で表現される。
| (1) | 構造変換型 |
| あの図書館には良い本がたくさんある | |
| → The library has a lot of good books | |
| (2) | 名詞修飾型 |
| あの人は少しのことですぐ怒る | |
| → that person soon gets angry about little thing |
[代名詞に翻訳される場合]
代名詞で表現される多くの場合は不定代名詞である。 これも数量の程度を表す表現が、文の構造変換のために不定代名詞で表現される場合が多い。
| 不定 | 24 | (1.3%) | <72.7%> | |
| 指示 | 5 | (0.3%) | <15.2%> | |
| 疑問 | 1 | (0.1%) | <3.0%> | |
| 関係 | 1 | (0.1%) | <3.0%> | |
| 人称 | 1 | (0.1%) | <3.0%> |
| (1) | 不定代名詞 |
| もう、十分に戴きました | |
| → I've already had enough | |
| (2) | 指示代名詞 |
| ああして、こうしてといちいち教えなげればならない | |
| → I have to teach her to do this and that and every little things |
[名詞で翻訳される場合]
名詞で表現される場合は、ほとんどが、 日本語と英語の言語表現習慣の違いや発想の違いから文構造に変化が生じる場合である。
| (1) | 構造変換した場合 |
| 次々にお客が来ました | |
| → have a constant stream of visitors | |
| (2) | 助詞を伴い名詞修飾表現になっているものがさらに構造変換した場合 |
| 種々の方法を試してみる | |
| →test a variety of methods |
日本語の副詞が他の文要素と一体となってある決まった英語表現になる場合は、 英語が動詞になる場合が最も多く、ついで副詞、形容詞・決定詞、慣用表現などである。
| <他の文要素と一体で翻訳 316 (16.5%)> | ||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||
英語で動詞となる典型的な場合は、様態を表す副詞(擬音・擬態語を含む)が、 動詞と一体となって英語で動詞として翻訳される場合である。
| ゆっくり + 休む | → | take it easy | |
| よちよち + 歩く | → | toddle along |
副詞となる場合は、慣用的で一単語として扱って良いような場合
| いつも + のように | → | as always | |
| 概して + 言えば | → | speaking in general | |
| どうにか + こうにか | → | this far |
と副詞+否定の表現で副詞となる場合
| 絶対 + ない | → | never | |
| ちょっと + まい | → | hardly |
である。
慣用表現として翻訳される場合は、日本語でも慣用的な表現である。
| お食事はいかがなさいますか | |
| → What would you like to do about dinner | |
| どうかよろしくおねがいします | |
| → I would like to have your cooperation |
機械翻訳における副詞翻訳の研究報告は非常に少ない。 日英機械翻訳研究では、我々が行なっている英語副詞を適切な位置に生成できるように、 副詞の文法的機能と意味と単語による優先的な出現位置 (文頭、中位、文末、前置、後置)の傾向から、英語の副詞を43種に分類することにより 英語副詞の生成位置を決定する研究(9)や、 副詞的な意味を計算機内で表現する方式の研究(11)がある。 また、日本語長文の翻訳の問題を解决するための日本語の副詞呼応に関する 研究(6)がある。
英日機械翻訳研究では、英語の副詞について、 文中で現れ得る位置と、修飾語と被修飾語の関係から分類し、 構文解析に利用する研究(4)が行なわれている。
副詞を扱った自然言語処理としては、英語に関して、 言語学者の副詞の意味や構文に関する知見を辞書に取り込むことにより、 副詞の意味の暖味性解消や生成の単語選択に利用する研究が 行なわれている(2)。 また、日本語に関しては、「時」の副詞と動詞の係り受けの制約に関する 研究(7)や、様相演算子を用いて、 ある動作の状況からその心理状態にあった副詞を生成する 研究(14)がある。
機械翻訳において副詞翻訳に関連する研究は少しずつ進展してきているが、 まだまだ十分研究されておらず、いまだ初期段階にあるといえる。
日英機械翻訳の副詞翻訳の現状をの例として、 我々が開発している機械翻訳システムALT-J/Eでの副詞翻訳について述べる。
日本語解析で副詞として解析されるものは以下のものである。
| (1) | 形態素解析で副詞とされる場合 |
| はっきり話す | |
| (2) | 形容詞の連用形が用言に係っている場合 |
| 速く走る | |
| (3) | 形容動詞の連用形が用言に係っている場合 |
| 静かに座る | |
| (4) | 形容動詞型用言性名詞が用言に係っている場合 |
| たくさん食べる | |
| (5) | 時詞または時詞+「に」 |
| 今日滞る | |
| 夕方に着く | |
| (6) | 用言性名詞を伴う接頭辞 |
| 大成功する |
英語で副詞句になるものを翻訳できるように、以下の場合に対処している。
| (1) | 時詞を主名詞とする名詞句 |
| 今日の夕方(に) | |
| (2) | 埋め込み文を含む時を表す表現 |
| 彼女が死んだ朝に |
英語で副詞句になるものは基本的には副詞的格要素として扱っている。
| (1) | 場所を表す表現 |
| 東京で | |
| (2) | 時を表す名詞連続複合語(+「に」) |
| 平成7年3月24日(に) | |
| (3) | 名詞+特定の接尾辞+「に」または「で」 |
| 駅前で | |
| 3年前に |
また、副詞を生成するための処理としては様相情報から生成する方法を用意している。
| 容易 易い、良い | |
| easily | |
| 完全にする 切る、尽くす、抜く、通す | |
| completely | |
| 過剰 過ぎる | |
| too (with adjective) | |
| too much (with verb) | |
| ネバー否定 (たことが)ない | |
| never | |
| 推量 だろう、であろう、と思われる | |
| probably | |
| 不確実な推量 かねない、かもしれない | |
| possibly | |
| 排他的断定 だけだ、にすぎない | |
| only | |
| 頻度少 ことが少ない | |
| rarely | |
| 頻度多 ことが多い | |
| often | |
| 頻度 ことがある | |
| sometimes | |
| 部分否定 わけではない、とは限らない | |
| not necessarily | |
これらは、必要に応じて 日本語書き替え機能(15)などを用いて 日本語表現から英語で副詞で表現されるような様相的情報を解析し、それに基づき翻訳する。
さらに、副詞が副詞以外に訳される場合に対処する一つの方法として、 副詞の訳語が前置詞句型のイディオム副詞のときに、それをさらに修飾する副詞がある場合は、 修飾する副詞を形容詞に変換して翻訳する機能をもっている。
| 急いで → in a hurry | |
| 非常に急いで → in a great hurry |
副詞+用言(副詞+「する」も含める)を述語に訳出すべき場合に関しては、 日本語の単位文構造を英語の単位文構造に変換するために、 我々が用意しているパターン対辞書の記述することにより対応できる機能を持っている。
副詞の訳語選択に関しては、 その副詞を支配する用言や様相や時制などを条件として使用できる機能を持っている。
述語との関係で訳語選択する条件としては、以下に示すおおまかな意味による分類(動詞種別)と、 もう少し細かい意味のレベルまで記述できる名詞の意味体系を援用した動詞カテゴリがある。
| <動詞種別> | ||
| 中相動詞 | 売れる、煮える、崩れる | |
| 意志動詞 | 流す、落す、与える | |
| 無意志動詞 | 流れる、落ちる、降る | |
| 状態動詞 | ある、 いる、できる、泳げる | |
| 継続動詞 | 走る、歩く、働く、降る | |
| 瞬間動詞 | 始まる、終わる、死ぬ | |
| 引用動詞 | 考える、思う、発表する | |
| 「が」格対象動詞 | ほしい、できる、たい |
例えば、「丁寧に」の訳としては、‘politely’+‘carefully’を辞書に用意しているが、 「丁寧に - carefully」の対照辞書エントリには訳語選択条件として「見る」、「聞く」、 「書く」に関する動詞の場合に‘carefully’に訳すという条件が書いてある。 それ例外の動詞がくる場合‘polite’で訳すように記述してある。
様相を条件として利用する例としては「まだ - yet」が挙げられる。 「まだ」の訳としては、‘still’、‘more’なども考えられるが 「否定」の様相と同時に単位文に現れる場合は、この様相の訳語条件により‘yet’と訳す。
また、時制を条件として利用する例としては、「もう」の訳語選択条件として、 過去もしくは現在時制の場合には‘already’、 未来時制の場合は‘now’と訳す例を挙げることができる。 「もう」の場合は、様相が「疑問」の場合は‘yet’を用いる。
その他に、英語で副詞として表現される場合としては、 日本語の用言が英語で述語+副詞で表現される場合である。 これも日本語の単位文構造を英語の単位文構造に変換するパターン対辞書で 記述できるようにしている。
| 実行する → carry out |
副詞翻訳の最大のポイントは副詞的表現の意味を把握することである。 これが決まると、 副詞をどのように英語で構造かすべきかや訳語として何を選ぶべきかが决定できる。
第2節の日本語副詞の訳語調査の結果から、 比較的に対応構造が単純で構造や意味の把握が処理のしやすいものと 処理の困難なものとの区別ができる。 日本語と英語の構造が変っても部分的でシステマティックなものは処理しやすい。 そのようなものから順次解決していく必要がある。 また、頻度の多さも重要な要素である。 このようなことを考えると、 当面は副詞や副詞+用言が述語として表現される場合を目標にするのがよいのではないかと考える。
我々のシステムではこのようなものを記述する機能は持っているが、 これらを扱う実際のパターン対辞書の量は現在まだ十分とはいえない。 今後補強して行く必要がある。 副詞や副詞+用言が述語として表現される場合は擬音語・擬態語のものが多く、 口語体の文章を翻訳するには特に重要である。
ここでは日本語の副詞がどのように訳されているかを、概括したが、 実際に日本語の副詞的表現と英語の副詞的表現の対応を正確にとるためには、 日本語の副詞を分類して、さらに細かな対応関係を把握する必要がある。 例えば、頻度や時間を表す表現は、英語でも副詞として表現されやすいこと。 ある種の程度を表す副詞は不定代名詞や決定詞に翻訳されやすいなどの傾向があり、 細かいレベルでの分析も実際に構造を変換させたり、訳語選択を行なう時に重要になる。
副詞の訳語選択の問題は、動詞、形容詞、形容動詞、 名詞などが用言とそれを修飾する格要素の関係でかなり、訳語を絞り込むことができるのに対し、 副詞は、訳語選択の条件が、多面的であることである。 前の節で示した、用言との意味関係や様相、時制との関係ばかりではなく、 公式な文か非公式文かなどや、英語側の述語の品詞が動詞か形容詞かなども考慮する必要がある。 「早速」の訳として考えられる ‘immediately’,‘at once',‘right away’,‘right off’などは後のものほど口語的で、 公式な場では使われなくなる。 また、「非常に」の訳である‘very’,‘very much’は それが修飾するものが形容詞・形容動詞の場合は‘very’、動詞の場合は‘very much’となる。
副詞の訳語選択条件は多面的ではあるが、 その中でも最も重要であると思われるのは用言との関係である。 現在我々が使用している動詞種別では、分類が大まかすぎて訳語選択条件としては、 ほとんど利用できない。 動詞カテゴリは、 用言と格要素の意味関係の制約条件を記述するために我々が開発した名詞の意味体系の中の、 用言性名詞(「勉強」、「記述」など)のカテゴリを利用したものであるが、 もともと違う利用の観点から作られたものなので、使い勝手があまりよくない。 副詞の訳語選択に使用するためには かなりきめの細かいレベルまで用言の意味を分類したものを用意する必要がある。
我々は文の省略要素の捕完を実現するための文脈処理に利用するための、 きめの細かいレベルまで用言の意味を分類した 用言意味属性体系(8)を持っている。
この用言意味属性体系をもとにして、副詞翻訳にも利用できる用言意味属性体系へと発展させる。
日本語の副詞が英語でどのように翻訳されているかを明らかにするとともに、 現在、日英機械翻訳で副詞がどのように翻訳されているのかを示し、 その改良案について述べた。 実際に、日本語の副詞的な表現を英語に翻訳する場合に辞書に、 どのような訳語選択条件を記述すべきか、 どのような構造変換のルールを用意すべきかなどの検討は、 実際の言語現象を詳細に検討し決める必要がある。 このためには、大量の日英対応言語データ(3)や、 これを検索するシステム(13)が必要である。 また、日本語と英語の表現習慣の違いや発想の違いから構造が変わる場合については、 変換の条件を見つけ出すのは、なかなか難しい作業である。 このような部分については用例による翻訳方式などを併用することが有効であると思う。
副詞はその文法的な機能の多様性により、いろいろの翻訳現象を引き起こす。 副詞翻訳には機械翻訳における問題点のかなりの部分が含まれており、 これを研究することは、機械翻訳システム全体の機能向上に貢献するものと思う。