白 井 諭 | 横 尾 昭 男 | Francis BOND | ||
SHIRAI, Satoshi * | YOKOO, Akio * | Francis BOND ** | ||
N T T 情 報 通 信 処 理 研 究 所 | 豪・クィーンズランド大学</td> | |||
NTT Communications aand Information Processing Laboratories | Univesity of QUEENSLAND, Australia |
1 はじめに | |
2 ALT−J/Eの時制処理 | |
3 新聞記事翻訳における問題点 | |
4 新聞記事向きの時制処理 | |
5 おわりに | |
<謝辞> | |
<参考文献> |
日英機械翻訳による訳文を英語のネイティブスピーカが見ると, キーワードやキーフレーズの翻訳率が高ければ内容を推測しながら概要を理解できるが, 英訳文の時制が誤っていると,文自体が読みづらくなり, 内容を推測する際に混乱を生じやすいという問題がある。
筆者らは,多様な語彙・表現を持つ文を扱うことを目標に, 多段翻訳方式[1][2]を提案し, 日英翻訳システムALT−J/E[3][4]の 試作を進めている。 本稿では,上述の時制の問題を具体的に検討するとともに, 新聞記事向きの時制の訳出のアルゴリズムについて提案する。
問題点の分析に先だち,ALT−J/Eの時制処理の手順について概要を 述べる[1][4]。
(1)相の決定
動詞の分類に従って着目する文の相(開始相・継続相・完結相・静態相)を調べる。 例えば,状態動詞は継続相しか取りえないが,瞬間動詞は完結相または開始相を取りうる。
(2)アスペクトの決定
文の相と文中の副詞句・助動詞相当語句の組み合わせによって, アスペクト(開始相開始直前状態・継続相継続中状態など17種)を定める。 これにより,英語としての基本的な表現形式が決定される。 例えば,「ている」を伴う完結相は完結状態になり,英語では完了形に訳出されることになる。
(3)日本語側テンスの決定
時詞・述語の形式(ル形・タ形)と様相属性の組み合わせによって 日本語側のテンス(過去・現在・未来)を選ぶ。
(4)英語側時制表現の決定
英語への訳出に当たっては,節と節の関係を考慮して時制の一致を行ない, 英語側のテンス(未来・過去未来・現在・過去・大過去)を決める。 この後,既に決定済みのアスペクトと併せることにより,最終的な英語側の時制表現を生成する。
本稿で翻訳対象とする産業情報を扱う新聞記事には, 計画発表的なものと事実報告的なものが数多く含まれる。 計画発表記事は基本的には未来形に, 事実報告的なものは過去形または現在完了形に訳出すべきであるといえる。
2節のアルゴリズムにより,
ALT−J/Eを用いて1文単位で新聞30記事(日経産業新聞・情報欄のリード文,102文,
平均87.944.0字/文)を翻訳させた。
時制の訳出に限定して間額点を検討したところ,次の3種類に集約できることがわかった。
(1 | )現在形に訳出したが,未来形に訳出すべきもの | |
例: | 日立はコンピューターの国際戦略を強化する。 | |
Hitachi Ltd. strengthens the internstional strategy of a computer. | ||
★既に始まっていると誤解される恐れがある。 | ||
(2 | )未来形に訳出したが,開始相開始状態のアスペクトがあった方がいいもの | |
例: | NTTは二月一日から…用テレホンカードを発売する。 | |
NTT will put on sale a telephone card for … from February 1st. | ||
★単なる未来形ではなんとなく文のおさまりが悪い。 | ||
(3 | )現在形に訳出したが,現在完了形に訳出すべきもの | |
例: | 東芝は…装置を開発、…の名称で二月一日発売する。 | |
Toshiba Corp. developes … aparatus and will put on sale under the name of … on February 1st. | ||
★現在形では「通常開発に携わっている」の意味になる。 |
上記の項目別の102文中の度数分布を表1に示す。 以上の問題は,いずれも記事の概要を理解する上で致命的ではないが, 内容の推測を妨げたり,混乱させたりする要因となる。
項番 | (1) | (2) | (3) | その他 |
訳出した形 | 現在形 | 未来形 | 現在形 | 現在形 |
望ましい形 | 未来形 | 未来形+ 開始状態 | 現在完了形 | 未来形* |
度数(件) | 22 | 2 | 2 | 5 |
3節で述べた分類別に,望ましい形への訳出の可能性について検討し, アルゴリズムとして整理した結果について示す。
(1) | 述語自体に着目する。22件の内訳を併せて示す。 |
→A | :瞬間動詞のル形は未来形に訳出する。…13件 |
→B | :瞬間動詞ではないが,ル形を未来形とする動詞グループを設ける(販売する,開拓する,など)。…2件 |
その | 他(7件)には種々の要因が複合たものが混在しているため,本稿では処理の対象から除外した。 |
(2) | 助詞「から」を伴う時詞に着目する。 |
→C | :述語が未来形に判定されたもののうち,「十月から販売する」のように開始時が明記されていれば開始状態のアスペクトを付加する(最終的にはwill begin to 〜)。 |
(3) | サ変動詞の語幹止めと後方の述語に着目する。 |
→D | :着目する述語がサ変動詞の語幹止めで,後方に未来形の述語を伴っていれば,新聞の性質上,現在完了がよい。 |
現在,A〜DのアルゴリズムをALT−J/E上に構築中である。 なお,新聞記事以外への適用性を失わないように, 出典情報を与えて時制の訳出を制御することを併せて考えている。
新聞記事を翻訳する際のテンス・アスペクトの訳出アルゴリズムを提案した。 今後は本稿のアルゴリズムの適用性について評価を行なう予定である。
出典情報による時制の訳出制御に関しては,筆者らのグループの中岩浩巳氏による部分が大きい。 ここに記して感謝する。