換言事例の収集
--機械翻訳における多様性確保の観点から--

白井 諭    山本 和英

ATR音声言語通信研究所
E-mail: {shirai,yamamoto}@slt.atr.co.jp



[ 言語処理学会第7回年次大会 ワークショップ論文集, pp.3-8 (2001年3月). ]
[ In Proceedings of Workshhop, 7th Annual Meeting of ANLP, pp.3-8 (March, 2001). ]



目次

     1 はじめに
2 背景
3 収集条件
  3.1 網羅的な用例の収集
  3.2 多様な用例の収集
4 収集情況と考察
  4.1 用言の種類と例文の収集情況
  4.2 作業経過と問題点
  4.3 考察と今後の課題
5 おわりに
  謝辞
  参考文献
付録A: 和語動詞の対訳換言例文
付録B: 複合和語動詞の対訳換言例文
付録C: イ型形容詞の対訳換言例文
付録D: ナ型形容詞の対訳換言例文
付録E: サ変動詞の対訳換言例文



1 はじめに

機械翻訳を利用者の観点からみると,利用形態は,情報受信,情報発信,翻訳支援の3つに分類でき, それぞれ要求条件が異なっていると考えられる。 これまで,機械翻訳の開発者の立場ではほぼ一律に前編集と後編集が必要とされているが, 利用者の立場ではこれが大きな障害となっている。これらの必要性と許容度は利用形態に かなり依存するため,間単に整理してみることにする。

「情報受信」は,例えば,外国語の論文やホームページを見る場合である。 訳文品質は高いほど望ましいが,外国語を直接読むよりいくらかでも負担が少なくなるなら利用される。 この形態では,前編集の要求は不可と考えておく方がよい。 後編集は利用者自身が必要があれば自発的に行なうので,許容範囲は広い。 翻訳システムの多くはこの目的には対応していると考えられる。

「情報発信」としては,速報等を対象とした翻訳時間短縮への利用が考えられる。 これに該当するシステムの実現例は少数ではあるが存在する。 このタイプは,後編集を前提とするシステム構成では,翻訳時間短縮の効果が得にくくなるため, 後編集を必要としないだけの高い訳文品質が要求される。 その反面,若干であれば前編集は許容されるかもしれない。 しかし,訳文を眺めた上で前編集の要否を判定するシステム構成は不可であろう。 適切でない前編集の受け取りをシステムが拒否する実現形態が求められるのではないだろうか。

これに対して「翻訳支援」の要求条件は十分には検討されていない。 翻訳家による利用を暗黙の前提とし,前編集と後編集の両方を利用者に期待していると思われる。 しかし,翻訳支援として利用されるのは翻訳メモリか辞書検索にほぼ限られる。 機械翻訳が使われるとしても専門用語の訳語統一など辞書検索の代用に限定される。 翻訳家が機械翻訳を使用しない理由はいくつかあるが1, 情報発信の場合よりも訳文品質に対する要求条件が一段と高い点が共通する。 すなわち,開発側の直観的な期待に反し,最も難しい研究課題であるかも知れない。

翻訳家の後編集の内容は多岐にわたるが,1項目ずつ整理して切り出せば計算機による支援が可能であるものも少なくない。 後編集の1つとして文が単調になるのを避けるため,同義語への置き換えや言い換えを行なうというのがある。 多くの翻訳家は経験の蓄積により整備されてきた独自(門外不出)の類語集を持っている場合が多く, これを使って単語置換を行なっている。 このとき,名詞置換は比較的単純に行なえるが,動詞置換は構文の修正も必要となるため手間がかかる場合が多い。

一方,前編集や後編集の効率化も検討されてきた。 前編集としては,専任の担当者を置く方法,ノウハウから手引き書を作成し制限言語的に運用する方法, 自動的に前編集する方法などが試みられている。 後編集としては,訳語や表現の変更を文書全体で統一的に反映させようとする方法が知られている。 これらは手段や手法には違いがあるが,翻訳システムの癖を規則として取り出そうとしていると言える。 すなわち,翻訳システムごとに個別対応が必要であり,自動化は難しいと考えられる。 逆の考え方として,あらかじめ様々な同義表現を用意し, 翻訳システムが受理可能なものに絞り込む方法を試みてもよいのではないだろうか。

こうしてみると,なるべく多様な表現を網羅し,それらの同義関係や類義関係を記述した表現集があれば, 上記のような要求にも一定の回答を与えられる可能性がある。 我々は,単語の類語集が存在するのに対し,構文の類義集が整備されていないことを課題として捉える。 そして,構文置換を可能とするための一環として,構文の類義集の実現に踏み出すことを考える。




2 背景

日本語語彙大系の構文体系[池原97]により,14,000件あまりの日英基本構文を対応付けることが可能となっている。 ここで,構文とは,動詞や形容詞などの用言と,それに支配される名詞と格助詞をパターンとして記述したものである。 しかし,用言の種類および用言ごとの用法の網羅性,同じ意味を表すことが可能な表現の種類の多様性, 構文における制約条件の記述等に問題が残されていることが報告されている[白井98]。

網羅性の問題は,人間用辞書と機械用辞書の性格の違いに起因する。 中辞典クラス以下の和英辞書では,人間用辞書の編集方針として,一定以上の使用頻度を持つ語彙や用法は網羅されるが, 比較的使用頻度の低い語彙や用法は意図的に除外されていると考えられる。 人間が使用するとき,目的とする語彙または用法が掲載されていなければ, 類義表現に言い換えて引き直すという形の試行錯誤を行なうことにより,目的に準じる語彙または用法を得る。 これと同様の機構を計算機処理で実現するのは極めて困難であるため, 機械用辞書では語彙や用法を網羅的に収録していることが要求される。 用例の収集とその抽象化により基本構文の網羅性を高めるための検討が継続されている[白井99]。

多様性の問題は,機械翻訳の利点の1つである訳語の統一性に起因する。 また,初期の構築作業を急いだため,日英基本構文の対応付けが1対1に限定された点も一因となっている。 訳語の統一性は,場合によっては訳文の単調性という欠点を招く。 機械翻訳をツールとして利用する場合,後編集の1つとして,類語集(シソーラス)を利用して表現を多様化することが行なわれている。 名詞等を置換した場合の影響は前後の数単語程度であるのに対し,動詞を置換した場合の影響は広範囲にわたることが多い。 単語の類語集があるように,構文に関する類義集があり,さらに機械翻訳で文型置換に対応できれば極めて有用であると考えられる。

条件記述の問題は,もともと構文体系は解析用に設計されたことと,人手により条件記述が行なわれていることを主因とする。 前者は,例えば「娘が孫を生む」を“<人>が<人>を生む”, 「犬が子犬を生む」を“<動物>が<動物>を生む”のように意味体系に基づいて名詞を抽象化し, さらにこの両者を統合して“<人>or<動物>が<人>or<動物>を生む”のように記述するため, ガ格の名詞とヲ格の名詞の相互の関連性が失われている。 “通常の”(正しい文を対象とした)解析処理における言語表現の受容には支障はないが, 誤りの検出に利用しようとすると検出洩れを生じるほか,言語生成において不適当な組合せが生成される。 また,後者は抽象化にバラつきが生じることがある。 後者については支援処理により均質化を試みている[秋葉00]。

構文体系を日本語解析や日英翻訳の基本辞書として整備していく上で,これまでは網羅性に重点を置いてきた。 現状では,低頻度の語彙や用法に関する情報を得るのに十分な量のコーパスを整備するのは容易ではないため, 人間の内省を活用するのが効果的であると考えられる。 一方,表現の多様性に関する情報は断片的なものしか存在せず,当面は言い換えながらデータを蓄積する段階であると思われる。 そこで,日英基本構文の網羅性向上の一環として収集された日英対訳用例文[白井99]を題材に, 日本文と英文の意味的対応を制約として,日本文に対する別の言い方の収集を試みたところ,十分実行できることが分かった。 また,英文に対しても同様の結果が得られた。 以下では,収集条件とそれに至る試行錯誤の概要,換言例文の収集情況について述べる。




3 収集条件

従来は構文体系の網羅性向上を主な狙いとして内省により例文作成を進めてきた。 内省による場合,作成された例文の恣意性が問題となる場合が少なからず考えられる。 しかし,特定の場面に適合する少数の例文だけを作成するのではなく,あらゆる用法を列挙するという課題設定であるので, 例文の恣意性の問題は起こりにくいと考えられる。 ただし,生成された例文が自然な表現と言えるかどうかが問題となる場合はあった。 これについては,同じ作業者がある程度時間が経ってから見直すか,別の作業者と相互検査することにより排除に務めた。

以下では,まず網羅性向上を目的として実施した際の設定条件を再掲し,次に多様性向上を狙いとして今回設定した条件を示す。




3.1 網羅的な用例の収集

最終的な目的は構文体系の網羅性の向上であるが,抽象化した状態の文型を収集するのは容易ではないため, まず様々な用法を例文という形で内省により網羅し,例文を抽象化する2段階で考えることにした。 例文作成の対象とする用言の選択として,現代語の用言として相応しいかどうかは個別に判定するが, 1つの辞書を選択して大まかな基準として利用する方針とした。 また,生成された例文が自然な表現かどうかが問題となる場合はあった。 これについては,同じ作業者がある程度時間が経ってから見直すか,別の作業者と相互検査することにより排除に務めた。 一連の作業経験を踏まえ,現在は次の条件を設定している2

(1)
現代国語例解辞典[林85,林97]所収の用言性の語を対象とし, 語釈や例文を参照し,または類推することにより例文を作成する。
<備考>自然な例文を作成できる語を対象とした。収録語のうち現代語として不適当と思われる語を除外した。 例文の作成を進めながら,例文作成が困難なものを,例文作成者同士の協議により除外した。

(2)
例文作成者の主観で,用言のニュアンスが異なると感じられるものを広く例文化し, 可能な限り「一般的で単純な名詞を格要素とする単文」とする。
<備考>日本語表現の作成作業として位置付ける。 すなわち,対応する英訳が異なるところまでは要求しない。 結果的に訳語が同じになっても許容する。

(3)
用言が終止形で終わる例文だけでなく,連用形や連体形の用法のニュアンスの違いにも留意して例文を作成する。
<備考>連用形の副詞用法や連体形の限定用法には慣用的なものがあり,それらの収集も対象とした。

(4)
用言1語当たりの2例文を最低目標とする。ただし,ある程度考えても例文が思いつかなくなるまで作成を行なう。
<備考>これまでの経験では, n 文の作成時間を t として, おおよそ t は n 2 に比例する。 10〜15分考えても新たな用法が思いつかなければその用言に対する作業を打ち切ることにした。

(5)
収集された例文に対して,可能な限り原文に忠実で,かつ,英語として十分通用するように,翻訳家に英訳してもらう。 (最低限度の意訳は許容する)
<備考>経験を踏まえ,英語を母語とする翻訳家と日本語を母語とする翻訳家の共同作業に委ねた。




3.2 多様な用例の収集

最も直接的な動機は,1つの日本語表現に対する複数の英訳を得ることである。 これは見方を変えれば英語表現を換言しているとも云える。 一方,ある英語表現が必ず特定の日本語表現から生成されなければならないわけでもない。 そこで,日本語の換言と英語の換言を並行して実施することにした。

換言事例の収集という課題は,元来は同一言語内で何らかの観点で同義の表現を収集するべきかもしれない。 しかし,例文が提示されるとそれに眩惑されて他の表現がなかなか思いつかない場合も少なくないし, 観点の種類をあらかじめ列挙しておくことも難しい。 そこでここでは日英の対訳対の存在を前提として,その日英の文対を制約として利用しながら,いわば多様な翻訳例文の作成として, 換言事例を収集することとした3

ここでいう換言は,例えば英作文の際,和英辞書に載っていない語や表現に出会ったとき, 日本語の別の類義表現を生成し,和英辞書を引き直すことを模したものである。 従って,翻訳対象言語に精通していない単言語話者にも作業可能であると考えられる。 しかし実際問題として,考えついた別の表現が和英辞書に未集録であるという状態が連続して発生すると, 同義性の制約が徐々に甘くなっていく,すなわち意味のずれが拡大していく恐れがある。 そこで,今回は試行ということもあり,網羅的な用例収集の作業担当者とその例文の翻訳担当者に依頼した。 これは網羅性の確保の際に微妙な日英対応の判定が容易でなかった経験に基づく。 また,以下の条件設定は今回の問題点の分析を踏まえて改善していきたいと考えている。

(1)
前節で述べた日本語の用言に対する日英の対訳例文対を対象とする。

(2)
日本語の換言は,英文に多様な和訳をつけるつもりで行なう。 逆に,英語の換言は,日本語例文に多様な英訳をつけるつもりで行なう。

(3)
原則として,特殊な場面設定を必要としない中立的な表現を作成する。




4 収集情況と考察

構文体系の元となった構文意味辞書は,石綿らの結合価の考え方[石綿83]に基づき, 中辞典級の和英辞書の例文を抽象化することにより構築を開始した。 初期の版では,一般文型10,000件と慣用文型5,000件が収集された。 しかし,実験的評価により文型の不足が頻出することがわかり,文型を工学的に網羅する方法を検討した。 現実的には,低頻度の用法を収集するのに十分な量のコーパスを獲得するのは容易ではない。 そこで「内省」により様々な用法を例文として収集することとした。




4.1 用言の種類と例文の収集情況

用言ごとの様々な用法が例文として収録されているIPAL辞書[IPA87,IPA90]に着目し, ニュアンスの異なる用言の用法を例文として追加した。 次いで,国語辞書に基づいて用言の網羅性を高めることとし,用言選択の基準を現代国語例解辞典[林85]に求めた。 IPAL辞書に収録されていない用言を対象にして例文作成を継続中で,現在サ変動詞を作業中である。 また,途中から換言作業も並行して進めている。

表1に2000年12月末現在の収集情況を示す。 ただし「和語動詞/IPAL」は和語動詞のうちIPAL動詞辞書に収録されている語,「和語動詞/他」それ以外の語を対象としたことを示す。 なお,備考に作業順と作業内容を示す。 各項目は1〜3人年の作業量であった。ただし,一部並行して実施したものもある。 サ変動詞に対する換言は,他との比較では比較的容易であると言える。付録A〜Eに例文を示す。

表1: 用言の種類と例文数
  該当
用言数
作成
例文数
換言例文数 (換言文作成なし) 備考(作業順と作業内容)
日本文 英文 日本語 英語
和語動詞/IPAL 849 16,713 7,043 4,096 12,020 13,748 0(IPAL),1(追加),3(修正),8(換言)
和語動詞/他 936 1,883 0 0     7(収集)
複合和語動詞 2,101 3,701 1,212 480 2,487 3,220 4(収集),9(換言)
イ型形容詞/IPAL 136 2,156 530 219 1,626 1,937 0(IPAL),2(追加),6(修正),11(換言)
イ型形容詞/他 522 830 1,561 1,584 1 0 12(収集&換言)
ナ型形容詞 1,296 2,356 621 440 1,735 1,915 5(収集),10(換言)
(サ変動詞=途中) (131) (197) (338) (362) (1) (0) 13(収集&換言)
合計 5,840 27,639 10,967 6,819 17,869 20,820 (注)サ変動詞を含まず




4.2 作業経過と問題点

本節では,例文作成の作業経過と問題点を作業者の所感を踏まえて述べる。

この作業は,用言の用法を網羅する目的で開始された。 「和語動詞/IPAL」と「イ型形容詞/IPAL」は馴染み深い語が多く,若干の例外を除けば, 平均では1用言あたり10例文以上という多彩な例文が作成された。 例文の多さからIPAL辞書所収や作成済みの例文との用法の重なりの確認に手間取った。 特に,IPAL形容詞辞書はIPAL動詞辞書に比べて細かく語義分類され, 収録例文が細かなニュアンスの違いを対象としているため,さらに確認に時間を要した。 このため,類似用法の例文が重複するのを許容する度合いを高めた。

「複合和語動詞」や「ナ型形容詞」は用法が限定される語が多く,1用言あたり2例文以下にとどまった。 この反面,用法を短くまとめようとすると表現が不自然となるため,背景説明等を簡潔に付加する必要が発生した。 不自然さを感じても,復唱するとその度合いが薄れるのが普通であり,徐々に判断が難しくなる。 このため,作業者が相互検査したり,時間間隔をあけて再検査するなどにより,不自然さの除去に務めた。

「和語動詞/他」では用法の前に,その語が現代語かどうかで意見が割れる場合もあった。 類似語を用いた言い方と対比したり,相互検査により妥当性を判定したりしながら,可能な範囲で例文作成に努めていたが, それでも作成結果に自信が持てない場合が発生したため,作業者の判断で除外することも許容した。

換言例文の作成については,上記の例文作成作業中も基本構想は温めていたが,「和語動詞/他」の例文作成に至り, 類似表現との対比を並行する方が作業効率が高いのではないかと思われるようになった。 しかし,換言をどのような基準で実施するのがよいかについての具体的な条件設定は容易ではなかったため, とりあえず日英対訳対のそれぞれを目標訳として,その訳に相応しい表現を作成する基本方針を立てた。

この条件で,例文作成が比較的容易な「和語動詞/IPAL」と比較的困難な「複合和語動詞」について換言を試行した。 そして,日本人が和文英訳の際に和英辞書を引き直す場面を想定して,述語付近の同義表現の作成を対象とした。 この段階では,かなり厳密な同義性を要求条件とした。 この作業により,対象例文の1/2〜1/3に対して換言例文が作成された。

「ナ型形容詞」と「イ型形容詞/IPAL」で同様に換言を試みると,換言できたのは1/4程度とさらに作業が難しいことがわかった。 この原因は十分には分析できていないが,述語付近だけを換言するのが容易でないのが原因の1つとして挙げられる。 また,日本語の“彼は上手に泳ぐ。”に対し,“He is a good swimmer.”の方が“He swims well.”より英語的であろうが, 日英方向の原文に忠実な翻訳を中心的に考えてきたため,前者の訳はほとんど作成されていない。 そこで,日英対訳対を目標訳とする基本方針を拡大解釈し,むしろ訳文を作成するつもりで換言例文を作成することとした。

「イ型形容詞/他」では日本語例文を作成し,それに複数の英訳を付与し,その結果を見てさらに別の日本語例文を作成した。 この作業では基本対訳を例文数の2倍程度の換言例文が作成された。 現在,「サ変動詞」の例文作成を「イ型形容詞/他」と同様の条件による作成を進めており, 「イ型形容詞/他」の場合とほぼ同様の例文作成結果が得られている。




4.3 考察と今後の課題

例文作成の方針は3節で述べた通りであるが,前節で述べたような試行錯誤の結果として設定されているものである。 次のような問題が複雑に入り組んでいると思われる。 特に,換言例文の収集に関してはようやく一定の条件設定に至った段階であり,妥当性を検討する必要がある。 また,最近の研究成果[石綿99]を踏まえて結合価の考え方自体も再検討する方がよいと思われる。

(1)作業の習熟度
初期の作業には作成量や多様性の点で不満が残る(作業者の方が不満の程度が大きい)。 IPAL所収の動詞と形容詞を対象とした作業では見直しを行なったが,他の例文についても見直すべきかも知れない。 換言例文の作成については,試行錯誤が終った段階であるとも言えるので,その必要性が特に高いかも知れない。 また,再検査により例文の品質自体を高められそうである。

(2)動詞か形容詞か
動詞には連用形の副詞的用法(例:次いで)は少なく,連体形の用法や終止形の用法も意味的に差がないことが多い。 これに対し,形容詞には連用形の副詞的用法だけでなく連体形の限定的用法も多様で慣用的な結び付きも少なくない。 また,終止形の用法がないと思われることもあったが,本当に一般的でないことを客観的に示しにくいため, 例文作成の打ち切り判断に迷う場合が頻発した。

(3)一般的か慣用的か
当初は一般文型の収集に重点を置き,結果的に慣用文型とすべきものを許容する形態を取った。 慣用的なものを網羅的に収集するのは容易でないと考えたからである。 しかし,慣用文型と一般文型の明確な分離が難しい場合も少からず存在する。 すなわち,慣用文型の中には文字通りの解釈が可能なものもあり,その逆の場合もある。 換言という観点ではむしろ慣用的なものも網羅しておく必要があろう。

(4)多義的か個別的か
多義性の大きい用言では例文作成数が多くなり,例文全体を見渡しながら用法の網羅性を検討するのは容易でない。 一方,個別的な用言は自然な例文を作成すること自体が容易でないばかりか, 場合によっては背景説明加えるかどうかの判断を必要とするなど作業効率が悪い。 このような両極端の場合には何らかの作支援を行なうことが必要である4

(5)換言の程度
当初は構文体系を拡張する観点から述語部分の換言を重点的に進めてきた。 しかし,格要素と用言の組を単位として換言すると多様な表現が成立する場合があり,徐々に条件を緩めつつある。 大前提である訳文の対応の保証のみの制約でも構わないかも知れない5。 あるいは,換言の結果を日英の作業者が相互に交換して再検討してみるのも有効かも知れない。

また,今後は次のようなものも収集対象としたい。 これらは国語辞書の表面的な情報から対象語を拾い出すことは難しいので,抽出の方法から検討を始める必要がある。

(a)
逐語訳的でない英語表現が存在する場合。
例:彼は樽の口をあけた。→ He tapped the barrel.

(b)
日本文の述語名詞が名詞に英訳されない場合。
例:今日は晴れだ。→ It is fine today.

(c)
口語的でくだけた表現の場合。
例:トホホな計画。→ helpless/pitiful plan.




5 おわりに

日本語用言の例文収集について現状と作業上の問題などを紹介した。 具体的には,様々な用法に該当する例文を網羅的に収集する上で「アンケート」に準じた内省が有効であることを報告した。 また,換言例文を作成するには,日英翻訳または英日翻訳の要領で,様々な訳文を作成するのが有力な方法であることを示した。

本稿で紹介した方法は,経験の積み重ねにより作業形態を少しづつ進化させながら到達したものであるため, 初期に作成した例文には見直すべき問題も少からず残されている。 また,名詞が述語となる場合などはほとんど収集していないが, 属性的に働く場合や,話し言葉における多用[竹沢01]への対応も視野に入れて, 対象語をどのようにして絞り込むかから検討を始めたい。

例文作成作業は,当初は構文体系の網羅性を向上すること,すなわち,機械翻訳における用言未知語を低限することが目的であったが, 多様化の観点を加えることにより,例文集自体の利用範囲の拡大が期待される。 例文集の有効利用についても考えていきたい。




謝辞  (株)CANNACの鳴海武史氏,武智しのぶ氏, 相澤弘氏らには例文収集の実施に関して多大なご協力を賜わった。 NTTコミュニケーション科学基礎研究所のFrancis Bond氏らには換言事例の収集に関してご討論頂いた。 Uta Brace氏とAlan Brace氏には微妙なニュアンスの違いの訳出をご検討頂いた。 ATR音声言語通信研究所の森田千秋氏には例文集を校正して頂いた。 これらの方々を始めとする関係各位に深謝する。 また,様々なご教示を賜わったEDRの荻野孝野氏,IPAL関係の青山文啓氏,橋本三奈子氏,柏野和佳子氏に感謝する。




参考文献

[Akiba00]
Akiba, Yasuhiro, Hiromi Nakaiwa, Satoshi Shirai & Yoshifumi Ooyama(2000). “Interactive generation of a translation example using queries based on a semantic hierarchy”. In Proceedings of ICTAI00 (The 12th International Conference on Tools with Artificial Intelligence), pp.326-332.

[藤田00]
藤田篤,乾健太郎,乾裕子(2000). “名詞言い換えコーパスの作成環境”. 電子情報通信学会 技術研究報告, TL2000-32, pp.53-60.

[林85]
林巨樹(編)(1985). “現代国語例解辞典(第一版)”. 小学館.

[林97]
林巨樹(編)(1997). “現代国語例解辞典(第二版)”. 小学館.

[池原97]
池原悟,宮崎正弘,白井諭,横尾昭男,中岩浩巳,小倉健太郎,大山芳史,林良彦(編) (1997). “日本語語彙大系”. 岩波書店.

[IPA87]
情報処理振興事業協会 技術センター(編) (1987). “計算機用日本語基本動詞辞書IPAL (Basic Verbs)”, 解説編&辞書編.

[IPA90]
情報処理振興事業協会 技術センター(編)(1990). “計算機用日本語基本形容詞辞書IPAL (Basic Adjectives)”, 解説編&辞書編.

[石綿83]
石綿敏雄,荻野孝野(1983). “結合価から見た日本語文法” & “日本語用言の結合価”. 文法と意味I (水谷静夫,石綿敏雄,荻野孝野,賀来直子,草薙裕(編)), 朝倉書店.

[石綿99]
石綿敏雄(1999). “現代言語理論と格”. ひつじ書房.

[白井95]
白井諭,池原悟,横尾昭男,井上浩子(1995). “日英機械翻訳に必要な結合価パターン対の数とその収集方法”. 情報処理学会 研究報告95-NL-110, pp.43-50.

[白井98]
白井諭,横尾昭男,中岩浩巳,渡邊いづみ,高橋直美,関嘉代,池原悟,宮崎正弘(1998). “構文意味辞書と構文体系”. 言語処理学会 第4回年次大会, B2-2, pp.194-197.

[白井99]
白井諭(1999). “結合価パターン対の網羅的収集に向けて --日英機械翻訳の観点から--”. 「言語資源の共有と再利用」シンポジウム.
http://www.etl.go.jp/etl/nl/sympo99/programme.html

[竹沢01]
竹沢寿幸,白井諭,大山芳史(2001). “バイリンガル旅行会話に見られる話し言葉の特徴分析”. 情報処理学会 研究報告, 01-NL-141-22, pp.137-144.




付録A: 和語動詞の対訳換言例文(一部)

J0 彼の企画が当たった。
J1 彼の企画が成功した。
E0 His plan was a success.

J0 彼はその漢字を辞書に当たった。
J1 彼はその漢字を辞書で調べた。
E0 He looked up that character in the dictionary.

J0 私は彼の行き先について友人たちに当たってみた。
J1 私は彼の行き先について友人たちに聞いた。
E0 I asked his friends about his destination.
E1 I questioned his friends about his destination.

J0 彼は暑さにあたった。
J1 彼は暑さ負けした。
E1 He was affected by the heat.

J0 私の予想が当たった。
E0 My prediction was right.

J0 彼はふぐにあたった。
E0 He was poisoned by eating blowfish.




付録B: 複合和語動詞の対訳換言例文(一部)

J0 競技場は大勢の観客で膨れ上がった。
J1 競技場は大勢の観客で身動きできなかった。
E0 The athletic field was swamped with spectators.

J0 蜂にさされたあとが膨れ上がった。
J1 The place where I was stung by the bee has swollen up.

J0 この都市の人口は10年前の2倍に膨れ上がった。
J1 この都市の人口は10年前の2倍だ。
E0 The population of this city is double what it was 10 years ago.
E1 The population of this city has doubled in the last 10 years.




付録C: イ型形容詞の対訳換言例文(一部)

J0 彼の態度は好ましい。
E0 His attitude is favorable.

J0 彼は我が社には好ましくない人物だ。
E0 He is not the kind of person we want in our company.

J0 ディナーには正装が好ましい。
J1 ディナーには正装が望ましい。
E0 Formal attire is desirable for dinner.

J0 ジャガイモは常温での保存が好ましい。
J1 ジャガイモは常温での保存が最もよい。
E0 It is best to keep potatoes at room temperature.
E1 Potatoes should be kept at room temperature.




付録D: ナ型形容詞の対訳換言例文(一部)

J0 私は今の地位に満足だ。
E0 I am satisfied with my present position.

J0 私は昨日から満足な食事をしていない。
J1 私は昨日からまともな食事をしていない。
E0 I have not had a proper meal since yesterday.
E1 I have not eaten a proper meal since yesterday.

J0 彼はアルファベットも満足に書けない。
J1 彼はアルファベットもろくに書けない。
E0 He cannot even properly write the alphabet.




付録E: サ変動詞の対訳換言例文(一部)

J0 彼らの攻撃は相手チームを圧倒した。(スポーツ)
J1 彼らの攻撃は相手チームを圧した。
J2 彼らの攻撃は相手チームをねじ伏せた。
E0 Their attack overwhelmed the opposing team.
E1 Their attack overpowered the opposing team.
E2 Their attack swamped the opposing team.

J0 私はナイアガラ瀑布の壮大さに圧倒された。
J1 私はナイアガラ瀑布の壮大さに威圧された。
J2 私はナイアガラ瀑布の壮大さに気圧された。
E0 I was overwhelmed by the scale of Niagara Falls.
E1 I was thunderstruck by the magnificence of Niagara Falls.
E2 I was awed by the scale of Niagara Falls.

J0 シートベルトが腹部を圧迫する。
J1 シートベルトが腹部を押さえつける。
E0 The seatbelt is pressing into my stomach.
E1 The seatbelt is pressuring my stomach.
E2 The seatbelt is digging into my stomach.





脚注
1 機械翻訳に理解ある翻訳家の意見を紹介する。 「機械翻訳による訳語の統一は有効であるが,前編集なしで最低でも段落単位で正しく訳されることが必要である。 その上での後編集なら総合的な省力化に役立つであろう。 そうでなければ,最初から自分で訳す方が効率的である。」 (参照元へ)


2 この条件設定に至るにはIPALプロジェクト関係の方々からの様々なご教示が参考になった。 (参照元へ)


3 Francis Bond氏との議論が出発点となった。 (参照元へ)


4 文献[藤田00]では名詞の言い換えを対象とする支援環境が提案されており,今後参考にしたい。 (参照元へ)


5 筆者らは厳密な意味で同義となる換言は存在しないと考える。 (参照元へ)