目次 | |
83 | |
87 | |
(電子情報通信学会技術研究報告NLC97−12〔言語理解とコミュニケーション〕(1997)所収) | |
95 | |
(電子情報通信学会技術研究報告NLC97−13〔言語理解とコミュニケーション〕(1997)所収) | |
103 | |
(電子情報通信学会技術研究報告NLC97−14〔言語理解とコミュニケーション〕(1997)所収) |
これまでの日英機械翻訳研究のいわば集大成として, 日英翻訳システムで使用している機械用辞書のうち, 意味(語義)に関する部分を岩波書店から出版する運びになりました。 内容的には見直すべきも残されており,今後も改良を続ける必要性を感じています。 しかし,言語処理という動機から出発した辞書を多くの方に見ていただき, さらなる発展を目指すための区切りを付けた次第です。
このような機械辞書を作るに至った経緯について簡単に紹介させていただきます。
日本語処理の研究グループ発足(池原,宮崎,森崎) (日本電信電話公社 横須賀電気通信研究所 データ通信研究部 データ通信方式研究室) | |||||||||
1980年度 |
| ||||||||
主として,言語処理をキャッチアップするための基礎知識の獲得を目指す。 合理主義に分類される方法論による研究が主流であったが, 経験主義的に研究を進めているグループがあることを知る。 ただし,経験主義には泥臭さのみを強く感じ,その意義を認識するには至らなかった。 | |||||||||
1981年度 |
| ||||||||
漢字かな変換システムの構築を開始する。 新聞記事を対象としたことにより, 小規模の辞書ではトイモデル以上は望みえないことを実感する。 ただし,固有名詞を入れたことにより予想した以上に同形語処理が課題となる。 当時主流であった合理主義的方法論に疑問を感じ始める。 | |||||||||
1982年度 |
| ||||||||
日経新聞3カ月分(890万字)を漢字かな変換し,システムと辞書の改良を実施する。 自由文入力を受け付けることを決める。 この改良を通して経験主義の意義を体得する。 すなわち,大規模な辞書の重要性や, 個別の言語現象を丹念にルール化していくことの必要性を実感する。 | |||||||||
1983年度 |
| ||||||||
1983年夏「現代言語学批判」に出会う。 以降,三浦つとむ流言語過程説に傾倒する。 大規模辞書の必要性(質量変化の法則),経験主義の重要性(二重否定の法則)と, 合理主義の些未さを再確認する。 三浦言語学を日本語処理へ適用するためのシステム作りの模索を開始する。 | |||||||||
1984年度 |
| ||||||||
結合価パターン対変換基本処理を実現 (日本文音声出力実験システムの日本語解析を流用) 要素合成の不備を例外処理で補う世の中の機械翻訳に対し, 意味を失わない表現単位を変換の基本とする機械翻訳の方式を模索し, 表現単位として結合価パターン対を仮定する。 三浦文法がヒントになった名詞抽出法を考案し, 日本語索引自動生成システムの実用化にこぎつける。 | |||||||||
1985年度 4月から NTT 9月から 情報通信処理研究所 知能処理研究部 自然言語処理研究室 |
| ||||||||
単語の意味的用法を網羅的に記述した辞書(意味辞書)の構築を開始する。 単語辞書には日英翻訳に必要な各種の属性の追加記述も進める。 構文辞書(結合価パターン対)は実フィールドでの使用を前提に フルスケールでの収集を目標とする。 三浦言語学に基づく理論武装を開始する。 | |||||||||
1986年度 |
| ||||||||
計算言語学を全面批判し,三浦言語学に基づく新しい機械翻訳方式として論文投稿する (言語における話者の認識と多段翻訳方式)。 紆余曲折を経て査読コメントをクリアし,1987年未,情報処理学会論文誌に掲載される。 合理主義を志向するメンバとの意見調整に手間取ることが多くなる。 | |||||||||
1987年度 8月から 情報通信処理研究所 自然言語処理研究部 |
| ||||||||
経験主義と合理主義の立場の違いから,翻訳システムの評価をめぐり意見が対立する。 研究リソースの集約を図るため, 経験主義の立場をとるメンバ中心に日英翻訳の研究に一本化する。 | |||||||||
1988年度 |
| ||||||||
特定用途向けシステムの実現も視野に入れながら研究を進める。 電子協の機械翻訳コンテストに向けてシステムを改良する。 (最終的には参加せず。 その後,報告書との比較では他社よりも高精度を達成していた。) | |||||||||
1989年度 |
| ||||||||
特定用途向けのシステムの実現を継続する。 基礎研究への路線変更を打診されるが,実用志向路線を堅持する。 結果的にこの2年間のシステム改良は90年度の社外展示成功の伏線となった。 | |||||||||
1990年度 (2月から) 情報通信処理研究所 メッセージシステム研究部 |
| ||||||||
水谷東女大教授,長尾京大教授,成田阪大助教授らにデモを行なう。 やがて研究遂行の追い風につながる。 人工知能学会デモ(1990年7月;村上亜大教授の紹介)以降, NTTコレクション(社外向け展示会),同関西版, コミュニケーション東京(一般展示)など, 大規模な展示会への出展要請に応じる。 | |||||||||
1991年度 7月から 情報通信網研究所 知識処理研究部 |
| ||||||||
基本処理の大幅な改良と各種新機能の検討を開始する。 辞書の開発体制を強化する。 文の中で単語の品詞を定義する必要性から, 三浦文法に基づく係り受け解析の検討を開始する。 実用化に向けた実験システム作りを再開する。 機能試験文(3,700文)を対象にした改良を重点化する。 | |||||||||
1992年度 |
| ||||||||
基本処理の改良と新機能の実現を継続する。 機能試験文対象のチューンアップを重点的に進める。 係り受け解析方式の確立をめざし,例文の分析を進めた結果, 名詞と名詞の関係(特に並列),名詞と述語の関係(結合価パターン対), 述語と述語の関係(接続)を重点課題に設定する。 | |||||||||
1993年度 |
| ||||||||
南不二男の従属節分類の考え方を応用することにより接続関係の解析の手がかりを得る。 既存の辞書項目を参考にすることにより新語への属性付与を支援する処理を実現する (手作業の2倍以上の効率化)。 結合価パターン対の適用性を拡張するための処理の枠組み改良を開始する。 | |||||||||
1994年度 コミュニケーション科学研究所 (研究部なし) |
| ||||||||
結合価パターン対の追加収集を開始する(IPAL動詞辞書の例文を利用する)。 収集経過を踏まえ結合価パターン対の必要量を見積もる (一般20,000件,慣用5,000件,和語動詞のパターン対が大幅に不足)。 従属節の相互関係の解析法をまとめる。 引き続き個別の現象の整理を開始する。 | |||||||||
1995年度 |
| ||||||||
内省により和語動詞例文を網羅的に収集する。 商用の新聞記事データベースを利用して, 大規模な対訳例文集の作成に向けた検討を開始する。 結合価パターン対の作成支援処理の構築を開始する。 テンプレート型日英翻訳を実現する (市況速報記事では40%〜80%の文に適用される)。 | |||||||||
1996年度 7月から コミュニケーション科学研究所 知識処理研究部 |
| ||||||||
内省により和語形容詞例文を網羅的に収集する。 長文分割,括弧処理等,訳文品質向上に繋がる項目の予備的な検討を開始する。 形態素解析の改良に区切りを付ける(99.8%/語)。 語彙大系出版に伴う各種見直しから現状の問題を振り返る。 用例利用型翻訳の実証的研究を開始する。 | |||||||||
1997年度 |
| ||||||||
内省により複合和語動詞例文の網羅的に収集する。 対訳例文からの結合価パターン対の収集を加速する。 英和辞書からの結合価パターン対の取り込みの検討を開始する。 | |||||||||