リンクは自由!

コーパス言語学と自然言語処理

言語処理学会第7回年次大会パネルディスカッション(2001-03-27, 東京大学駒場キャンパス)
「コーパスベースの自然言語処理はなぜ言語学の役にたたないか?」(『予稿集』p.10)


後藤斉 (東北大学)

言語学を、人間の言語のしくみないし使用を対象にした組織的研究と 広く捉えたい。古代インドやギリシャの言語研究も言語学として共感できる部分は 多い(Cf. Robins 1997)。例えば、古代インドの音声学、パーニニ(前5-4世紀)の 形態論(語根と屈折・語形成規則)、『テクネー・グランマティケー』(前100年頃)の 品詞分類、アポロニオス・デュスコロス(2世紀)の統語論は現代言語学に つながっている。

言語学の歴史の中で、時代や学派によって、科学としての自覚の程度や、 データと理論、実用と思弁、個別言語と言語一般などといった関心の向かう 方向に関してある程度の幅が見られた。コーパス言語学は、新しい手法を 使いはするが、この言語学の流れの中におさまる。Leech(1992: 107)は、 コーパス言語学の特徴として:
(1) Focus on linguistic performance, rather than competence
(2) Focus on linguistic description, rather than linguistic universals
(3) Focus on quantitative, as well as qualitative models of language
(4) Focus on a more empiricist, rather than rationalist view of scientific inquiry
を挙げるが、これは言語学の中での違い(特にチョムスキー流のパラダイムとの 対比)を強調するものではあっても、言語学の流れにおける連続性や補完性は 当然のこととされる。また:
Corpus linguistics, like all linguistics, is concerned primarily with the description and explanation of the nature, structure and use of language and languages and with particular matters such as language acquisition, variation and change. (Kennedy 1998: 8)
コーパス言語学はこれまで語彙論、意味論、文法、文体論、社会言語学、 歴史言語学等の分野に適用され、辞書編集、言語教育等に応用されてきた。 これらはコーパス言語学が成立する以前から存在していた分野である。

一方、自然言語処理が工学であって、特定の目的をもっていたり特定の技術に 関係したりするものであるとすれば、それが規則に基づくものであれコーパスに 基づくものであれ、その目的や技術に当面関心のない言語学者(コーパス言語学 研究者を含む)にはそもそも無関係と感じられることは避けられない。 自然言語処理の一部は言語学の一部、とりわけコーパス言語学とは関心が重なる。 例えば、よりよいコーパスやそれを扱うツールの開発は双方にとって益がある。 しかし、究極的に目指すところが異なるのであれば、当然のことながら重なる部分は 大きくはない。

参考文献
Leech, Geoffrey. (1992) "Corpora and theories of linguistic performance", In: J. Svartvik (ed.), Directions in Corpus Linguistics. Berlin: Mouton de Gruyter.
Robins, R.H. (1997) A Short History of Linguistics, 4th ed. London: Longman.
Kennedy, Graeme (1998) An Introduction to corpus Linguistics. London: Longman.


copyright GOTOO Hitosi 2001
著作権法規に則って利用することができます。


「後藤斉の主な著作」に戻る
後藤斉のホームページへ戻る

URL:http://www.sal.tohoku.ac.jp/~gothit/nlp7.html
2019-04-04T15:31:11+09:00
All Rights Reserved. COPYRIGHT(C) 2001-2006, GOTOO Hitosi
Department of Linguistics
Faculty of Arts and Letters, Tohoku University
Aoba-ku, Kawauti 27-1
980-8576 Sendai, Japan

〒980-8576 仙台市青葉区川内27番1号 東北大学大学院文学研究科言語学研究室
後藤 斉 (E-mail:gothit/at/tohoku.ac.jp)
後藤にメールを送られる方へ