文学情報論Ⅰ

教育研究指導分野 共通科目
科目名 文学情報論Ⅰ
担当教員 野本 忠司
単位数 2
授業の概要 インターネット、コンピュータの発達に伴い、テキストデータベース(コーパス)は、いまや文学を含む人文学研究に不可欠な存在になりつつある。本講義では、データベースを実際に構築・発信する上で必要な、知識とスキルを習得することを主な目的とする。
講義では、具体的な資料を使ったテキストのモデル化技法、オントロジー、セマンティックウェブ、テキスト処理、ワールドワイドウェブ等、データベースを取り巻く様々な関連諸分野について概観していくが,特に計量文体学にフォーカスする。
また、実際に文学データベースの開発に携わっている方々を招いて、実情を話していただく。 参加者各自興味のある資料を用いて、小規模なデータベース作成・発信の演習(プロジェクト)も行う。
到達目標 本講義では特に以下を目標にする。
(1) 計量文体学の体系的知識を身につけること。
(2) R言語を含むテキスト解析に必要な技術を習得し,自らテキストの計量解析が実施できるようになること。
成績評価基準 A,B,C,Dの4段階評価
成績評価方法 演習プロジェクトの内容に基づいて判断する。
授業計画 以下のトピックについて講義する。1トピックは概ね1〜2コマ分の講義に相当する。
1. テキストをモデル化する
テキストの形式化、組織化に係る手法、考え方(メタデータ、ダブリンコア等)を学ぶ。
2. テキスト処理による情報の加工と操作
自然言語処理、文体分析、作者推定等、電子化テキストの様々な技術や応用について学ぶ。
3. セマンティックウェブとオントロジー (1)
現在進歩が著しいセマンティックウェブの基本的な考え方と文学研究への応用について学ぶ。
4. セマンティックウェブとオントロジー (2)
外部から講師を迎えて文学研究とオントロジーについて話をしていただく。
5. データの標準化について
テキストの形式化に必要な標準化言語について概観する。
6. 情報資源の共有化:その利点と取り組み
複数のデータベースを統合利用するための仕組みと実例について学ぶ。
7. 情報検索:SQLからGoogleまで
検索手法の歴史、考え方について概観する。
8. ワールドワイドウェブ:その構造と社会性
インターネットの規模と構造について最新研究を紹介する。
9. 各自のプロジェクトの発表
実施場所 国文学研究資料館
使用言語 日本語
教科書・参考図書 教科書:村上征勝.「文化を計る」(朝倉書店、2010年)
石田基広「Rによるテキストマイニング入門」北森出版.2017.
アンソニー・ケイ.「文章の計量:文学研究のための計量文体学入門」(南雲堂,1982)
Matthew L. Jockers. Text Analysis with R for Students of Literature. Springer. 2014.
また,講義は,パワーポイント,インターネットなどを活用して行う。
キーワード 計量文体学、テキストマイニング、R言語、自然言語処理、人工知能