文学情報論Ⅱ

教育研究指導分野 共通科目
授業科目 文学情報論Ⅱ
担当教員 野本 忠司
単位数 2
授業の概要・ねらい  インターネット、コンピュータの発達に伴い、テキストデータベース(コーパス)は、いまや文学を含む人文学研究に不可欠な存在になりつつある。本講義では、データベースを実際に構築・発信する上で必要な、知識とスキルを習得することを主な目的とする。
 講義では、具体的な資料を使ったテキストのモデル化技法、オントロジー、セマンティックウェブ、テキスト処理、ワールドワイドウェブ等、データベースを取り巻く様々な関連諸分野について概観していく。また、実際に文学データベースの開発に携わっている方々を招いて、実情を話していただく。参加者各自興味のある資料を用いて、小規模なデータベース作成・発信の演習(プロジェクト)も行う。
授業計画  以下のトピックについて講義する。1トピックは概ね1〜2コマ分の講義に相当する。
1. テキストをモデル化する
  テキストの形式化、組織化に係る手法、考え方(メタデータ、ダブリンコア等)を学ぶ。
2. テキスト処理による情報の加工と操作
  自然言語処理、文体分析、作者推定等、電子化テキストの様々な技術や応用について学ぶ。
3. セマンティックウェブとオントロジー (1)
  現在進歩が著しいセマンティックウェブの基本的な考え方と文学研究への応用について学ぶ。
4. セマンティックウェブとオントロジー (2)
  外部から講師を迎えて文学研究とオントロジーについて話をしていただく。
5. データの標準化について
  テキストの形式化に必要な標準化言語について概観する。
6. 情報資源の共有化:その利点と取り組み
  複数のデータベースを統合利用するための仕組みと実例について学ぶ。
7. 情報検索:SQL からGoogle まで
  検索手法の歴史、考え方について概観する。
8. ワールドワイドウェブ:その構造と社会性
  インターネットの規模と構造について最新研究を紹介する。
9. 各自のプロジェクトの発表
成績評価方法 演習プロジェクトの内容に基づいて判断する。
参考図書・参考資料 特に、使用しない。講義は、パワーポイント、インターネットなどを活用して行う。