大学共同利用機関法人 人間文化研究機構 国文学研究資料館

2018/11/28

異分野交流は国文研から

文系と理系を融合させる大型プロジェクト

大型プロジェクトは、一面「データベース構築プロジェクト」
なんだか文学とは程遠い気がするけれど、実は一般人にも文学が身近になる嬉しいシステム

『日本語の歴史的典籍の国際共同研究ネットワーク構築計画』

いわゆる大型プロジェクトの正式名称は「日本語の歴史的典籍の国際共同研究ネットワーク構築計画」です。略称は「歴史的典籍NW事業」ですが、では日本語の歴史的典籍とはなんぞや?ということですよね。簡単に言えば、近代以前、つまり明治時代までに日本人によって書かれた書物、古典籍のことです。二〇一四年から二〇二三年までの十年計画で、国文学研究資料館を中心に、国内外の大学や研究機関と連携をして進めています。

当初この事業は「日本語の歴史典籍のデータベース構築計画」と言われていて、古典籍そのものをインターネット上でどんどん公開しますよという仕事でした。国文研まで来ないと見ることができなかったものが、自宅にいて見られるようになるわけですから、僕のように地方にいた人間からすると、願ったり叶ったりなわけです。もともと国文研なんて敷居の高いところですし、夜中に開いてないですしね。研究者ではない一般の方々でも、古典籍を読みたいと思っているかもしれない。ウェブ上に公開されると、極端なことを言えば、国文研にアクセスしさえすれば、お金をかけずにダウンロードして読むことができ、研究者と同じ位置になれる。平等なわけですよ。これはきっと役に立つ。これは大きいな、自分も役に立つこともしてみたいなと思って東京に来ました。

江東区の宿舎住まいですが、通勤時間は苦になりません。東京のラッシュは大変だと言われていたのですが、まだその大変さは経験していません。ラッシュとは反対方向ですし。大阪では勤めていた大学が南港というところにあって、自宅のある兵庫県の篠山市から通勤に二時間かかっていました。福知山線が大阪から出ていますが、三十分に一本しかない! それに比べると、時間を気にせずに電車にのればいいのですから楽です(笑)。篠山、ご存知ですか? 栗や黒豆を使った和菓子が多い。和菓子は大好きですねぇ。基本的に関西は粒あんですよ。こしあんは東京の人が食べるものでしょう。

yamamoto.jpg

古典に親しむ

国文研のHPから「歴史的典籍NW事業」というところへアクセスしていただいて、「日本古典籍データセット」というところを見てください。ここからダウンロードできます。いちいち国文研にことわらなくても、実際の本のデータを自由に落とせます。たとえば、「豆腐百珍」って豆腐のレシピ本などもあります。面白いでしょう? 画像もどんどん使ってもらっていいのです。国文研所蔵とだけ書けばいい。内容を読んで研究しましょうという研究資料としての利用はもちろんですが、もっと別の使われ方をしてもいい。古典籍の中のこの絵をちょっと使いたいなと思う。それでもいいわけです。春の手紙にでも使ってみたいなと思ったら、梅を切り取って、国文研所蔵と書いてくれればどこに使っていただいても構いません。見るだけでもいいし、使っていただいても結構です。なんかよくわからないけれど面白そうだねと思っていただく、こういうところから古典に親しんでもらいたいと考えてオープンデータにしています。七百点ありますから、自由に使ってください。今後もどんどん増やしていきます。

このこと自体は、実は大型プロジェクトの話ではありません。大型プロジェクトを一般に広く知ってもらう入口であり、また我々研究者、特に異分野の先生方が古典籍を利用しやすくするためのものです。古典籍を見ようと思ったら、以前は研究者であってもまず国文研に来て閲覧申請をし、お金をかけて紙焼きか何かに落とすという具合でした。それがオープンデータになりましたから、今まで一番困難だった材料入手という段階がものすごく簡単になった。古典の中の同じ図柄をパパパッと見つけたいという時、他人の手を介さずに探したいという時など、材料を渡しますからどうぞ自由に使ってください、いちいち断らなくていいですよとしたわけです。するとそこから次の動きが起こってきます。「国文研のオープンデータの閲覧画面って見づらいね」となると、ある研究者が簡単に見られるものを作ってくれたり、とかね。こうして古典籍に親しんでいただける。

大型プロジェクトでは三十万点の画像データの公開を目標にしています。集めること自体も目標ですが、三十万点もの画像を、ひとりで全部見ることはできません。そこに「検索」が役立ってくるわけです。どうやって検索をかければ自分の必要な情報にたどりつけるか。検索機能の側面が大事になるんですね。私たちの今までの経験や考え方からすると、一つひとつの画像を繰っていくかと思われるかもしれませんが、タグという便利な機能を用います。例えばウェブ上に公開して、みんなでタグをつけてくださいと言えば、短時間でできてしまうでしょうね。さらに、多くの人が見ているわけですから、国文学の本以外にもこんな情報があるとわかってきます。それ自体がものすごい情報ですし、新たな発見になります。以前でしたら、この本は国文学の研究者が読む本、この本は理学の研究者が見る本、医学の人が見る本と、縦に分かれていました。ここに横串を刺すように検索できたら、どうですか? また新しい学問が生まれてくるかもしれない。異分野の方とセッションしながら古典籍という素材のもとに共同研究していく、それが狙いです。大型プロジェクトとはこういうことなのだと思います。

実際の共同研究

情報学研究所とも共同で検索について研究していますし、お隣の極地研究所とはオーロラのことで共同研究をしています。〈「古典」オーロラハンター〉は市民参加型で、古典籍や天文に興味がある一般の方々に参加してもらいました。古典籍・古記録のなかからオーロラに関する記述を抽出してもらったんです。「赤気」などという記述は「赤いオーロラ」を示しています。ここでみなさん思うんですね、「くずし字が読めないとできないんじゃないか」って(笑)。くずし字は、見るのも大変かもしれませんが、読もうとするから大変なんですね。文系の僕らは「字」として読もうとしますけれど、理系の人の発想は面白い! くずし字を輪切りにして、ひとつのスリットのベクトルを数値化する。そして同じものが他にあるかどうか探してくるわけです。読んで探すのではなく、形で探すわけです。くずし字を楷書にすることを翻字といいますが、いままでは全て専門家の手作業でした。ところが、公立はこだて未来大学と凸版印刷と国文研の共同でやって、簡単にいうと機械が半自動的に翻字するというところまで実際には進んできています。

過去の歴史を知ろうと思ったら、地層であるとか氷であるとか、あるいは書物であるとか、それらを読み解くしかないわけですよね。今生きている中でわからないことは歴史の中に見ていくしかない。そうなるとお互い、何らかのセッションが必要になってきます。たとえば普通のノートパソコンで進めていると時間がかかって仕方ないものも、今後はもしかすると統計数理研究所の大型コンピュータでやれば一気に進んでしまうかもしれない。僕ら文系の人間は手作業しか思いつかないことも、理系の先生に言えば「こんなもの機械にやらせれば」と教えてくれるんです。逆にこういう書物にこんな記録があるよとお伝えできるかもしれない。お互いに平等な立場のネットワークを作ること、二〇二三年までの十年計画です。十年間でどこまでできるか。大きなフレームを作って、それを持続させること、それが国文研にとって大事なことです。そこに情報が蓄積されていけば、大きなデータベースになって役にたつのではないでしょうか。

山本和明氏
国文学研究資料館古典籍共同研究事業センター副センター長・特任教授大阪府出身。川端康成が出た茨木高校卒業。神戸大学から同大学院博士課程を経て、大阪の相愛女子短期大学、相愛大学勤務。二〇一三年十月、大型プロジェクトのために国文研に着任。本来は、十九世紀の日本文学の研究者。山東京伝を専門にする。が、国文研に赴任してからは、データベース構築プロジェクト事業に専念。極地研の一般公開にも参加、すっかり理系の先生のように見える。

「えくてびあん」掲載記事より
※役職は掲載当時のものです。

ページトップ