《報告》「歴史的典籍オープンデータワークショップ~
使いたおそう!古典籍データ~」 グループ成果まとめ

    当館では2016年12月9日(金)に、「歴史的典籍オープンデータワークショップ~使いたおそう!古典籍データ~」を「人文科学とコンピュータシンポジウム じんもんこん 2016」の企画セッションとして開催しました。既に「速報」として報告しているとおり、当日は36名もの参加者があり、7グループに分かれて、それぞれ古典籍の活用方法に関する自由なディスカッションを行いました。
    このほど、本ワークショップの最後に発表された各グループのアイデアや意見などをまとめましたので、ご報告いたします。

日時2016年12月9日(金)    15:10~18:10
場所国文学研究資料館 大会議室
参加者数36人
主催人間文化研究機構 国文学研究資料館
共催情報処理学会 人文科学とコンピュータ研究会
人間文化研究機構 国立国語研究所
国立国会図書館
情報・システム研究機構 国立情報学研究所
情報・システム研究機構 データサイエンス共同利用基盤施設
関連リンク


国文研「オープンデータセット」サイト(http://www.nijl.ac.jp/pages/cijproject/data_set_list.html)
「日本古典籍データセット」サイト(http://codh.rois.ac.jp/pmjt/)
「日本古典籍字形データセット」サイト(http://codh.rois.ac.jp/char-shape/)
「江戸料理レシピデータセット」(http://codh.rois.ac.jp/edo-cooking/)
「じんもんこん 2016」サイト(http://jinmoncom.jp/sympo2016/index.html)

発表1
【古典籍で音の再現】

    古典籍を使って音の再現を試みることを考えた。古典籍には、音の対象となりうる自然や人物などが多く描かれている。例えば蝉や蛙の声、琴や三味線の音、オノマトペなども古典籍の中に眠っている。そういう音のあるものを再現してテキストデータに貼り付け、公開してはどうか。音声は、視覚障害がある人への学習用教材とすることや、時代劇を作る際のリアルな音源として、さらにはボーカロイドやYouTubeでの公開などの展開も考えられる。

発表2
【観光アプリ・源氏54(Genjiフィフティーフォー)】

    古典籍の、観光アプリケーションへの活用を考えた。具体的には『源氏物語』の追体験ができるアプリで、ターゲットは女性の『源氏物語』マニア。京都だけでなく明石まで含めた追体験ができ、例えば観光スポットでは光源氏が現代語の台詞で話しかけてきたり、光源氏らしい台詞で会話ができたりする機能を持つ。『源氏物語』は54巻あり、全巻を体験し終えると(コンプリートすると)アプリケーション完了となる。アプリの名称は「源氏54(げんじフィフティーフォー)」とする。


発表3
【故郷再現】

    古典籍で地元と中央を繋ぐ試みを「故郷再現」と名付けた。具体には、人とモノあるいは情報の移動を古典籍から見つけるというもので、例えば昔の同郷の人が中央でどのように頑張っていたかを知ることができるような仕組み。これには「武鑑」の活用を考えていて、例えば「武鑑」に記された人名をクリックすると、その人物が住んでいた加賀藩の屋敷に関する情報が出てきたり、そこから江戸までの経路を見ることができる。さらに「武鑑」の画像をクリックすると外部機関の映像アーカイブに飛んで関連情報を見られたり、江戸で食されていた料理の情報が得られるなど、多彩な情報へ繋がる仕組み、活用方法を考えた。


発表4
【古典籍メディアミックス+江戸キャラで遊ぼう】

    2つのアイデアを考えた。1つは“学ぶ系”で「古典籍メディアミックス」。昔の読書は音読だったということから、画像をもとにテキストと音声を作り、ポッドキャストを利用した音声学習ができないかと考えた。また、画像を指でなぞるとテキストが現れ、その音声が聞けるなど、目と耳で学べる教材パッケージを作成する。さらに、教材となった古典籍と文化庁が作成した「メディア芸術データベース」の各作品をリンクすることにより、マンガやアニメの元になった作品を知ることができ、現代との繋がりも踏まえた、より多彩な学習ができるのではないかと考えた。
    もう一つは“楽しむ系”のもので、題して「江戸キャラで遊ぼう LINEで一言!」。まずは古典籍の画像だけを集め、「猫」「虫」「花」などに分類。そのカテゴリに関連したイベントを開催し、タグ付けを皆で行うといったことや、カテゴリ別の画像をまとめて、例えば「猫キャラセット」としてLINEで配布することも考えられる。更に、字形データセットを使ってメッセージを作るサービスが可能ではないかと考えた。

発表5
【「江戸らま」を作ろう】

    「江戸らま」とは、“ジオラマ”をもじったもの。古典籍を見ていると、農具や着物、植物や虫の図などが多くあり、図鑑のような資料が結構ある。それらをジオラマで表現してみようと考えた。例えば建物は『新編宮雛形』の情報をもとに作り、川やそこに泳ぐ魚、浮かんでいる船、船に乗っている女性が着ている着物なども古典籍の図録からきちんと作ることを考えた。そして、そのジオラマにモバイル端末をかざすと、原資料が見られるという仕組みがあれば面白いかと思う。


発表6
【文字なしで使えるデータベース】

     まず、30万点の画像を文字情報なしで見られるデータベース、というものを考えた。例えばサムネイルのサイズを変えることで原本の大よそのサイズが分かる、出版数をヒートマップで表示することで多寡が分かる、本屋ごとのデータを表示することで売りひろめの状況が分かる、など。次に、国際化の視点からタグの英語化が必要という意見になった。最後に、字形データセットを活用し、ディープラーニングにより連綿とした文字列、文章を自動で作り、かつ適当に切ってくれる「古文書ジェネレーター」を創ったら面白いのではないか、という意見になった。
    

発表7
【古典籍グッズ開発、あるいはスマホゲーム?!】

    クックパッドでの江戸料理レシピ公開の実例を知り、一般人向けに古典籍の魅力を伝えるためのアイデアを考えた。1つは、普段の生活に古典籍を取り入れるというもの。例えば「刀剣」が若い人に流行っているが、そのデザインを活かした女性用タイツやマスキングテープを作製してはどうか。また、判じ絵フォントの作成ということも考えた。もう1つのアイデアは、スマートフォンゲームの開発。例えば「つむつむ」という、キャラクターをなぞって繋げるゲームがあるが、これにくずし字の要素を入れ、「同じ字母をなぞって繋げて消しちゃおう」というゲームにしてはどうかと考えた。さらに、「2万点獲得で、大学の単位かLINEスタンプがもらえる!」といった仕組みを導入すると面白いと思う。