日本古典籍データセット活用例

「日本古典籍データセット」の活用例をご紹介いたします。

変体仮名の画像認識システム
(http://npn-2sc1815j.appspot.com/)

2SC1815J氏による「変体仮名の画像認識システム」Web API利用機能を組み込んだカスタム版ビューワです。

変体仮名の画像認識システム1
画面下部に①「see details」の文字が出てくるので、こちらをクリックします。

変体仮名の画像認識システム2
②テキストボックスにURLを貼り付け、閲覧ボタンをクリックします。(URLの確認は下記注を参照)

変体仮名の画像認識システム3
③黒四角ボタンまたはsキーを押下し、④変体仮名(1文字分)を選択します。

変体仮名の画像認識システム4
文字認識結果がダイアログ表示されます。

変体仮名の画像認識システム5
(注)②のテキストボックスに貼り付けるURLは、日本古典籍データセットの閲覧したいデータセットの画面を開き、⑤右上のインフォメーションボタンを選択し、⑥「IIIF Manifest URI」から確認できます。



『絵入源氏物語』の テキスト分析サイト
(https://gtcym.shinyapps.io/genjiapp/)

同志社大学の土山玄先生による『絵入源氏物語』の テキスト分析サイトです。日本古典籍データセットの『源氏物語』(承応3年《ID 200003803》)の全文翻刻テキストデータの解析を行うサイトです。
テキスト分析サイト


「日本古典籍データセット」の本文抽出サイト
(http://npn-http://researchmap.jp/joqfrlli3-2178/#_2178 )

大阪大学文学研究科 岡島昭浩教授の研究ブログ上で、日本古典籍データセットのうち「源氏物語」「二十一代集」「かてもの」「養蚕秘録」「涌蓮大徳短冊帖」の本文を抽出し公開されています。


「『日本古典籍データセット』簡易検索」
(http://npn-2sc1815j.appspot.com/iiif-curation-viewer-enhanced/search.html)

@2SC1815J氏による、 「日本古典籍データセット」の注記や解題を含む内容を、一覧として確認できる検索サイトです。


「Mirador2.1」(http://projectmirador.org.html)

IIIF(トリプルアイエフ)対応の高機能画像ビューワ「Mirador2.1」のサンプル資料に、当館のデータセットの画像No.18『唐糸草子』(日本文学)が使用されています。
ここで標準サンプルとして搭載されているデータは、当館のデータセットを人文情報学研究所の永﨑研宣氏がIIIF対応で公開したものに、カルガリー大学の楊暁捷教授がWebコラボレーションシステムを用いて翻刻テキストを付加したものです。

ビューワの「アイテム追加」又は「新しいオブジェクト」をクリックすると、各地のIIIF対応サーバから集められたサンプル資料の一覧の中に『唐糸草子』があります。
サムネイル画像をクリックして拡大画像が表示されましたら①左上の「アノテーション」をクリックすると、アノテーションが付与されている箇所が表示され、②その箇所の翻刻テキストが表示されます。
詳細は、永﨑氏のブログ(digitalnagasakiのブログ:http://digitalnagasaki.hatenablog.com/entry/2016/09/17/034714)をご覧ください。


豊田高専くずし字翻刻WWWサービス
(http://vpac.toyota-ct.ac.jp/hayasaka/kuzushiji/)

国立高等専門学校機構 豊田工業高等専門学校の早坂太一氏、大野亙氏、加藤弓枝氏らによる、くずし字認識を行うWWWアプリケーションです。日本古典籍データセット等の文書画像を読み込ませ、1文字をマウスで選択すると、ディープラーニングによる画像認識技術により、翻刻結果が出力されます。平成28年9月現在で、変体仮名のみに対応しており、70~80%の認識率となっています。
《例》No.9『絵本見立仮譬尽』(日本文学)で試した場合
ARC古典籍ポータルデータベース
豊田高専くずし字翻刻WWWサービスの画面を開きます。 ARC古典籍ポータルデータベース
①をクリックして、読みたい画像を開き、②翻刻したいくずし字を選択する。 ARC古典籍ポータルデータベース
翻刻結果が確認できます。


立命館大学ARC古典籍ポータルデータベース
(http://www.dh-jac.net/db1/books/search_portal.php)

立命館大学アート・リサーチセンター(ARC)の所蔵品・寄託品の他、それ以外の書籍・古典籍も 総合的に検索できるデータベースです。この中に、日本古典籍データセットも含まれています。
《例》No.1『源氏物語』(日本文学)
ARC古典籍ポータルデータベース
上記URLの検索画面にて、①資料名に「源氏物語」を記入、②所蔵者に「国文学研究資料館」を選択して③検索ボタンをクリックします。

ARC古典籍ポータルデータベース
検索結果が画面上部に出てくるので、④小画像をクリックします。

ARC古典籍ポータルデータベース
サムネイル画像一覧が出てきますので、必要な画像をクリックすると、詳細画像を確認することができます。


くずし字学習支援アプリKuLA(Kuzushiji Learning Application)

「KuLA」は、スマートフォンやタブレットを使って効率的に「くずし字」を学習するために開発されたアプリで、平成27年度科研挑戦的萌芽研究「日本の歴史的典籍に関する国際的教育プログラムの開発」(代表・飯倉洋一教授)の成果として、大阪大学文学研究科を中心に開発されました(「歴史的典籍NW事業」も連携しています。)。このアプリの画像に、日本古典籍データセットが利用されています。
紹介ページ
・大阪大学大学院文学研究科・文学部ホームページ
(http://www.let.osaka-u.ac.jp/ja/research/community/hodo/iikura_KuLA)
・androidアプリ情報ナビ (https://android-app-navi.com/kula/)

アプリで使用されているデータセット No.336 『新刃銘尽後集』(武学・武術)(下の画像は155コマ目)


・アプリのダウンロードサイト
【googleplay】 https://play.google.com/store/apps/details?id=yuta.hashimoto.kula&hl=ja
【iTune】 https://itunes.apple.com/jp/app/kuzushi-zi-xue-xi-zhi-yuanapurikula/id1076911000?mt=8


The Web KANZAKI (http://www.kanzaki.com/works/2016/pub/image-annotator)

神崎正英氏が公開されている「Image Annotator」のページにおいて、日本古典籍データセットで公開したNo.10 『画本虫撰』(日本文学)を使って、国際的な規格であるIIIF(トリプルアイエフ)の技術を紹介されています。
このページでは、IIIF マニフェストが公開されている画像について、画像と注釈を表示し、その画像の部分に対する注釈(Web Annotation)を追加することができる機能が紹介されています。その事例の中で、次に紹介するIIIF対応の「国文研データセット簡易 Web閲覧」で公開されている画像とIIIF マニフェストが活用されています。

Image Annotator by KANZAKI

これに加え、「万法料理秘密箱」に画像を含むアノテーションを施した事例を紹介しています。 Image Annotator by KANZAKI

また、「日本古典籍データセット」を「IIIF Manifest Collections」として、日本古典籍データセット全作品を掲載しています。
Image Annotator by KANZAKI




国文研データセット簡易Web閲覧 (http://www2.dhii.jp/nijl_opendata/openimages.php)

人文情報学研究所の永崎研宣氏による、日本古典籍データセットを簡易に閲覧できるシステムです。このシステムはデジタルアーカイブにおいて画像を公開し共有するためのIIIFに対応しています。また、くずし字認識機能として、@2SC1815J氏による「変体仮名の画像認識システム(α版)」(https://hentaigana.herokuapp.com/aboutを参照。)が組み込まれています。


※「変体仮名の画像認識システム(α版)」の学習用に使われたのは、東京外国語大学アジア・アフリカ言語文化研究所 岡田一祐氏による「『和翰名苑』仮名字体データベース」(https://kana.aa-ken.jp/wakan/)の画像とのことです。
↑ ページの先頭へ