第4回日本語の歴史的典籍国際研究集会を開催
The 4th International Conference on Pre-modern Japanese Texts
本イベントは終了致しました。
ご来場および、ライブ配信をご覧いただき誠にありがとうございました。
ライブ配信しました動画のうち、発表部分(一部)について動画配信を行っております。

日 時 | 平成30(2018)年7月27日(金)~7月28日(土)(2日間) |
場 所 | 国文学研究資料館2F大会議室(東京都立川市緑町10-3)アクセス |
主 催 | 大学共同利用機関法人人間文化研究機構 国文学研究資料館 |
プログラム一覧
-----平成30年7月27日(金)-----
- 13:30 開会の挨拶
- 13:35 機構挨拶
- 13:40 趣旨説明
- 13:50 基調講演「聖語論(ヒエログロシア)から見た道元禅師の和漢言説」
- 14:50 休憩(30分間)
- 15:20 パネル1「津軽デジタル風土記 ナビゲーションからコミュニケーションへ」
- 17:30 レセプション(会費制)
- 10:00 パネル2「比較書誌学の観点による日本古典籍の特質と問題」
- 10:55 休憩(15分間)
- 11:10 研究報告「画像解析技術の進展と歴史的典籍への展開」
- 12:10 休憩(65分間・昼食)
- 13:15 パネル3「古典芸能における身体―ことばと絵画から立ち上がるもの―」
- 14:45 休憩(30分間)
- 15:15 パネル4「漢文化圏におけるデジタル化:東アジアの漢文系データベースと人文学研究の最前線」
- 16:55 閉会の挨拶
※歴史的典籍NW事業(NIJL-NW project)で実施している共同研究について、平成30年7月27日~7月28日の会期中(2日間)に、会場前の2階ロビーにてポスターで紹介しておりますので、是非ご覧下さい。
7月27日(金曜日)
総合司会:谷川惠一(国文学研究資料館)
TANIKAWA Keiichi(National Institute of Japanese Literature)
ロバート キャンベル(国文学研究資料館長)
Robert CAMPBELL(National Institute of Japanese Literature)
平川南(人間文化研究機構長)
HIRAKAWA Minami(National Institutes for the Humanities)
齋藤真麻理(国文学研究資料館)
SAITŌ Maori(National Institute of Japanese Literature)
「聖語論(ヒエログロシア)から見た道元禅師の和漢言説」
"Dôgen's Religious Discourse and Hieroglossia"
ジャン=ノエル ロベール(コレージュ・ド・フランス日本学高等研究所)
Jean-Noël ROBERT(Collège de France Institute des Hautes Etudes Japonaises)
道元の『正法眼蔵』は日本文学において最も人々の関心を引き続ける作品であり、さらには世界文学においても特異な位置を占めていると言い得るかもしれない。本作品をこのような位置へ至らしめたものは何であろうか。仏教に関心を持たない読者であっても、類いまれな言語的世界へ導かれるのはなぜであろうか。それは宗教性に起因するのであろうか、それとも他の何ものかの作用によるものであろうか。
道元の言語的世界の特質は、まず何よりも、その中国語と日本語の二元性にある。しかし、このような二元性は中世以来の日本仏教者にも見られ、道元のオリジナリティを説明するには全く不十分である。とはいえ、道元のバイリンガリズムには独特な味わいがある。中国においては宋代の口語が禅籍に使用されているが、道元はこれを初めて日本のテクストに導入した。これにより、宋代の口語をほとんど研究や習得の対象としていなかった伝統的な漢文体の中に、これらの表現が独自の地位を与えられたのである。道元における禅の白話(口語)文体は、単に新たなスタイルを導入したというに留まらず、彼が開いた新たな禅派の言語的指標の役割を果たすこととなった。「口語風の中国語」―この表現は、もともと禅宗における個人的な使用語彙であったと思しき語群を指すにはより相応しい表現であろう―を説法に頻繁に引用した道元の作品、とりわけ『正法眼蔵』は、ユニークで識別性の高い文体を獲得することとなった。
しかし、このいわば三次元的文体のみでは、道元の作品の豊穣性を説明し切ることはできない。『正法眼蔵』の説法が涸れることのない関心の泉となった最大の特質は、著者が三つの言語層を常に相互作用させた点に求められる。道元は訓読の多様性を巧妙に駆使し、天台教学に直接由来する論理とを組み合わせることによって、教条のあらゆる解釈学上の可能性を探った。その釈義の顕著な特徴は遡及訓読とでも称すべきもので、日本の訓読の技法を中国語に直接使用することである。この隠された訓読を見落とせば、道元の論旨を誤解する恐れは高い。
本講演では『正法眼蔵』の「諸法実相」と「無情説法」、および『永平広録』から同じく「無情説法」の具体例を取り上げ、道元の言語そのものがどこまで彼の思想の延長であるのか、考えてみたい。
What makes Zen master Dôgen’s Shôbôgenzô one of the most intriguing works of Japanese literature and, one might add, a singularity in world literature ? How is it that even for those who are moderately interested in Buddhist matters, to read it is such a rewarding probe into a linguistic universe that has very few parallels, be it religious or otherwise? The key to Dôgen’s linguistic world is first and foremost its duality, striding both the Japanese and the Chinese languages. But that would hardly suffice to explain his originality, as such a duality can be found in many other Buddhist authors in Japan, from medieval to modern times. Dôgen’s bilingualism, however, has a very peculiar flavor. It can be said that he was the first to introduce the use of Song dynasty Chinese colloquialisms as found in Chinese Chan writings into Japanese texts as an independent dimension of Chinese language, giving this style hardly studied or imitated before in Japan, an independent status along the traditional kanbun style. The Chan baihua style in Dôgen assumed the role of a linguistic marker for the new Zen current that he created in, rather than transmitted to, Japan. The frequent quotations in that pseudo-colloquial Chinese, a more appropriate term for what seems to be primarily a Chan idiolect, which Dôgen intersperse in his sermons, give his works, especially the Shôbôgenzô, a uniquely recognizable stylistic pattern.
But that three-dimensional style would hardly explain in itself the richness of Dôgen’s works. The main trait that makes the sermons of the Shôbôgenzô an inexhaustible source of interest is the constant interaction of the three language levels being made use of by their author. He utilizes all the subtleties of the explicative reading (kundoku) from Chinese into Japanese applied together with a combinatory logic that hails directly from Tendai scholasticism in order to explore all the hermeneutical possibilities of the Buddhist tenets he comments. A remarkable characteristic of his exegesis is that he makes use of what may be called a retroactive or backward kundoku, where he uses the Japanese kundoku techniques directly in Chinese, without explicit mention of their use. Not to discern this hidden kundoku is to take the risk of misunderstanding Dôgen’s demonstrations.
By taking examples mainly from the Shohôjissô and Mujôseppô sermons in the Shôbôgenzô and, for the latter, the Eihei kôroku case of the same title, I will attempt to demonstrate to what extent Dôgen’s language in itself can be said to be the heart of his religious practice.
「津軽デジタル風土記 ナビゲーションからコミュニケーションへ」
"The Tsugaru Digital Gazetteer: From Navigation to Communication"
木越俊介(国文学研究資料館)
KIGOSHI Shunsuke(National Institute of Japanese Literature)
津軽デジタル風土記は、従来、一部の研究者などに閉ざされていた史資料のデジタル化と公開によって、より多様な層のユーザーに開かれたプラットフォームを構築し、活用するプロジェクトである。
デジタル資料を公開することは大きな一歩ではあるものの、それのみでは死蔵されてしまうおそれがある。そこで当面は、コンテンツの充実をはかるとともに、その魅力を発信し、そこにどのような活用の可能性があるかのモデルを示す〈ナビゲーション〉が必要となる。
本プロジェクトでは、デジタル資料の活用の実践として、アカデミズムにおける成果や知見などを、津軽における新しいツーリズムに結びつけるための複数の具体案をプロジェクトメンバーが提案し、現地のスタッフと共同で実現化に向けて走り出している。〈ナビゲーション〉が自ずと〈コミュニケーション〉へと発展する、そのための空間となり、結節点の役割を果たすのが、デジタル風土記の本質であると思われる。
A large number of premodern materials, due to their rarity, are currently available only to a limited number of scholars. As a means of remedying this problem, the Tsugaru Digital Gazetteer seeks to make these materials available to a wider audience by means of digitalization. While digitalization certainly has the potential to make rare materials available to a large audience, unless presented in an attractive, easily approachable format, these materials will remain, as before, largely unused. To this end, an interface for easy navigation must be developed.
Our project members have put forward a number of concrete proposals as to how the findings of academic research could be made to interact with and assist the tourism industry. We are currently cooperating with workers in the tourism industry in hopes of realizing these proposals. The Tsugaru Digital Gazetteer will serve as a meeting point between academic research and tourism; navigation of digitalized materials will lead to communication between scholars and tourists.
「津軽を知り津軽を語ろう~津軽デジタル風土記への誘い~」
"Let's Learn and Talk About Tsugaru: The Tsugaru Digital Gazetteer"
瀧本壽史(弘前大学)
TAKIMOTO Hisafumi(Hirosaki University)
津軽を知り、さらに深く掘り下げていきたい、そして津軽を語り、伝えたい。デジタル画像を活用しながら、その手がかりを地域住民自らが得られる学びの場を展開する。
まず、津軽の全体を眺めてみよう。近世の津軽はどんな枠組みの中にあったのだろうか。弘前藩は内から外へ、外から内への出入り口を九つ設定した。これを九浦制度という。正保の国絵図「陸奥国津軽郡之絵図」を見れば南は秋田藩、東は盛岡藩と山を境に接していた。人々は海沿いの街道を通って藩境を超えた。そこには一つずつ関所が置かれた。藩境以外、弘前藩領は海と接していた。北に向かう航路が朱線で多数描かれている。そこに七つの指定港が設定された。合わせて九つの出入り口、「九浦」となる。弘前城下に次いで最重要の町である。なぜそこが九浦に指定されたのか、どんな役割が課せられたのか。
その九浦を「九浦外町絵図」のデジタル画像上で歩いてみよう。九浦を踏破したときどんな津軽が見えてくるのだろうか。さらに九浦の中の一つ、例えば鰺ヶ沢湊に「東奥津軽山里海観図」で入り込んでみる。生き生きとした人々の姿や祭りの様子が見える。そして鰺ヶ沢湊の繁栄の背景を史書「邦内事実秘苑」で追っていく。
津軽を語る多くの資料がデジタル空間で体系的に結びついたとき、資料の持つ価値の多様性とともに、多様な津軽、それぞれの津軽が見いだせる。人々がそれぞれの津軽をもって津軽を巡るとき、資料は地域資源・観光資源ともなってくる。これまでの市民講座を発展させ、受動的で一回きりでない、主体的で、継続的な場の展開、さらには津軽とコミュニケーションが図れる場の創造を目指す。その取り組みの一端を報告する。
I would like to know more about Tsugaru, and I would like to tell you all about Tsugaru. By utilizing digital images as a point of entry, this digital gazetteer provides local residents with an opportunity to learn more about their own home region.
Let me begin with an overview of the Tsugaru area. The Hirosaki feudal clan established nine entrance and exit points—harbors—into and out of the region. This was known as the Kuura, or “nine bays” system. According to a map composed during the Edo Period, the southern and eastern extremities of Tsugaru formed borders with the domains of other feudal clans dwelling about the mountains. People passed through these boundaries by means of a highway along the sea. One barrier station was erected at each boundary. Aside from its eastern boundary, Tsugaru touched the sea on all sides. Kuura was the most important town aside from the Hirosaki castle town. Why was Kuura designated in this way?
Let us walk through Kuura by means of our digitalized map. When walking through Kuura, what kind of Tsugaru can you see? We will choose Kuura, and enter into the picture scroll which drew the state of the festival and the form of the people. I will give more details about the background by looking at historical documents pertaining to Tsugaru.
When this abundance of material about Tsugaru is interrelated systematically within a digital space, various facets of Tsugaru come to the fore. I am aiming at offering lectures for local residents of the Tsugaru area, in hopes of developing an independent and active place wherein people can plan and communicate.
「城下町弘前を歩く―津軽関係資料とその活用―」
"Seeing the sights of the Hirosaki castle town on foot: How to use historical documents about Tsugaru for sightseeing"
渡辺麻里子(弘前大学)
WATANABE Mariko(Hirosaki University)
文献観光資源学として実施する「津軽デジタル風土記」の事業は、津軽の歴史文化資料を広く知ってもらうとともに、さらに観光に活用するという目的で行うものである。日本における観光と言えば、以前は、著名な場所を短時間で数を多く効率良く訪ねることが重視されていたが、最近では、たとえ見学地は少なくても、また誰もが知っているような著名な場所ではなくても、その場所にまつわる歴史や文化を深く学びながらゆっくりじっくり見学することの方が重視されている。見学地では、その場所にまつわる歴史や文化、言い換えればその場所の「物語」を、より深く学び、歴史をリアルに感じることが重視されているようである。
本発表では、「津軽デジタル風土記」で扱う文献資料を活用しつつ、城下町弘前を巡る旅の提案とその可能性について論じる。城下町弘前には、弘前城をはじめとして、多くの観光名所が存在しているが、有名無名にかかわらず、その場所について、訪問者が深く歴史や文化を学び、物語を感じ取れるような観光を考えてみたい。
コースには様々な案が考えられるが、今回は試験的に、歴代藩主の記事が多く記される資料を用いながら、歴代藩主にゆかりの場所、寺社をめぐる旅を提案する。用いる資料としては、津軽デジタル風土記の対象書目から、藩政時代の歴史や文化が様々に記されている資料として『津軽一統志(つがるいつとうし)』や『封内事実秘苑(ほうだいじじつひえん)』、『津軽歴代記類(つがるれきだいきるい)』、『津軽編覧日記』、『奥富士物語』などを用いる。また見学対象地としては、岩木山神社、高照神社(たかてるじんじゃ)、長勝寺、革秀寺、報恩寺、袋宮寺、最勝院などが挙げられる。
「津軽デジタル風土記」の資料を活用しながら、歴史・文学・宗教の学びを深め、津軽を堪能できること、文献資料が観光資源になることを目指した提案を試みてみたい。
The Tsugaru Digital Gazetteer belongs to the area of travel literature resources studies. This database seeks to make documents about the history and the culture of Tsugaru more widely available, and to utilize those documents for the tourism industry. In the world of tourism, the most important thing is to visit numerous well-known places, with as little trouble as possible. However, recently, many tourists like to observe these places slowly, carefully, and deeply, while learning about the culture and the history concerning of that place, even if there are few places to visit and that place is not famous. Tourists are eager to study the history and the culture of the places they visit. Furthermore, they want to come away with a more personal appreciation of the place.
History and culture tell the story of a place. In this presentation, I will utilize the documents contained in the Tsugaru Digital Gazetteer. I propose a plan of a trip around the castle town known as Hirosaki, and discuss the potential interests of Hirosaki. In the castle town Hirosaki, many tourist attractions exist including Hirosakijo Castle, regardless of famous or infamous viewpoints. I would like to consider the sort of tourism that allows a visitor to take in the story of the place.
I can show you various plans with the documents that include the articles concerning each generation of feudal lords. However, tentatively, I would like to propose a trip around the Buddhist temple and Shinto shrine that is the place closely related to each generation of feudal lords. I will make reference to "Tsugaru Ittou Shi" and "Houdai Jijitsu Hien", "Tsugaru Rekidai Kirui", "Tsugaru Henran Nikki", "Oku Fuji Monogatari" etc. These documents are included in the Tsugaru Digital Gazetteer, and in these documents, the history and the culture of the affairs of a feudal clan era are written down variously. Visit places are Iwakiyama Shrine, Takateru Shrine, Chosho-ji Temple, Kakushu-ji Temple, Houon-ji Temple, Taikyu-ji Temple, and Saisho-in Temple. The figure which I aim at is tourists are thoroughly enjoying Tsugaru, and learn of the history, literature, and the religion deeply, while utilizing the document of "the Tsugaru digital topographical record". In addition, I will make the suggestion that historical documents are able to become the tourist attractions.
「古典籍のデジタル化による温故知新―武者絵・北斎・ねぷた絵」
"Innovation through digitalization of classic wisdom and works: Warrior picture, Hokusai, and Neputa picture"
木越俊介(国文学研究資料館)
KIGOSHI Shunsuke(National Institute of Japanese Literature)
ここでは津軽デジタル風土記における試みの一つとして、津軽のねぶた(ねぷた)に多く使用される武者絵や北斎を素材に、デジタル画像を通して、温故知新に結びつけるプロジェクトについて発表する。発掘・再発見・発信の三つの柱に沿って温故知新を具体化していく。
〈発掘〉
明治から昭和にかけての弘前ねぷた絵の名人である日本画家・竹森節堂旧蔵の古典籍(弘前市立博物館蔵)などをデジタル化し、地域の遺産(レガシー)として共有する。その上で、現在のねぷたの制作現場における素材、また地域の子どもたち対象のねぷた教室における教材などとして活用する。
〈再発見〉
江戸時代の武者絵の「画題」のあり方やバリエーションについて、デジタル画像を通して学ぶ場をもうけ、理解を深める。
〈発信〉
将来的には、デジタル画像にインスパイアを受け、現在のねぷた絵の制作者と共同で新たなねぷた絵の創出を目指す。
こうした活動により、津軽内においては地域における共有遺産の価値を再認識し、さらには新たな創造につなげることによって外部に発信していくことを目指す。
This part will introduce one project of Tsugaru Digital Gazetteer. We will present about the project that links to innovation through digital images using Musha painting and Hokusai, which are often used for Tsugaru Nebuta (Neputa). We will embody innovation along three pillars of excavation, rediscovery, and transmission.
Excavation
Digitalize the former collection of Japanese painter Takemori Setsudo, a masterpiece of Hirosaki Neputa painting from Meiji to Showa (Hirosaki municipal museum collection) and share it as a regional heritage (legacy). In addition, it will be used as materials in the current production site of Neputa, as teaching materials in the Neputa painting classroom for local children.
Rediscovery
We will learn more about the way and variations of the "title" of the warrior painting in the Edo period by learning through digital images and deepen their understanding.
Transmission
In the future, we will be inspired by digital images and collaborate with the current Neputa painter's creator to create new Neputa paintings.
Through these activities, we aim to reconfirm the value of shared heritage in the area within Tsugaru and to disseminate it to the outside by connecting to new creation.
プログラム一覧へ
7月28日(土曜日)
総合司会:青田寿美(国文学研究資料館)
AOTA Sumi(National Institute of Japanese Literature)
「比較書誌学の観点による日本古典籍の特質と問題」
"Special Features and Relevant Issues: Comparative Bibliography of Pre-modern Japanese Texts"
落合博志(国文学研究資料館)
OCHIAI Hiroshi(National Institute of Japanese Literature)
日本の古典籍については、これまで様々な研究が積み重ねられてきたが、多くは個別的な問題の考察であり、国際的な観点から日本の古典籍の一般的問題について考察することはあまり行われてこなかったように思われる。そのような状況を多少とも補うべく、共同研究「日本古典籍の比較書誌学的研究」を構想し、研究を進めているところである。日本の古典籍では普通に見られるが他国の古典籍においてはそうではない事象(またはその逆の事象)は何か、その違いはなぜ生じたか等々、中国や朝鮮、あるいはヨーロッパなど、長い書物の歴史を持つ地域の典籍と比較することを通して浮かび上がってくる日本古典籍の特質と問題について考えたい。今回は、手始めに日本の古典籍にも大きな影響を与えた中国及び朝鮮の古典籍との比較を行う。
1人目の報告者の入口敦志教授は、日中韓の袋綴(線装)刊本を取り上げて、様式の相違やその背景等について検討するとともに、日中韓の書誌学用語の違いを考察する。2人目の報告者の陳捷教授は、中国古典籍の研究者としての立場から、日本と中国の古典籍の共通点と相違点、日本古典籍の特徴とその背景などについて考察する。
限られた時間ではあるが、日本の古典籍を国際的な視野から観ることで、日本古典籍について考える上での一つの問題提起になればと願うものである。
「日中韓刊本の様式について」
"Outline of the characteristics of Japanese, Chinese, and Korean woodblock-printed books."
入口敦志(国文学研究資料館)
IRIGUCHI Atsushi(National Institute of Japanese Literature)
日中韓の古典籍の刊本の多くは、中国で発明された「線装本(袋綴)」の形式をとることで共通している。しかし、利用できる材料や道具、文化的背景によってそれぞれの国における刊本の様式には違いがある。そのことを簡単にまとめるとともに、日中韓の書誌学の用語の違いを考察する。更に、書誌学用語の英訳についても言及してみたい。
Many of the woodblock-printed books of Japan, China, and Korea are in common by taking the form of "Senso-bon (Fukurotoji-bon)" invented in China. However, depending on available materials, tools and cultural backgrounds there are differences in the characteristics of the books in each country. Briefly summarize that and discuss differences in bilingual terms between Japan, China and Korea. Furthermore, I would like to think about the English translation of bibliographic terms.
「比較書誌学の立場からみた日本古典籍:中国古典籍との比較を通して」
"Pre-modern Japanese Texts through the Lens of Comparative Bibliography: Comparisons with Chinese Classic Texts"
陳捷(東京大学)
CHEN Jie(The University of Tokyo)
日本の古典籍は中国、朝鮮半島の書物文化の影響を受け入れながら誕生し、また、長い歴史のなかで、独自の文化環境において、独特な特徴を形成されていた。国際的な観点からみて、日中韓三国の古典籍は共通性がありながら、それぞれの独自性も見られると思われる。今回の発表においては、中国の古典籍を研究する研究者が日本の古典籍に接するときに感じたことから出発して日中両国の古典籍の共通点と相違点について考察し、比較書誌学の立場から日本古典籍の特徴について分析を行い、さらにそれらの特徴の社会的、文化的な背景の解明を試みしてみたい。
プログラム一覧へ
「画像解析技術の進展と歴史的典籍への展開」
"The Progress of Image Analysis Technology and its Relevance to Future Studies of Pre-modern Japanese Texts"
松田訓典(国文学研究資料館)
MATSUDA Kuninori(National Institute of Japanese Literature)
「画像認識の歴史と深層学習」
"Retrospective Review of Image Understanding Research and the Impact of Deep Learning"
佐藤真一(国立情報学研究所)
SATOH Shin’ichi(National Institute of Informatics)
計算機による画像認識の研究は50年以上検討されているが、長らく顕著な進展が見えなかった。それが、ここほんの数年で、特に深層学習の出現により、画像認識の精度が大幅に向上し、様々な応用が検討されるようになってきた。本講演では、画像認識研究の歴史と深層学習の出現を振り返り、できるようになったこと、まだできないこと、新たに発生した問題等について議論したい。
Image understanding by using computer has been studied for more than fifty years without prominent success. But in a recent few years the breakthrough by deep learning improved the performance of image understanding significantly, and many new applications have been enabled. We would like to review the history of image understanding research, and reveal what have been solved, what have not yet been solved, and new technical and social issues.
「古典籍に対する画像検索」
"Kotenseki Image Search"
松井勇佑(国立情報学研究所)
MATSUI Yusuke(National Institute of Informatics)
本稿では、古典籍画像に対する画像検索システムを提案する。近年、コンピュータビジョン技術の発展が著しい。画像認識や画像検出といった技術は特定のタスクでは人間の判断力を上回ったと報告されており、また画像生成やキャプション生成といった新たな応用技術が日々提案されている。
これらの近年の技術発展は結果が印象的だというだけではなく、誰でも簡単に技術を利用可能である点に特色がある。すなわち、共通の計算機資源(GPU)、共通のフレームワーク(各種深層学習ライブラリ)、公開コードを用意すれば、誰でも各技術の結果を再現することが出来る。
このようなコンピュータビジョン技術の新たな適用先に古典籍資料がある。これまで古典籍資料は主として人手で管理・解析されてきた。もしコンピュータビジョン技術を古典籍の解析に用いることが出来れば、これまでに知られていなかった新たな解析が可能になるかもしれない。
本稿では、コンピュータビジョン技術を古典籍資料へ適用する第一歩として、古典籍への画像検索について、国立情報学研究所と国文学研究資料館との共同で行われている取り組みを紹介する。大量の資料を前にしてもっとも基本的な操作は検索である。本稿では古典籍に対する画像ベースの検索の第一歩として、スケッチ検索およびサンプルベース検索のシステムを紹介する。これらの画像ベースの検索が進めば、「ある日本の古典籍資料とタイの古典籍資料が画像的に類似していることを発見し、新たな仏教伝来のルートが発見される」といった人文学上の新発見につながる可能性がある。本稿では萌芽的な内容を報告するが、本稿を足がかりにして、より発展的な議論が出来れば幸いである。
In this paper, we propose an image retrieval system for Kotenseki images. With the recent drastic progress of computer vision technologies, some tasks such as image recognition can be solved by computers with the better accuracy than that by human. Moreover, new applications such as image generation and caption prediction are proposed every day.
These developments are beneficial for not only researchers but also everyone. By preparing a standard computer resource (middle-level GPU), common deep learning framework, and public codes, anyone can reproduce the result of each technology.
A new domain for such computer vision technology is Kotenseki, historical literature with texts and images. Until now, such historical documents have been mainly managed and analyzed manually. If computer vision technology can be applied for such documents, new analysis that has not been known so far may be possible.
In this paper, as a first step of applying computer vision technology to Kotenseki, we introduce a project of image retrieval to Kotenseki, which is jointly conducted by National Institute of Informatics and National Institute of Japanese Literature. The most basic operation to handle a large amount of data is retrieval. We introduce a sketch-based image retrieval system for Kotenseki and an example-based re-ranking scheme via relevance feedback. With the proposed approach, we hope we can uncover new findings to Humanities, e.g., discovering a new route of Buddhism by comparing historical images in Japan and Thailand.
プログラム一覧へ
「古典芸能における身体―ことばと絵画から立ち上がるもの―」
"Arising from Words and Images:The Body in Traditional Performing Arts"
山下則子(国文学研究資料館)
YAMASHITA Noriko(National Institute of Japanese Literature)
「古典芸能における身体―ことばと絵画から立ち上がるもの―」の目的は、日本古典籍に表現されている身体性に注目し、日本文化の身体性の問題に多方面から迫ることである。
日本古典籍の中で、最も多く残っているのは、江戸時代の庶民対象出版物である。しかし、それらは永らく日本では研究の対象とはされてこなかった。また、江戸時代出版物の多くは、芸能からの影響があり、絵画的要素が強いのであるが、それらも日本では研究の対象とはされてこなかった。
身体表現に関わる日本古典籍は、万国共通の理解と興味を得るものであり、挿絵が豊富に存在する日本古典籍の新しい魅力を世界に向けて発信する。
The aim of “Arising from Words and Images: The Body in Traditional Performing Arts” is to draw attention to the physicality expressed in Japanese classic books, and to approach the problem of the physicality of Japanese culture from various points. The majority of extant classic Japanese books are those that were originally published for common people in the Edo era. However, they have not been subject to research for a long time in Japan. In addition, most publications of the Edo era have influences from the performing arts, and the painting elements are strong, but they have not been considered as subjects of research in Japan. Japanese classic books related to body expression gains understanding and interest common to all countries, and we will disseminate the new appeal of Japanese classics, which abundant illustrations exist, to the world.
「近松門左衛門の時代浄瑠璃における身体性の問題-『酒呑童子枕言葉』を中心に」
"Some Reflections about the Body in Chikamatsu Monzaemon’s Jidaijōruri: The Case of Shuten dōji makura kotoba"
ボナヴェントゥーラ ルペルティ(ヴェネツィア カ・フォスカリ大学)
Bonaventura RUPERTI(Università Ca' Foscari Venezia)
発表時にマイクトラブルが発生し、発表の前半部分の音声が録音されなかったため、申し訳ありませんが動画配信を取りやめております。
近松門左衛門の浄瑠璃の中で、酒天童子伝説を扱ったものは2曲ある。宝永6(1709)年初演と推定される『酒吞童子枕言葉』と、享保3年(1718年)初演の『傾城酒吞童子』である。本発表では、初代竹本義太夫(筑後掾)による竹本座上演の『酒呑童子枕言葉』に注目して、近松の浄瑠璃に現れる身体を考えてみたいと思う。
『酒呑童子枕言葉』は、酒吞童子伝説の御伽草子や謡曲『大江山』などを典拠としているが、以下のようにより複雑なプロットになっている。
1段目―源頼光の家来渡部綱が都の羅生門で出会った鬼の腕を切り取り、鬼に腕を奪い返される、羅生門(謡曲『羅生門』)と茨城(渡部の綱)の伝説。
2段目―三の君の代わりに花山院の庵室に参上した侍女右近を恨む弘徽殿の霊が現れ、安盛の陰謀と酒吞童子が三の宮を奪ったことを告げる劇的な場面。
3段目―武士の加藤兵衛と広文と二人の娘、横笛とことぢの悲劇が展開されるなかで、平家重代の宝刀伝説(平維茂、謡曲『紅葉狩』、戸隠山鬼神退治)。
4段目・五段目―酒呑童子(頼光と四天王、謡曲『大江山』)の鬼退治譚。
近松の作品は頼光と四天王をめぐる諸伝説、武勇談を取り入れ、一貫した纏まりのよい粗筋に仕立てている。
特に、本浄瑠璃では酒呑童子は悪鬼として頼光たちに退治されるが、謡曲『大江山』にある鬼への同情を更に発展させ、人間から鬼となってしまった主人公酒呑童子の悲哀を深く掘りさげるところに重点を置いている。他方、交換されたり、身替わりになったり、さらわれたりする人間(女性)の悲劇も一つの主題といえる。
先行作(新古典籍デタベース参照)との関係を参考にしながら、 近松が近世的な感覚による、能などにはないような残虐な場面、残酷な描写を前面に出すが、人形(劇)に適応した酒吞童子の物語にどのような身体性が認められるか吟味したいと思う。
Among Chikamatsu Monzaemon’s jōruri, there are two dramas which tackle the legend of Shuten dōji: Shuten dōji makurakotoba (first representation in 1709) and Keisei Shuten dōji (1718) .
In this presentation I will focus on Shuten dōji makurakotoba, represented at Takemotoza by Takemoto Gidayū and I will consider in particular the body and its parts as they appear in the Chikamatsu’s puppet dramas.
Shuten dōji makurakotoba is built upon the various legends concerning Shuten dōji in monogatari, otogizōshi or yōkyoku (noh texts) such as Ōeyama, but the plot is much more complicated.
This work by Chikamatsu depicts many heroic adventures of Minamoto no Raikō and his shitennō ('Four Heavenly Kings'), but combines these stories in a coherent plot. In particular, in his jōruri, Shuten dōji, as a demon or monster, is slayed by Raikō and his loyal retainers, but such as the nō drama Ōeyama demonstrates a feeling of sympathy to the demon, also the drama by Chikamatsu enhances the sorrow of Shuten dōji as a demon who become human. Moreover, we can recognize as a central theme the migawari, tragedy of women as victims substituted, sacrificed, raptured.
In this presentation, by comparing this jōruri with previous literary works (with reference to the New Classical Sources data base), I will examine the story of Shuten dōji in the puppet theatre and its adaptation to the premodern new sensibility.
「話芸における身体」
"Body representation in verbal arts"
マティルデ マストランジェロ(ローマ サピエンツァ大学)
Matilde MASTRANGELO(Sapienza Università di Roma)
資料の権利などの理由から、動画の一部について「ぼかし」を入れておりますので、予めご了承願います。
このテーマを研究するにあたって、二つのアプローチが考えられる。
一 演者の身体、仕草。
二 演目における身体の描写、存在。
一 日本の古典演芸の一つである話芸には、身体を使用した独特な仕草というものがある。演者のパーフォーマンスにおいては、ジャンル、時代、流派によって、身体の動きなどが異なっている。仕草は、話を語る言葉と同様に重要で、このジャンルの特徴でもある。演者が使う道具も様々で、それによって仕草による表現も異なる。
二 演目に現れる身体の描写も分析の対象とする。演者は、身体の一つの要素である声で、登場人物を描写し、彼らの身体を聴衆に想像させる。様々な人間のタイプを演じ分ける方法、どのような言葉が扱われているかを分析する。
以上の問題を、資料館DB収蔵の『春色三題噺』などを取り上げて、具体的に考察したい。
Two kind of approaches will be considered in this research:
1) Body and gestures of the performers;
2) Representation of the body inside verbal arts repertoires.
In the representations of verbal arts, one of Japanese classical performances, tipical and unique gestures are used. Gestures are important as words are, and according to the genre of verbal arts, historical periods, school of the storytellers, or the tools used by the performers, the expression by gestures can be different and very interesting to study.
The depiction of the body inside the stories repertoires is also a subject of my analysis. The actors depictes the characters through their voice and the audience has to imagining charcacters bodies just hearing at them. I will analyse the various types of human being depicted and what kind of words are used for that purpose.
For my research, I will analyse materials as the Shunshoku Saidaibanashi, of the database collection.
「謡曲における身体と季節 ー 植物の精霊物をめぐってー」
"The sense of the seasons and the body in Nō: an analysis of Nō texts focusing on the spirits of plants"
クラウディア イアッゼッタ(ナポリ大学オリエンターレ)
Claudia IAZZETTA(Università degli Studi di Napoli "L'Orientale")
本研究のテーマは植物の精霊が登場する謡曲の季節感である。謡曲における自然描写は、和歌の世界の影響を強く受けており、「二次自然」という実際の自然とは異なる理想的な自然であるのが今日では常識となっている。また、植物の精霊は、謡曲の舞台では能役者を通して現れる。そのため、身体というものが非常に重要になってくる。本研究では、擬人化された精霊はいったいどのようなものか。また、それが舞台上に作り出された自然とどのように接触するかを中心に考察することとする。 今回は第一歩として植物の精霊が登場する謡曲の概観を提示する。そのために、まず、謡曲における動植物を列挙し、引用された和歌を分析することで、舞台に描かれた自然環境について考察する。さらには、登場人物や場面が異なっていても、その謡曲は同じ構造のもとに作成されているという仮説を立てた調査も行いたいと考える。
In this research my aim is to analyse the sense of the seasons (kisetsukan) in those Nō texts whose main characters are the spirits of plants. The latter being performed on the stage by living actors, also the body, (shintai) in its interaction with the sorrounding space, becomes an interesting subject of study.
The way nature is represented in Nō theatre is hihgly influenced by the idealized and strictly codified nature depicted in classical Japanese poetry; it is a kind of “secondary nature” that, unlike the real one, selects and shows only the elements valued aesthetically significant.
As a first step, on this occasion I will provide an overview study of Nō texts focusing on the spirits of plants. In order to better understand what kind of nature is recalled on stage, I will consider every plant and animal mentioned as well as the poems quoted. Finally, I will try to find out whether in this kind of Nō texts, however different they are, a similar structure may be traced.
プログラム一覧へ
「漢文化圏におけるデジタル化:東アジアの漢文系データベースと人文学研究の最前線」
"Digitalization of the Sinosphere: Databases of Texts Written in Classical Chinese in East Asia, and the Front Line of Research in the Humanities"
合山林太郎(慶應義塾大学)
GOYAMA Rintaro(Keio University)
黄昱(国文学研究資料館)
HUANG Yu(National Institute of Japanese Literature)
今後の研究計画、資料の権利、技術の保全などの理由から、本パネルの動画については非公開とさせていただきます。内容については、発表資料などをご覧ください
発表資料へのリンク
東アジアでは、漢文によって、様々な事象が記されてきた。こうした漢文は、リンガ・フランカとして知識人の共通言語として機能するのと同時に、それぞれの地域の政治や文化と結びつき、独自の意義を持つに至った。今日、膨大な数の漢文で書かれた典籍や資料が東アジアの諸地域には残されており、これらの多くはデジタル化され、文学をはじめとする人文学研究に活用されている。
漢文系のデータベースは、多くの学問領域において、すでに十年以上の使用実績があり、様々な試みがなされてきた。たとえば、その設計について、近年、新しい潮流を確認できる。すなわち、この領域のデータベースでは、語彙検索型のものが、今日においても主流を占めるが、より書誌学的なアプローチに対応した、高精細画像を持つタイプのものも、近年、開発されてきている。
東アジアの漢文系データベースは、運営や提供の方法の点からも、様々な議論が可能である。具体的に述べるならば、有料、無料両方のデータベースがあり、また、公的機関によって維持されているものもあれば、私企業が運営するものもある。こうした状況について検討することは、デジタル化と社会との関係を考える上で、大いに役立つだろう。
このパネルでは、人文学研究の各領域を代表する研究者や、データベース構築の実績を持つ事業者の方をお招きし、議論する。すなわち、漢文系のデータベースの現状と課題について、グローバルな観点から概括し、今日の研究や教育における利活用の状況について分析を行い、その開発における国際的な連携の可能性について検討してゆく。
なお、本パネルでは、デジタル化の技術的側面について議論するだけではなく、人文学研究の”現場”において、データベースがどのように見られ、また評価されているかについても考えてゆくつもりである。
Classical Chinese (Literary Chinese, Literary Sinitic) functioned as the lingua franca of pre-modern East Asia and was used as a language of communication between intellectuals from different countries. It was also considered a high-class language and used in the field of politics and academics, reflecting each country’s social and cultural uniqueness. Great numbers of these historical materials, written in Classical Chinese, have been digitized and can be accessed through databases in the field of humanities research.
Databases containing pre-modern Chinese books and other Classical Chinese texts have been used in various fields of study for more than a decade, and a wide range of trials has been conducted. For example, a new trend can be seen in database designing in this area recently. Although retrieving text data by using search terms is still the most popular usage method applied to these databases, new databases with high-definition images, which focus on bibliographical approaches instead, are also currently being developed.
Databases of Classical Chinese texts in East Asia have variously been considered from the viewpoints of management and distribution. For example, databases can charge usage fees or provide information free of cost. Some databases are maintained by public institutions, while others are maintained by private companies. Analyzing this situation can help us analyze the relation between the digitization of historical documents and society.
This panel provides an overview of the current situation of and challenges in databases of Classical Chinese texts from a global viewpoint, analyzes examples of their utilization in today’s research and education, and seeks the possibility of international cooperation in their development. The discussion will be conducted by several researchers who are leading experts in the humanities field and a business operator with experience in database construction in the field.
Please note that this panel not only supports discussions on the technological dimension of digitization but also explores how databases are seen and evaluated in the actual real-world context of humanities studies.
「漢籍デジタル化への提議―デジタルアーカイブ「宮内庁書陵部収蔵漢籍集覧」を例として―」
"A Few Suggestion on the Digitalization of Pre-modern Chinese Books; Based on the Knowledge Gained from the Construction of the ‘Digital Archive for Chinese Books in the Japanese Imperial Collection’"
住吉朋彦(慶應義塾大学附属研究所斯道文庫)
SUMIYOSHI Tomohiko(Keio Institute of Oriental Classics )
デジタル化によって古典の普及を図ろうとする時、一つの方法として、近代以前の書籍そのものを、一組の画像データとして取り扱い、現在の所蔵機関ごとにそれを実施する策が取られる。しかし東アジアの書籍を扱う場合、その方式にはいくつかの問題を伴う。
東アジアでは、中国を中心に、数千年にわたり書籍が作られ続けているが、この間、メディアの交替を数多く経験している。そこで中国の書籍は、或いはテクストのもつ元来の組織が、メディアの交替によって変更を餘議なくされ、或いは絶えざる変更に鑑み、テクスト内部の組織のみを基準として、書写印刷や装訂については柔軟に対応する習慣を培って来た。東アジアの書籍文化は、この柔軟さを様々に享受しながら、長く活況を呈して来たと言える。
そこで、ある文庫のある漢籍をデジタル化したとして、原本についての記述である書誌を伴わなければ、有効な情報提供とは言えない。またその書誌は、長きにわたる変転の姿を、できる限り立体的に記述していることが望まれる。またそれは、広く流伝する書籍の一断面を捉えたに過ぎないから、各所に伝来する関連の書籍と照合し、相互に比較して個々の位置付けを得るべく、準備されていなければならない。
発表者は、上記の認識に基づき、宮内庁書陵部図書寮文庫収蔵漢籍を扱ったデータベースを事例として、学術的な問題をいくつか指摘するとともに、東アジア的な柔軟な書誌記述の共有と、データベース連合への積極的な取り組みを意識するよう提唱したい。しかし、デジタル化という点を除けば、限られた範囲とは言え、近世後期の学者達が、人的ネットワークの中で発展させてきた書籍研究に、その基本的な要素がすでに含まれている。そこで今後は、その豊かな実りの上にデジタル化技術を適用し、学術文化の普及に取り組むことが良策であると主張したい。
Digitization is intended for the circulation of classical works, and, thus, people often adopt a method that treats a set of images as a book; this book itself was created before the Modern Era, and the process of digitization is often conducted by the institution that holds that particular book. However, in this context, East Asian classical works may present some problems.
In East Asia, especially in China, books have been continuously written for a few thousand years. Over this long period of time, people have often experienced changes in their media. Therefore, the components of Chinese books sometimes had to be revised in order to adapt them to newer media. Furthermore, in order to achieve adaptation to constantly changing media forms, Chinese books acquired some flexible customs such as hand-copying, printing, compiling, and binding. We can thus conclude that East Asian book culture has thrived because of the application of this flexibility.
Thus, it is difficult to gain effective information about digitized pre-modern Chinese books that are held in libraries without bibliographical records based on descriptions of only the current condition of the materials. Moreover, the work’s record should describe the long-term and wide-ranging changes in the material comprehensively as precisely as possible. In addition, the records need to be written with consideration of the prospect that new discoveries could emerge thanks to comparative bibliography research between books held in different institutions; this is because we can observe only a fraction of the wider spread of the texts.
The presenter will take some examples from the “Digital Archive for Chinese Books in the Japanese Imperial Collection” and point out some problems based on the above-discussed considerations. Based on this analysis, the presenter proposes a common method for the flexible bibliographical description of East Asian books and suggests that there should be an alliance between multiple databases. In addition, the presenter would like to insist that these problems can be resolved by building on the results obtained by scholars in the Early Modern Era, who had already realized the importance of describing materials by using an almost shared bibliographical language and examining the records held by other scholars in their personal networks.
「韓国における漢籍・古典籍のデータベース構築及びデジタル化―その現状と課題―」
"Database Construction and Digitalization of Pre-modern Books in Korea including Pre-modern Chinese Classic Texts: Current Situation and Challenges"
沈慶昊(高麗大學校)
SIM Kyung-ho(Korea University)
韓国人が漢文で残した文献は全23000種以上・59000巻余りに至るとされる(韓国古典翻訳院、2018年5月調査発表)。
韓国の漢籍(本報告では、韓国の漢文文献、及び、韓半島において書写・印刷された中国の書籍を指す)・古典籍に関しては、尹炳泰「韓國古書綜合目錄」(国会図書館、1968)が、初めて作られた総合目録ということになる。2000年以降、韓国情報通信部の支援により、国立中央図書館にて全国国公私立図書館所在の書籍目録資料を総合するデータベースの構築が始まり、この成果が現在、「韓国古典籍総合目録システム」(https://www.nl.go.kr/korcis/)として公開されている。
そのテキストについては、従来は各機関や出版社がテキストの影印を散発的に出版していたが、現在は国公私立機関のデータベース(DB)構築やデジタル化が行われている。特に韓国人の漢文の文集に対しては、社団法人民族文化推進会が国家の支援を得て1986年から「韓國文集總刊」刊行事業を開始し、2005年までに正編350冊を刊行、その後さらに、2012年までの間に続集150冊を刊行した。収録文集は全1259種である。
現在、政府による知識情報資源事業の主要対象の一つに「韓国学」が設定され、国家による前近代の書籍の情報の統合・発信が積極的に行われている。韓国の韓国古典籍目録は上述の国立中央図書館の韓国古典的総合目録システムで、韓国人の漢文文集のテキストは韓国古典翻訳院の韓国古典総合DB(http://db.itkc.or.kr/)で、それぞれ検索することができる。
現在韓国では、各種研究機関等が韓国研究財団の韓国学土台事業や、韓国学中央研究院の委託管理する韓国学振興事業の支援を得て韓国学インフラ構築事業が行われ、なかでも、韓国における漢籍・古典籍をテーマ別・時代別にデータベース及びデジタル化する成果物が続々と出されている。ただ、その研究成果のデータベースとデジタル資料はユーザーインターフェースの機能が統一されておらず、全体を統括するサイトが構築されていない。また既存情報の誤りを修正するプログラムが十分に活用されていない。
一方、海外に流出した韓国の漢籍・古典籍のうち、米国や日本の主要機関の蔵書は第一段階のデジタル化が一部行われたものの、今後事業を継続するかどうかは不透明である。また、韓国国内の中国書籍(中国で書写・印刷され、韓半島に渡来した書籍)についての目録調査は行われているけれども、実物調査によるデータベース及びデジタル化はまだ行われていない。さらに、中国書籍でも韓国人旧蔵本で海外に流出したものについては、実物調査はもちろんのこと、目録の整理すら行われていないのが現状である。
The purpose of this presentation is to survey the history of the digitization of pre-modern books in Korea, including Chinese books imported to Korea. In recent decades continuous efforts have been made to gather information on pre-modern books in Korea. The publication in 1968 of Han'guk Kosŏ Chonghap Mongnok (Union Catalog of Old Books in Korea), and the construction of KORICS (Korea Old and Rare Collection Information System, https://www.nl.go.kr/korcis/) are important milestones in this regard.
User-friendly and reliable editions of pre-modern books have been produced on a large scale. A great achievement in this area is Hanʼguk Munjip Chʻonggan (General Series of Literary Collections by Korean authors), which has been published since 1986 and has provided facsimiles of 1259 pre-modern Korean books by 2012. This is the basis of the Integrated Database of Korean Classics (http://db.itkc.or.kr/), in which the text data of major literary collection of Korean authors written in Literary Chinese can be accessed and retrieved through a search interface.
Overall, the Korean government, universities and other research institutions have been launching effective projects and achieved various successes in digitizing pre-modern books, however, several problems still remain to be solved, such as improving usability of the databases and correcting errors in existing data sets.
In addition, pre-modern Korean books in oversea libraries and Chinese books in Korea, which have not yet been examined, need to be investigated in future.
「台湾における仏教学のデジタル資料」
"Digital Resources for Buddhist Studies in Taiwan"
廖肇亨(台湾中央研究院)
LIAO Chao-heng(Academia Sinica)
今日、世界の仏教研究者に対して、台湾の学界がなした最も大きな貢献はおそらくcbetaデータベースの構築であろう。法鼓山をはじめとする中華電子仏典協会は、長い間、このcbetaを発展させ、漢訳仏典が広く利用されることに力を注いできた。現在、cbetaは『大蔵経』(中国部分)、『卍続蔵』、『嘉興蔵』、『歴代蔵経補輯』、『国家図書館善本仏典』、『漢訳南伝大蔵経』、『蔵外仏教文献』、『正史仏教資料類編』、『北朝仏教石刻拓片』などの資料を収録している。法鼓山以外では、仏光山、香光寺においても、継続的に各種の仏教資料のデジタル化を進めている。台湾は、世界における漢文仏典デジタル資料の中心地といっても過言ではないほど、世界中の仏教研究者に広く影響を与えている。本発表では、台湾の仏教界が行っている漢文仏教典籍のデジタル化における構築作業の状況および今後の展望について紹介する。同時に、中央研究院デジタル人文センターを例に、人文学におけるデジタル化作業の新たな潮流についても述べる。
The construction of the Cbeta database has probably been one of the largest contribution toward Buddhism research in the world done by Taiwanese Buddhism researchers. The Chinese Buddhist Electronic Texts Association, which is represented by Fagu-shan, has long devoted its energy toward the development of the Cbeta database, which facilitates people’s broader access to Buddhist sutras translated into classical Chinese. Today, the Cbeta database contains sutras such as the Chinese part of Dazangjing (Tripitaka, Jp: Daizōkyō), Wanzi Xuzangjing (Jp: Manji zōjyō), Jiaxingzang (Jp: Kakōzō), Lidaizangjing Buji (Jp: Rekidaizōkyōhoshū, The Addition of the Addendum from Other Tripiṭakas), Guojiatushuguan Shanben Fodian (Jp: Kokka Toshokan Zenpon Butten, Taipei National Central Library Buddhist Rare Book Collection), Hanyi Nanchuan Dazangjing (Jp: Kan’yaku Nanden Daizōkyō, Chinese Translations of the Southern Tripitaka), Zangwai Fojiaowenxian (Jp: Zōgai Bukkyō Bunken), Zhengshi Fojiaoziliao Leibian (Jp: Seishi Bukkyō Siryō Ruihen), Beichao Fojiaoshike Tapian (Hokuchō Bukkyō Sekikoku Takuhen) and other works. In addition to Fagu-shan, Foguang-shan and Xiangguang-si have been continuingly digitizing historical materials related to Buddhism. Taiwan can be regarded as a center of electronic resources on Buddhism and, thus, it exerts a worldwide influence in the field. This presentation will provide detailed information on the present situation and future prospects of the digitizing process carried out by the Taiwanese Buddhism society. The speaker also illustrates new trends in digitization in humanities studies by taking Academia Sinica’s Research Center for Humanities as an example.
「日本漢詩データベースを作成するためのOCRを含むさまざまなテクニック」
"Various Techniques, Including OCR, for Digitalizing Japanese Sinitic Texts"
板橋凱希(有限会社 凱希メディアサービス)
ITAHASHI Gaiki(Kaixi Media Service)
弊社(凱希メディアサービス)では、これまで数多くの漢籍データベースを作成してきた。漢籍のデータベースを作るには、通常、(1)書籍をスキャンする、(2)スキャンした画像をカット(トリミング)する、(3)カットした画像をテキスト化する、という三つのステップが必要であり、その後に校正や難字入力などの作業が生じる。以下、日本漢詩文集のデータ化を例に、それぞれのステップで、弊社が実施している工夫を述べる。
(1)の書籍のスキャンには、現在多く存在する高性能スキャナーを使用している。
(2)のスキャンした画像をカットする工程では、OCRの識字効果を高めるため、画像の不必要な部分をカットすることが重要となる。通常、日本の古典籍を撮影すると、見開きの1枚の写真の中に、2枚の半葉の画像が入っている(例:1丁ウラと2丁オモテ)。この2枚の画像を、上下に分割する。このとき、頭注や匡郭外に記された注を保持する、柱の部分の記述(題名、丁数など)を除去する、匡郭が変形している場合でももれなく情報を読み取る、などの点に注意する必要があるが、古典籍の実際の版面は多様であり、手作業によるカットは非現実的である。弊社はどの部分を避け、どの部分が残すかを判別し、95%以上正確に図をカットすることができるツールを開発し、使用している。これにより、1分間に数千枚の図をカットすることができる。
(3)のカットした画像のテキスト化においては、漢詩文集の多くに付されている界線が、OCR処理の際、妨げとなる。これを避けるため、弊社では、文字の部分を囲み、その後にOCR処理を行う。これにより、スムーズにテキスト化することができる。
OCR後には、校正作業が必要となるが、これは、一文字ずつ校正するのではなく、同じ文字と判別された画像について、一覧・一括処理できるツールを使い、校正を行っている。一文字ずつ校正するのではなく、同じ文字と判別された文字であれば一回の作業で修正できるため、作業の効率は大幅に高まる。
Our company (Kaixi Medi Service Co., Ltd) has created many Chinese classics databases. Usually, in order to create a Chinese classics database, the following 3 steps are required: (1) Scan the book, (2) cut (trim) the scanned picture, and (3) convert the cut picture into text. After these steps, other tasks, such as proofreading, input of difficult characters, and so on, are carried out. Using the Japanese Kanshibun database as an example, we would like to describe techniques that we have devised and are using for each step.
For the 1st step, which is “Scan the book,” we use a high-performance scanner. However, this technique is widely used in many other places.
For the processes of the 2nd step, in which the scanned picture is cut, it is necessary to remove the unnecessary parts from the picture before the OCR process in order to improve the literacy effect of OCR. Usually, when we take a picture of Japanese classics, 2 half-leaf pictures appear in a spread: the 1st page (back) and the 2nd page (front). We categorize these two pictures as “up” and “bottom,” respectively. At the same time, we need to pay attention to several points in order to ensure that headnotes and comments outside the frame are retained, the pillar parts such as the title and page number are removed, information is read correctly even if the frame is bumpy and rough, and so on. However, it is not realistic to cut pictures by hand because classical works can have many kinds of formats. Our company has developed and is using a tool that can cut pictures with an accuracy of more than 95%. The tool, which determines the picture parts to be avoided or left out, makes it possible to cut thousands of pictures within 1 minute.
In the processes of the 3rd step, which converts the cut picture into text, the boundary lines that are present in many Kanshibun often prevent OCR from converting the pictures into texts with precision. To avoid this, we enclose the character parts before processing OCR. Through this technique, it is possible to convert images into text more smoothly. After the OCR process, proofreading is required. We do not proofread the characters one at a time, but we use a tool that can proofread all characters that are recognizable as the same image in a single lump at the same time. This functionality improves the efficiency of these tasks dramatically.
プログラム一覧へ
谷川惠一(国文学研究資料館副館長)
TANIKAWA Keiichi(National Institute of Japanese Literature)