お知らせ国文研DDHプロジェクト
国文研DDHプロジェクト
お知らせ
本事業について
国文学研究資料館では、文系唯一の大規模学術フロンティア促進事業(文部科学省)として、「データ駆動による課題解決型人文学の創成~データ基盤の構築・活用による次世代型人文学研究の開拓~」(国文研DDHプロジェクト)を、令和6(2024)年度から令和15(2033)年度までの十年計画で実施しています。
本計画では、国内外機関等との連携による更なる画像データの拡充、画像データのAI利活用等によるテキストデータ化、データ分析技術開発の推進など、国文学を中心とするデータインフラを構築し、様々な課題意識に基づく国内外・異分野の研究者との共同による大規模データを活用した次世代型人文学研究を開拓することを目指しています。
- 本計画は、平成26(2014)年度から令和5(2023)年度までの十か年で実施した「日本語の歴史的典籍の国際共同研究ネットワーク構築計画」(歴史的典籍NW事業)の成果をさらに発展させる後継事業です。
研究基盤データベースのデータ拡充・高度化
国文研DDHプロジェクトでは、以下の3つの活動を軸に、研究基盤データベースの拡充と高度化に取り組み、データインフラの構築を目指しています。
これまでに30万点の日本語の歴史的典籍の全冊画像を作成し、国書データベースで誰でも無料で利用できるオープンデータとして公開しています。本事業では画像データの集積の範囲を明治初頭まで拡張し、さらに15万点を加えて、合計45万点の画像を集積します。
国書データベースで公開している歴史的典籍の画像データを元に、OCRにより、機械可読な形のテキストデータを作成します。これにより、オンラインでの検索・表示システムの提供や機械学習モデルの作成などに利用できるようになります。
OCRにより作成されたテキストのうち、一部テキストに関しては研究者による校正や既存の翻刻資料を通じて、より信頼度の高いテキストを提供します。
これらの成果は、国書データベースを通じて公開していきます。
異分野融合によるデータ駆動型研究の推進
大量の古典籍の電子化・テキスト化による一般への開放、及びデータの構造化・体系化と利活用を目指して、「データインフラストラクチャの構築」、「人文系データ分析技術の開発」、「コンテンツ解析からの展開」、「マテリアル分析・解析」の4つの研究領域において共同研究を推進しています。
本計画の基盤となるデータ駆動システムのハード面・ソフト面にわたる開発を行い、古典籍のOCR技術の高度化や、画像検索機能の開発などに関する共同研究を実施しています。
日本語で記された人文系データの機械処理のための技術向上と研究支援を推進しています。
人文科学分野で活用されてきたエビデンスデータを自然科学・社会科学にも利活用し、現代社会の直面する課題を解決する共同研究を推進しています。
従来ほとんど行われてこなかったマテリアルとしての書物からの情報抽出及び分析・解析技術の確立を目指しています。
また、多様な人文学分野の拠点である機構内各機関との協働により機構のスケールメリットを活かし、大規模データを活用した様々な課題意識に基づく国内外研究者との異分野融合研究を実施しています。
海外との連携
国内の古典籍資料のみならず、海外に所在する日本古典籍資料の画像・書誌情報の充実にも取り組んでいます。
EAJRS(欧州)やCEAL(北米)との覚書に基づき、日本古典籍(くずし字)講習会を毎年実施し、若手研究者を中心に海外研究者との交流を推進しています。
また、日本の研究者が海外で研究活動を積極的に展開できるよう、海外の日本古典籍所蔵機関の協力を得て、各所蔵機関のコンタクト先、コレクションの概要等を当館ウェブサイト(在外日本古典籍所蔵機関ディレクトリ)から公開しています。
当館が幹事機関を務める「日本古典籍研究国際コンソーシアム」では、書誌学用語勉強会等を主催し、日本古典籍を対象とした用語の多言語の検討を行うなど、プロジェクトの国際的認知度向上や国内外の研究者交流などに積極的に取り組んでいます。
情報発信
国内外でのシンポジウムやワークショップ等による共同研究の成果発信や国書データベースの利活用に繋がる発信に積極的に取り組んでいます。併せて、一般市民や中高生に向けたアウトリーチ活動を展開し、研究成果を広く還元します。
イベント
出版物
問い合わせ先
本プロジェクトに関するお問合せはこちらまでメールでご連絡ください。
htddpsinfo@nijl.ac.jp