Shared Printのお話(その2)

つづき。

図書の共同保存

HathiTrust

  • 概要
    • デジタル化資料のリポジトリ
    • 参加機関76(コンソーシアム2、個別機関74)
    • 参加館一覧
    • Hathi=ヒンディー語で「象」(「大きくて強い」「決して忘れない、賢い」「安全」「信頼できる」)
  • ミッション:人類の知識の記録を収集・組織化・保存・伝達・共有することによって公益に寄与すること

デジタルアーカイブの構築

  • コンテンツの現状
    • 各大学が独自にデジタル化したもの+Googleと提携してデジタル化したもの
    • 最近は大学出版社と提携してバックファイルを収集することも始めている
    • コンテンツ供給機関の分布:最も多いのはミシガン大学、次がカリフォルニア大学
    • コンテンツの出版年:15世紀から現在まで多岐にわたる。現在のものはGoogleによるものが多い
    • コンテンツの言語:出現言語数は400以上にのぼる。上位10言語で全体の86%を占める(日本語は3%、20万冊ほど)
  • Googleによってデジタル化されていないコンテンツの収集
    • Internet Archive(1996年に設立されたアメリカの非営利法人。全世界のウェブ情報を収集し公開している)によってデジタル化された図書や雑誌のコンテンツを自動で収集する仕組みを開発
    • その他のデジタル化された図書や雑誌のコンテンツ(例:パートナー機関によってデジタル化されたもの)の収集についても今後取り組む予定
  • 図書と雑誌以外のコンテンツの収集
  • 信頼できるリポジトリ
    • TRAC(Trustworthy Repositories Audit & Certification:信頼できるリポジトリの認証のための監査)に準拠

コンテンツの長期保存の保証

  • 技術標準
    • OAIS(Open Archival Information System:電子情報の長期保存システムに関する技術標準)とTRACに準拠する
    • 一貫性と標準化:3つの形式(ITU G4 TIFF、JP2、Unicode OCR)のみしか使わない
    • 単一性、実用性、持続可能性等を考慮
  • OAISモデル
    • 収集:コンテンツの確認、変換、パッケージング→リポジトリに投入
    • 保存:地理的に別の場所にある二つのリポジトリ+バックアップテープ
    • データ管理:書誌管理、権利管理、所蔵管理
    • アクセス:書誌検索、全文検索、その他さまざまなサービス

印刷資料のための共同書庫構築

  • 重複整理: HathiTrustのコンテンツと各館が所蔵する印刷資料との重複状況
    • ARL図書館の蔵書とHathiTrustとの重複の中間値
      • 2009年6月:19%→2010年6月:31%に増加
      • 小規模な学術大学においては、重複の割合がより大きい
    • アメリカ国内の共同書庫にある印刷資料とHathiTrustとの重複はおよそ75%
  • 共同書庫構築のコーディネート
    • 2011年10月に開催された総会にて、分散型印刷資料アーカイブの設立に向けて取り組むことが合意された
    • 冊子所蔵に応じたプライスモデルを2013年から導入予定
      • 冊子所蔵に関するデータベースが必要
      • 重複を取り除くための法的使用拡張の支援
      • 各機関及び共同での蔵書構築の支援

アクセスの改善

  • アクセス改善のための技術
    • 閲覧・ダウンロードのためのアプリケーションの開発
    • コンテンツをデジタル化した機関、コンテンツをもともと所蔵していた機関の表示
    • ディスカバリーインターフェースの開発
    • リポジトリ全体の全文検索の開発
    • Collection Builder(個人でコレクションを作ることができるツール)の開発
  • 著作権処理
    • 資料の出版国や出版年によって、著作権処理が自動で行われるもの/マニュアルで行うものに区別される。参考

集約と公開

参考

その他

図書・雑誌両方の共同保存

Five College Consortium FCLD


Shared Printの概要についてはここまで。
挙げた各取り組みの詳細について、もう少し調査ができれば書くかも。