シェアードプリントのためのコレクション分析手法

短期集中で読んだので勢いでまとめ。

シェアードプリントを始めるにあたって重要な、でも結構大変なプロセスとして「参加館全体のコレクション分析」というのがある。シェアードプリントは資料の保存責任を分担するもので、「この資料は○○大学」「あの資料は××大学」のように保存責任図書館を決めていくのだけど、参加館の中で「何が」「どのくらい」「重複している/していない」がわからないといけなくて、これを明らかにするためのコレクション分析。
最近の個人の関心事として「日本全体で何冊保存することにしたら、後世まで安全に残せるのだろうか」があって、「資料が失われるリスクと保存にかけられるコストの最適点はどこか」みたいなアプローチも考えつつ、コレクションの重複状況からも色々見えるのではないかと思い。
北米ではSustainable Collection Services(SCS)がこのコレクション分析コンサルタントみたいなことをやっていて、結構使っているシェアードプリントプログラムも多いので、この手法をちょっと見てみようと思った。


参考にしたのは、Maine Shared Collection Strategy(MSCS)*1に対しSCSが提示したコレクション分析提案書

  • クライアント=MSCS、ベンダー=SCS
  • 【】内はその作業の作業者

1.企画ミーティング

  • 【MSCS、SCS】プロジェクトのロードマップとスケジュールを作成
    • 主な参加者:プロジェクトリーダー、システムライブラリアン、コレクション部門の代表者、データをよく知っている人(たいていは目録作成者)など
  • 目的:コレクション分析のために抽出するデータの範囲を決め、タイトルリストを確定。
    • 参加館で異なるデータの持ち方(適用している分類表や貸出規則の違いなども含め)をしている点について要議論。
    • 所蔵データについて比較する集団や特別な保存ルール(州内の著作物は必ず保存するとか)についても決めておく。

2.データの準備

  1. 【MSCS】書誌(bib)データ、資料(item)データ、貸出データを作成、SCSへ提供
  2. 【SCS】受け取ったデータの変換や正規化を行ってデータベース化
    • 正規化の過程で修正したりリッチにしたりした各館の所蔵データについては、あとでリストがもらえるらしい(おまけ的)
  3. 【SCS】集めたデータについてWorldCatから全国的な所蔵冊数を取得。Hathi Trustとの照合もやる
  • SCSがこの作業にかかる期間は、データの量によるけど、240万レコードで3週間くらい

3.グループコレクションサマリー

  • 【SCS】貸出回数○回以上の資料、WorldCatで所蔵が○未満の資料、のように様々な条件でリストを作成

f:id:ask_w:20180111113357j:plain
出典:Maine Shared Collection Strategy (MSCS)Proposal: Collection Analysis Support

4.シナリオ作成

  1. 【MSCS】グループコレクションサマリーをもとに、保存・除却のシナリオ(条件)を作成
  2. 【SCS】そのシナリオを適用した場合、各館が何冊保存・除却することになるか計算
  3. 【MSCS・SCS】これを繰り返す

f:id:ask_w:20180111114608j:plain
出典:Maine Shared Collection Strategy (MSCS)Proposal: Collection Analysis Support

5.候補リスト

  • 【SCS】作成されたシナリオを適用し、グループ全体での保存候補資料リストを作成
  • 【SCS】所蔵館が少ないので「保護」すべきと思われる資料のリストは各館ごとに作成

6.保存責任の割り当て

  • 【MSCS】候補リストをもとに、どの館がどのタイトルを保存するか割り当て*2

7.保存リスト・除却リストの作成

  • 【SCS】保存リストを各館ごとに作成
    • そのグループを代表して保存・保護することを約束するとよいタイトルが掲載されているリスト
  • 【SCS】除却リストを各館ごとに作成
    • 除却できると思われるタイトルが掲載されているリスト

8.データ管理の継続

  • このプロセスで作成したデータセットは2年間有効(ただしデータの更新はしない)。新しいプロジェクトが生まれたときにそのまま活用できる(というSCSの売り)


以上です。
グループコレクションサマリーのようなものは、NC所蔵データを使って試してみられるかも?と思ったけど、学内複本がぼろぼろ落ちそうだな。
あと電子化資料と冊子体資料の突き合わせ。これ課題。

*1:メイン州の図書館によるシェアードプリント。学術図書館だけでなく公共図書館も参加してたり、図書のシェアに主眼が置かれているのが特徴。

*2:割り当て方法についてはこの提案書には記載がないけど、MSCSのWebサイトで公開されてる