日別アーカイブ: 2024年9月1日

国会図書館デジタルコレクションの効率の良い検索

膨大な資料があるのでとても興味深い国会図書館デジタルコレクションなのですが、資料の数が多すぎて面白そうな資料が探しにくいというありがたい悩みがあります。

最近資料検索の方法を色々と工夫しているのでまとめておこうと思います。Web検索に検索ノウハウ的なものがあるのと同じように、図書館での資料検索にも独特の技法があるように感じています。

検索する項目を指定する

資料を検索する項目として以下の3つがあります。

  • 書誌情報
  • 資料の本文
  • 資料の目次

書誌情報というのはその資料のメタデータ的なもののようです。資料の中身を示す情報なので、キーワードがこの項目に含まれているものはかなり目当てのものに近いと言えます。

資料の本文は読んで字の如く、資料を全文検索してヒットするかどうかです。広範囲な検索ができる一方で、その分ノイズも増えることになります。

資料の目次はその資料に目次情報がある場合にそこにキーワードが含まれているか否かです。書誌情報にキーワードがなくても資料の目次の見出しに含まれているのであれば、知りたい情報が一定程度含まれていると言えると思います。

まずは書誌情報と資料の目次に絞って検索をしてみて、それらをチェックし終わったら資料の本文でも検索してみるという使い方が良いのではないかと思います。

NDC分類を使う

図書館特有のテクニックとしてNDC分類(日本十進分類法)を使うという方法があります。図書館の本には背にラベルが貼付されていますが、あれに書いてある番号のことです。

私はよく国会図書館デジタルコレクションで地域の情報や鉄道路線の情報を検索しますが、例えば”小布施町”というキーワードのみで検索すると膨大な資料がヒットします。

そんな中で調べたい資料の内容が民話や習慣などの民俗学的な内容と決まっている場合は 3 社会科学 のカテゴリーに含まれる 38 風俗習慣・民俗学・民族学 に絞ればおおよそ絞り込み完了となります。

NDC分類にはさらに下のカテゴリーもあるので、もっと絞り込んで 386 年中行事、祭礼 で絞る等すればかなり資料の解像度は高くなってきます。

後述しますが国会図書館の資料には年報類や要覧類も相当数含まれていて、検索の際に大量に出てくるのでそれらを表示させないのに便利な方法です。

NOT検索を使う

国会図書館デジタルコレクションではWeb検索のようなNOT検索もできるので、うまく使うと効率の良い検索ができます。

先に述べましたが資料の中には年報や要覧が非常に多く、そのまま検索すると商工名鑑や人名録などが多数ヒットします。これらの資料が調査の対象でない場合はキーワードの段階でNOT検索に入れてヒットしないようにしてしまうと結果が見やすくなります。

記法が独特で、「[検索キーワード] NOT [除外したいキーワード]」という書き方になります。

長野電鉄について調べたいが、年報類は除外したい

長野電鉄 NOT 年報

これだけでも結果を2/3くらいに圧縮することができます。

また、複数設定することもできます。

長野電鉄について調べたいが、年報と人名録は除外したい

長野電鉄 NOT 年報 NOT 人名録

こんな感じで大丈夫です。

この方法はかなり検索結果を圧縮できるのですが、副作用としては全文検索でのNOT検索になるので、本文中に「昭和○○年陸運年報より引用」という文字列を含む資料があった場合は検索結果に出なくなります。

そのため、NOT検索に使うキーワードはあまり一般的な単語にしない方が良いと思います。

まずは大ざっぱにNOT検索で興味深い資料を探ってみて、自分の見たい資料がNDC分類のどこにあることが多いかを把握していくと調べ物の効率が良くなると思います。