国立国会図書館デジタルコレクションの公開範囲変動(2015年1月)

国立国会図書館デジタルコレクション(以下、NDLデジコレ)の変動を淡々と追い続ける「月刊NDLデジコレメタデータWatch」、今月は盛り沢山となった。

国立国会図書館デジタルコレクション書誌メタデータ 2015年1月の変動

NDLデジコレのメタデータについて、2015年1月1日から2015年1月31日までに変更のあったレコードは328,889件であった*1。これまでの月間変更レコード数と比べ、非常に多くのレコードの変更がなされている*2

昨年12月末時点のデータにおいては、「資料種別」*3が「図書」であるもののうち、「著作権に関する情報」*4に「インターネット公開」を含むものは349,769件であったが、1月31日までの更新を適用したデータにおいては349,801件となっており、32件増加している。

資料種別が「図書」であるものについて、資料数内訳は以下の通りであった。

著作権に関する情報 (dcterms:rights) 12月末 1月末
インターネット公開(許諾) 6813 6990 +177
インターネット公開(裁定)著作権法第67条第1項により文化庁長官裁定を受けて公開裁定年月日: 2009/12/18 174 58 -116
インターネット公開(裁定)著作権法第67条第1項により文化庁長官裁定を受けて公開裁定年月日: 2009/12/18; 2010/12/27 32 10 -22
インターネット公開(裁定)著作権法第67条第1項により文化庁長官裁定を受けて公開裁定年月日: 2010/12/27 50452 48522 -1930
インターネット公開(裁定)著作権法第67条第1項により文化庁長官裁定を受けて公開裁定年月日: 2010/12/27; 2012/03/01 29 28 -1
インターネット公開(裁定)著作権法第67条第1項により文化庁長官裁定を受けて公開裁定年月日: 2012/03/01 33850 32498 -1352
インターネット公開(保護期間満了) 258419 261695 +3276
国立国会図書館/図書館送信参加館内公開 502984 506812 +3828
館内公開 63961 60106 -3855
(未設定) 1 0*5 -1
(総計) 916715 916719 +4
(内、インターネット公開分合計) 349769 349801 +32

総計には大きな変化はないが、公開範囲は大きく変動している。

さらに「著作権に関する情報」変動の内訳を見てみる(表示スペースの都合により、「著作権に関する情報」の設定値を略記した)。














1月末総計
許諾裁定
2009/12/18
裁定
2009/12/18;
2010/12/27
裁定
2010/12/27
裁定
2010/12/27;
2012/03/01
裁定
2012/03/01
保護
期間
満了
図書館送信館内公開
12月末許諾288288
裁定
2009/12/18
68148117
裁定
2009/12/18;
2010/12/27
121123
裁定
2010/12/27
2319291952
裁定
2010/12/27;
2012/03/01
112
裁定
2012/03/01
368198411354
保護期間
満了
311620
図書館
送信
214616711720
館内公開55435543
総計46511221232965543168811019

この表は、例えば、12月末時点ではインターネット公開(許諾)であった図書で、1月末にはインターネット公開(保護期間満了)になっているものが288件あると読んでほしい。

この表の他、12月末のメタデータには存在せず、1月22日付けで国立国会図書館/図書館送信参加館内公開として登録された資料が5件あった*6

パブリックドメイン図書の増加

上の表で示したように、これまで許諾や裁定によりインターネット公開されていた図書で、保護期間満了に変更されたものが3,250件ある(図書館送信からの公開範囲変更を含めれば3,296件)。これらは、保護期間満了の確固たる根拠があって変更されたものであろうから、「パブリックドメインへようこそ!」と言って良いだろう。2015年1月にインターネット公開(保護期間満了)に変更された資料3,296件の一覧(tsvファイル)を作成したので、共有する*7

許諾や裁定から保護期間満了への変更は、インターネットで閲覧できる図書が増えたことにはならないものの、利用申請等なしで二次利用が可能となった。

また、図書館送信から許諾や裁定、保護期間満了に変更された49件は、新規にインターネットで閲覧できる図書が増えたと言える。

図書館送信から保護期間満了に変更された図書の中には、著作者が1964年に没し、2015年にパブリックドメイン入りした次の図書が含まれている。

没年確認による公開範囲変更として、内田さん(id:uakira)が記事で指摘された徳富蘆花・徳富愛『富士 : 小説 第3巻』も保護期間満了に変更された。

その他、ちりめん本『Contes du vieux Japon.』(フランス語版日本昔噺)や広告チラシの見本帳『新版引札見本帖』(第1〜第4)、日本地震学会の英文誌『Transactions of the Seismological Society of Japan』の一部なども保護期間満了に変更されている。

細かく見れば、今月もインターネット公開(保護期間満了)から館内公開に変更された図書が16件あるが、全体としてみると、館内公開から図書館送信への変更、図書館送信からインターネット公開への変更も含め、多くの図書の公開範囲が広がる変更がなされたことを歓迎したい。

インターネット公開(保護期間満了)から館内公開に変更された図書16件のうち4件は伊東忠太による時事漫画集『阿修羅帖』(第2巻〜第5巻)であった。これは2013年に復刻版が出版されているようだが、その点と館内公開への変更は関係があるのだろうか。

また、インターネット公開(保護期間満了)から館内公開に変更された図書の中には、『治外法権撤廃並満鉄附属地行政権の調整乃至委譲に対する満州国側の準備』(満州国総務庁情報処)などという物々しい資料も含まれている。満州国総務庁情報処の団体名義の著作物であれば保護期間満了しているのではと思ったが、これは合綴されている「統制経済を批判し大特権官僚的独占商業産業組合を裁く」が渡辺銕蔵述であり、渡辺銕蔵の著作権保護期間が満了していない(1980年没)ことの巻き添えを食ったもののようだ。

古典籍資料の一部館内限定化

今回は、古典籍資料全件のメタデータ更新があったので、資料種別が「和古書」であるものについても、資料数内訳を調べた。

著作権に関する情報 (dcterms:rights) 12月末 1月末
インターネット公開(裁定)著作権法第67条第1項により文化庁長官裁定を受けて公開裁定 年月日: 2010/12/27 13 13 0
インターネット公開(保護期間満了) 67400 67403 +3
国立国会図書館/図書館送信参加館内公開 18157 17702 -455
館内公開 0 452 +452
(総計) 85570 85570 0
(内、インターネット公開分合計) 67413 67416 +3

さらに「著作権に関する情報」変動の内訳を見てみる。

著作権に関する情報 (dcterms:rights)の変動 (12月末 → 1月末) 件数
国立国会図書館/図書館送信参加館内公開 → インターネット公開(保護期間満了) 3 *10
国立国会図書館/図書館送信参加館内公開 → 館内公開 452 (後述)

これまで古典籍資料については館内限定のものは0件であったが、今回、図書館送信から館内限定へ変更されたものが452件あった。

例えば、『いろはうた』は天保15(1844)年の資料だが、なぜ170年前の資料が図書館送信対象から館内限定に変更されたのだろうか。

館内限定になった資料のリストを見ても、実は絶版ではないことが分かったとか、著作者から送信利用の停止の要請があったとかいうこともなさそうに思えるのだが。人権侵害等の問題による利用制限だろうか。

古典籍資料等へのDOI付与

1月の更新で、NDLデジコレの古典籍資料や国立国会図書館刊行物にも全てDOIが設定された*11。既に閲覧画面の書誌情報エリアにも表示されるようになっているが、2月1日現在ではまだ“DOI Not Found”となる。

また、国立国会図書館でデジタル化した学位論文(約14万件)について、従来は国立国会図書館が付与したDOIはメタデータに反映されていなかったが、これらのDOIもほぼメタデータに登録され、閲覧画面やNDLサーチで表示されるようになった*12。ただし、国立国会図書館がDOIを付与した学位論文140,904件(2014年2月24日時点)のうち、今回メタデータにDOIが登録されたのは140,489件であり、415件はまだ登録されていない*13

毎月、メタデータの変動を追っていると、書誌情報が消滅し、これまでの永続的識別子ではアクセスできなくなる資料もあることに気付く。その中には、別のidentifierを持つ書誌データに統合されたかと思われるものもあったが、そのような場合、DOIの登録も更新してくれるのだろうか。

大規模デジタル化再び?

1月27日、官報および国立国会図書館サイトに、「国内刊行図書の原資料からの電子化1式 約1,115万コマ(予定);国内刊行雑誌の原資料からの電子化1式 約93万コマ(予定)」の意見招請に関する公示が掲載された。


次のとおり調達物品の仕様書案の作成が完了したので、仕様書案に対する意見を招請します。

平成27年1月27日

支出負担行為担当官

国立国会図書館総務部会計課長 藤本 和彦

  1. 1 調達内容
    1. (2) 購入等件名及び数量
      1. ① 国内刊行図書の原資料からの電子化1式 約1,115万コマ(予定)
      2. ② 国内刊行雑誌の原資料からの電子化1式 約93万コマ(予定)

http://www.ndl.go.jp/jp/supply/other/iken/1209037_819.html

驚いたのは、その規模の大きさだ。平成25年度に国立国会図書館で行われた電子化と比較すると、図書で約26倍、雑誌で約67倍のコマ数が予定されていることになる*14

ここ数年でデジタル化されたコマ数を見てみると(下表)、平成21、22年度の多額の補正予算(合計137億円)によって実施された大規模デジタル化(平成21〜23年度)の後は落ち込んでいたが、今回の予定コマ数は、大規模デジタル化時に及ばずとも遠くない量となっている。

年度 デジタル化コマ数(図書) デジタル化冊数(図書)
平成21年度 約1,870万コマ 約15万冊 *15
平成22年度 約6,308万コマ 約45万冊 *16
平成23年 約1,292万コマ 約8万冊 *17
平成24年 約25万コマ 約0.2万冊 *18
平成25年度 約43万コマ 約0.3万冊 *19

図書約1,115万コマとなると、5〜10万冊規模だろうか*20。その規模で未デジタル化な図書(古典籍資料ではなく)が対象とすると、1968年より後に受け入れた図書のデジタル化に着手するのであろうか。

もしそうであれば、例えば平成25年度に国立国会図書館が受け入れた和図書は約20万点。1968年より後の時期の受け入れ状況が分からず、5〜10万冊でどの程度カバーされるのか分からないが、そこは千里の道も一歩からだろう。今後に注目したい。

NDLデジコレの書誌情報オープンデータセット公開

1月30日、NDLデジコレの書誌情報データセットがダウンロード可能になった。

取り扱い(営利・非営利の目的を問わず、利用手続なしで自由に利用可能)が明記されていて素晴らしい。さらに、OAI-PMH経由で取得した書誌メタデータについてもオープンライセンスとしていただけることを期待したい。

ただ、このデータセット公開について分からないのは、以前の記事で取り上げた、国立国会図書館の「LODチャレンジ2014用データセット」のようなイベント向け単発のデータセットの一つなのか、これから継続的に更新する意志をもって公開されたものなのかという点だ。

ある時点でのスナップショットが手軽に得られるという意味で、仮に単発であったとしても今回のデータセット公開は意義深い。しかし、継続的に更新されれば、さらに利用価値が上がることは言うまでもない。

OAI-PMH経由メタデータとの比較

次に、公開されたデータセット(以下「オープンデータセット」という。)とOAI-PMH経由で取得したメタデータ(以下「OAI-PMH経由メタデータ」という。)を比較してみる。

オープンデータセットは、2015年1月26日時点の書誌情報であり、公開された件数は次のようになっている*21

資料種別 公開範囲
インターネット公開 図書館送信 館内限定
図書 347,825件 505,494件 47,088件
古典籍 73,252件 18,789件 468件
雑誌 12件 10,573件 2,486件

NDLデジコレの詳細検索で得られる結果では、件数は次のようになる(2月1日現在)。

資料種別 公開範囲
インターネット公開 図書館送信 館内限定
図書 図書(349984)
古典籍資料(2165)
図書(507743)
古典籍資料(2249)
図書(60118)
古典籍資料(52)
プランゲ文庫(12978)
古典籍 図書(2165)
古典籍資料(73238)
図書(2249)
古典籍資料(18789)
図書(52)
古典籍資料(468)
雑誌 雑誌(8230)
雑誌等の巻号を省略(12)
雑誌(744854)
雑誌等の巻号を省略(10572)
雑誌(497296)
雑誌等の巻号を省略(2423)

両者の比較から、オープンデータセットでは、図書については古典籍資料やプランゲ文庫のものは除いていること、図書でもあり古典籍資料でもあるとされているものは古典籍のリストにカウントされていること、雑誌については巻号を省略した件数となっていることが分かる。(プランゲ文庫の図書についてはオープンデータセットに含まれていないことになる。)

このブログのシリーズ記事で見てきたOAI-PMH経由メタデータの図書件数は、メタデータの資料種別に「図書」が設定されているものの件数であり、資料種別に「図書」と「和古書」の両方が設定されている資料(古典籍資料の一部)や、「図書」と「静止画資料」の両方が設定されている資料(プランゲ文庫の資料に見られる)も含んでいる。このため、オープンデータセットの件数とは相違する部分がある。

また、古典籍資料については、この記事の冒頭で見たように、OAI-PMH経由メタデータのうち資料種別が「和古書」であるものは、インターネット公開67,416件、図書館送信17,702件、館内限定452件であった(1月末現在)。

この件数は、オープンデータセットの件数ともNDLデジコレの検索結果件数とも異なり、どちらよりも小さい数字になっている。この違いは、OAI-PMH経由メタデータには、多巻物などの「【全号まとめ】」に相当するレコードが含まれておらず、オープンデータセットやNDLデジコレの検索結果ではそれらを含んでいることによる*22

この違いは、メタデータを最初に刈り取ったときにツイートしたように、「全号まとめ」を含んだ件数ではなく、実体のある資料件数をNDLデジコレの検索結果から知ることを困難にしている。

細かいところでは、これまで何度か記事で取り上げたが、今もNDLサーチのメタデータではタイトル未登録となっている図書2件*23について、オープンデータセットではタイトルが記載されているという違いがあった。

「書架を廻るような『出会い』がある」

今回のオープンデータセット公開に関して、言い得て妙なツイートを目にしたので、最後に引用したい。

確かに、そんな出会いがある内容だと思う。改めて、オープンデータセット公開に感謝。

*1:国立国会図書館サーチが提供するOAI-PMHを利用した。

*2:レコードヘッダのdatestampは確かに1月の日付に更新されているが、メタデータはDC-NDL (Simple)フォーマットで見る限り以前と全く変化のないレコードも多数あった。それらについては、DC-NDL (Simple)フォーマットでは出力されず、DC-NDL (RDF)フォーマットでは出力されるメタデータ項目の内容に変化があったのかもしれない。

*3:dcndl:materialType

*4:dcterms:rights

*5:帝国図書館雑誌新聞目録』(注記に「図書館送信テスト」とあり)であったが、1月12日付けで書誌情報が削除された。

*6:お話宝玉選』、『日本童話宝玉選』、『世界童話宝玉選』、『200万円以上の高額所得者全覧 : 近畿地方六府県(大阪国税局管内)』、『民族問題概説』。ただし、これらの資料は2014年3月20日付けで書誌情報が削除されたレコードが復活したものであり、純粋に新規公開と言えるかは分からない

*7:書誌情報には、後述のNDLデジコレのオープンデータセットの内容を利用した。

*8:「事故本」のラベル貼付あり。

*9:「事故本」のラベル貼付あり。NDLデジコレ閲覧画面の「電子化時の注記」には欠ページの情報が記載されているが、NDLサーチのメタデータには記載がない。

*10:新居守村翁遺著』、『[伊藤博文書簡]』、『實験室』(有島武郎自筆原稿)

*11:資料種別が「和古書」である85,570件全て、同じく「国立国会図書館刊行物」である3,916件全てについて、メタデータにDOIが反映されている。

*12:博士論文については、出版者自身のDOIがメタデータに登録されているケースが12月末時点で27件あった(福井大学17件、神戸大学7件、奈良県立医科大学3件)。例えば、この博士論文は、NatureによるDOIがメタデータに登録されていた。

*13:例えば、この博士論文のように、国立国会図書館が付与したDOIを用いて http://dx.doi.org/10.11501/3077734 にアクセスするとNDLデジコレのページが表示されるが、当該ページにDOIの表示はない。

*14:先月の記事で見たように、平成25年度には、図書は約43万コマ、雑誌は約1.4万コマが電子化されている。

*15:国立国会図書館年報 平成21年度』p.229

*16:国立国会図書館年報 平成22年度』p.259

*17:国立国会図書館年報 平成23年度』p.260

*18:国立国会図書館年報 平成24年度』p.191

*19:国立国会図書館年報 平成25年度』p.223

*20:平成21年度から平成25年度に行われた、図書の原資料からの電子化では、コマ単価としておおむね50円程度、大型本等では100円程度で実施されていた。5〜10億円規模になるだろうか。

*21:余談だが、国立国会図書館サイトのHTMLソースを見て、table要素のsummary属性がきちんと記述されていることに感心してしまった。

*22:例えば、「一切經音義25卷附補訂新譯大方廣佛華嚴經音義2卷校勘記1卷 【全号まとめ】」は、オープンデータセットやNDLデジコレの検索結果には含まれているが、OAI-PMH経由メタデータには含まれていない。

*23:長崎料理史』の書誌情報、『本朝陶器攷証 : 6巻. 六』の書誌情報