![]() |
|
JSTORは2005年6月、アーカイブ化された『Science』誌の既刊号の「更新」版を発表しました。 JSTORが『Science』誌を最初に電子フォーマット化したのが1999年。同誌は、それまでにデジタル化、アーカイブ化されたジャーナルの中で、最大かつ最も複雑なもののひとつでした。 JSTORでは、ジャーナルを現在の仕様に変換する大型イニシアチブ、「レトロプロジェクト」が進行中ですが、『Science』誌の更新版の実現は、目に見える形でこのプロジェクトを体現させた最初の作業に数えられます。
『Science』の初刊は1880年に発行。以来120年間、ページ数にして380,000以上が出版されました。 レトロプロジェクトの初期の作業は大変なものでした。それまでにJSTOR がスキャンしていた同誌の巨大なページ数は借りていたものでしたが、所有者に戻されていたため、JSTORの制作部門でまとめ直して置き換えるという作業が必要になったためです。 これには1年以上を要しました。それに加え、資料は何十もの異なる場所から集められたものでした。 全巻が確保された後、細部までていねいに点検した結果、最初にデジタル化されたものと現在のものの間にわずかな違いが発見されました。 不一致が主に見られたのは広告ページでしたが、こういったページは所蔵図書館が取り除いている場合もありました。 不一致のひとつひとつの査定と書類化を行い、解決に至りました。
そして、JSTORが作成した詳細にわたる説明を加え、スキャンを行う業者へと全巻が送付されました。 スキャンにまつわる重要点は、画像合成の追加、Unicodeのエンコード、ASCII字訳、イラスト・キャプションの取得でした [これらアイテムの説明は http://www.jstor.org/news/2005.03/retro.htmlをご覧ください]。 タイトル、著者名、論文要旨は全て、アラビア語やギリシャ語といった非ASCII文字を対象に検定され、Unicodeでエンコード化されてから、標準規格に字訳されました。 そして、画像とキャプション情報を調べるため1ページ1ページが検討されました。 その後、計153,930点の白黒イラストとカラーイラストが再びTIFFフォーマットでスキャンされ、画像合成も可能となるよう処理されました。 このプロセス全体においてJSTORは提携業者と密に協力し、JSTORに戻されたデータは、漏れのない検討とクオリティー・コントロールを経ました。
新しいデータが整った時点で、常時研究者と学生に使用されているリリース中の資料を置き換えるというもうひとつの課題が待っていました。 制作チームと協力し、サービスに中断や遅れが生じないことを確実にする作業が行われ、また通常のデータリリース・プロセスの修正版によって、新しいデータの追加をスムーズに行うことが可能となりました。 こうして、研究者と学生の皆様は、新しいコンテンツに置き換えられるその時点まで、中断や遅れなしに従来のコンテンツにアクセスすることができたのです。
JSTORによる「更新」版で、『Science』の魅力に再び出会ってください。 この他にも、言語・文学分野の『Language&Literature』16タイトルの「更新」版が9月にアーカイブに加わります。もちろん中断はありません。 その中のひとつが『Shakespeare Quarterly』です。同誌では、1787年のアメリカ初のシェイクスピアの彫板を含め、17?18世紀のイラストに再作業が加えられました (1961年春号第2刊12号)。
こういったタイトルでの作業は、プロジェクトの作業プロセスを管理するのに必要なプロセスとツールを開発するテストとして貴重なものとなりました。 JSTORの2000万ページのアーカイブが、進化を続ける保存法、データの取得、オンライン提供標準と同様のレベルを維持していくためには、こうした活動が必要です。JSTORはこれからも、数々のタイトルをどしどし紹介していきたいと考えています。
©2000-2007 JSTOR