Togura: 超省力機関リポジトリ
【趣旨説明】
小規模機関のみならず大規模機関でも人員不足やジョブローテション等により、リポジトリ業務に関する知識やノウハウの継承も困難になっています。研究データの公開基盤としての役割を求められ、さらにオープンアクセス加速化によりさらに業務量も多くなることが予想されます。増え続ける莫大な量の本文コンテンツとメタデータを適切にバックアップを取り、維持管理することはさらに難しくなるでしょう。
このような状況を打破するべく、大学図書館研究会 学術基盤整備研究グループでは有志により「持続可能な機関リポジトリ」を実現するための、最低限必要な機能とは何かを検討し、機関リポジトリ構築用アプリケーション “Togura”(とぐら、鳥座)を開発しました。 “Togura”(とぐら、鳥座)は、JAIRO CloudやDSpaceのようなサーバーとして動作するリポジトリソフトウェアではなく、静的HTMLファイルとメタデータファイルを出力するPythonスクリプトです。公開用のHTMLファイル、JPCOARスキーマのXML、JaLCのXMLファイルを一括で出力することができます。これらをWebサーバーにアップロードすることで機関リポジトリを構築することができます。公開ファイルは静的ファイルだけで構成されるため、Webサーバでのセキュリティの問題が発生する可能性は極めて低いと考えられます。また、動作がシンプルなので意図しない動作が起こる可能性も低いと考えられます。
機関リポジトリの役割を考え、必要な機能は何かを私たちと一緒に考えてみませんか?
【イベントのご案内】
詳細はフォーラムページをご確認ください。
☆ToguraはCC0のフリーソフトウェアで、誰でも自由に動作させることができます!GitHubで公開しています。 https://github.com/nabeta/togura
【Toguraの特長】
・Pythonの動作するパソコンと月100円台のレンタルWebサーバーで構築可能
・所属研究者のORCIDやresearchmap一覧のExcelファイルから、JPCOARスキーマのメタデータを自動作成
・Visual Studio CodeによるJPCOARスキーマのメタデータ作成補助ツールを提供
・CiNii Researchへのメタデータ連携やJaLC DOIの付与も対応
・エンバーゴ期間が終了している資料のチェック機能も搭載
・オープンアクセスとメタデータの提供に特化すること
・他のソフトウェアやWebサービスで代替できる機能は一切作らないこと
・ほかのソフトウェアとの連携による自動化・省力化を追加可能とすること
・オフライン環境のパソコン1台でも登録作業を行えること
・簡単確実なバックアップとリストア(復元)を実現すること
・将来ソフトウェアが動かなくなったとしても、公開済みのファイルには影響を及ぼさないこと
・フリーソフトウェアとして公開し、将来にわたって誰でも自由に利用できること
・日本の機関リポジトリとして、IRDB・CiNii researchやJaLCにメタデータを送付し、リポジトリに登録したコンテンツを国内外の学術基盤で流通させられること
・上記を実現するため、JPCOARスキーマに準拠したメタデータを作成できること
1.Toguraの操作環境を準備する
(1)必要なソフトウェアのダウンロードとインストール
(2)Toguraの実行準備
2.動作テスト に従ってテストしてみる 。特に確認しておくべきファイルは下記です。
・「sample」: ここに入っているデータを参考に登録データを準備する。
・「work」 : sampleフォルダのファイルを参考に作成したファイルをworkフォルダに入れる。
・「public」: Togura(「VSCode」の「ターミナル」)で 「uv run togura generate」コマンドを実行すると、workフォルダの中のファイルから下記のファイルが生成される。
3.リポジトリとして公開
Webサーバーに「public」フォルダーのファイルをアップロードする。
ローカルPCでの作業で間違いやエラーを発生させたとしても、 ローカル内での問題なので、研究者や一般利用者に迷惑をかけることはないので安心して作業ができます。
アップロードする前に、publicフォルダ内のファイルを落ち着いてチェックすることで、正確、確実な情報を公開することができます。
4.バックアップ
Toguraフォルダをコピーするだけです。
サーバートラブルや通信環境によるトラブル発生はありません。
・他の機関リポジトリからの移行
JPCOARスキーマ1.0でのOAI-PMHの出力に対応している機関リポジトリから、登録されている資料とメタデータを取り出すことができます。
・ 識別子一覧ファイルによるメタデータの一括作成
既に出版されている論文の著者版を公開するときなどのメタデータ作成に便利かと考えています。
・ エンバーゴ期間が終了している資料のチェック
・ JPCOARスキーマ・JaLC XMLファイルの出力チェック
現行リポジトリシステムに登録済のデータをダウンロードし、確認すると、ほとんどのデータが正確に記述されていないことがわかります。
<メタデータ作成のヒント(あくまでも一例)>
・コマンドを打つのが面倒!→ 通常使用するコマンドは限られているので、コマンドをリスト化しておいてコピーペーストすると簡単です。
・テキストエディタで入力するのが面倒 → 基本的なデータを別に取っておいて、コピペするだけにする等、工夫次第で業務量を減らすことができます。