je4.github.io

gocfl / ocfl / extensions

View My GitHub Profile

English

Extrahieren von Inhalten (extract)

Obwohl OCFL-Objekte direkt im Dateisystem lesbar sind, kann es notwendig sein, den Inhalt eines Objekts (oder einer spezifischen Version) in ein separates Verzeichnis zu extrahieren, beispielsweise für die Auslieferung an ein anderes System oder zur weiteren Verarbeitung ohne die OCFL-Struktur.

1. Der extract-Befehl

Mit dem Befehl extract kopiert gocfl die Dateien eines Objekts aus der Storage Root an einen Zielort. Dabei wird die logische Struktur des Objekts (der “State”) wiederhergestellt.

Grundlegende Syntax:

gocfl extract [Optionen] [Pfad zur Storage Root oder zum Objekt] [Zielverzeichnis]

Beispiel aus dem Workshop:

Um die aktuelle Version unseres Test-Objekts in ein temporäres Verzeichnis zu extrahieren, verwenden wir:

gocfl --log-level DEBUG --config ./gocfl/config/gocfl.toml extract ./gocfl/temp/test42 ./gocfl/temp/extract_v2 --with-manifest -i urn:nbn:de:gbv:42-test1

Erklärung:

2. Spezifische Versionen extrahieren

Standardmäßig extrahiert gocfl immer die neueste Version (HEAD). Möchten Sie eine ältere Version extrahieren, können Sie dies über den Parameter -v (oder --version) steuern:

gocfl --config ./gocfl/config/gocfl.toml extract --version v1 ./gocfl/temp/test42/ ./gocfl/temp/extract_v1/ --object-id urn:nbn:de:gbv:42-test1 --with-manifest

3. Wichtige Optionen

4. Was wird extrahiert?

Beim Extrahieren wird der logische State der gewählten Version wiederhergestellt. Das bedeutet:

Die Verwaltung der verschiedenen Datenbereiche (Areas) erfolgt dabei über die NNNN-content-subpath-Extension. Standardmäßig wird nur der Bereich content extrahiert, sofern nicht anders angegeben (siehe --area).


Zurück zur Anzeige im Webbrowser Weiter zum Extrahieren von Metadaten Zurück zum Inhaltsverzeichnis