Start | Login | English
 
  Home
  Arbeitsgruppen
 
Informationsplattform
  Informationsdatenbank
  Wer Wo Was
  Aktuelles
  Kalender
  Qualifizierung
  Newsletter
   Archiv
   Suche
   Anmelden
   Feedback
 
  Padi
 
 
UNESCO Archives Portal
 
  Archiv

[zurŘck]

nestor Newsletter 09/2006 [30. Juni 2006]
Begr├╝├čung
Wir freuen uns, Ihnen heute den neunten nestor Newsletter pr├Ąsentieren zu k├Ânnen. Wir m├Âchten Sie damit ├╝ber Entwicklungen im Projekt nestor informieren.
Auf der Homepage des Projektes k├Ânnen Sie sich laufend ├╝ber aktuelle Entwicklungen informieren.


Aktuelle Entwicklungen des Projektes

Den Fortschritt bewahren - 3 Jahre nestor
Unter diesem Motto stand die nestor-Veranstaltung am 19. Juni 2006 in der Deutschen Nationalbibliothek Frankfurt am Main. Auf der mit 130 Teilnehmerinnen und Teilnehmern sehr gut besuchten Veranstaltung haben die Projektpartner von nestor wichtige Ergebnisse ihrer Arbeit vorgestellt und einen Ausblick auf die zuk├╝nftige Arbeit gegeben. Als G├Ąste haben drei Projekte zur Langzeitarchivierung aus der Schweiz und Deutschland berichtet. Weiterhin haben mit Herrn Prof. Dr. O├čwald und Frau Prof. Scheffel zwei Vertreterinnen und Vertreter von Ausbildungsinstitutionen zu den Perspektiven des Themas Langzeiterhaltung in den Curricula vorgetragen und mit Prof. Dr.-Ing. Hemmje hat ein Vertreter der Wissenschaft zum Thema "e-Science und Langzeitarchivierung" referiert.
Das im Mai 2006 von nestor ver├Âffentlichte "Memorandum zur Langzeitverf├╝gbarkeit digitaler Informationen in Deutschland" wurde von Heike Neuroth (SUB G├Âttingen) vorgestellt. Die Entwicklung von Grunds├Ątzen einer gemeinsamen Strategie auf nationaler Ebene war eine wichtige Zielsetzung des Projekts, die in einem interdisziplin├Ąren und kooperativen Ansatz erreicht wurde.
Ein weiterer Schwerpunkt der Arbeit von nestor wurde durch die Arbeitsgruppe "Vertrauensw├╝rdige Archive - Zertifizierung" geleistet. Die Kriterien f├╝r die Vertrauensw├╝rdigkeit digitaler Langzeitarchive wurden unter Ber├╝cksichtigung von Vorarbeiten im internationalen Umfeld mit dem Ziel erarbeitet, einen Leitfaden f├╝r Ged├Ąchtnisorganisationen und eine Orientierungshilfe f├╝r alle anderen archivierenden Einrichtungen bereit zu stellen.
Die Aufnahme internationaler Entwicklungen bei der Entwicklung von Metadaten in die praktische Anwendung von Archiven war das Thema des nestor-Partners Bundesarchiv. Es wurde gezeigt, dass Metadatenstrukturen, die im bibliothekarischen Kontext und mit Schwerpunkt im angloamerikanischen Raum entwickelt wurden, durchaus auch f├╝r die praktische Nachnutzung in Deutschland Bedeutung haben.
Ergebnisse der Forschung in Museen bestehen zunehmend aus digitalen Datensammlungen, die zur Interpretation und Erschlie├čung der musealen Objekte langfristig bewahrt werden m├╝ssen. Die Kolleginnen und Kollegen vom Institut f├╝r Museumskunde haben anschaulich dargestellt, dass zusammen mit erzeugten digitalen Surrogaten f├╝r Sammlungsobjekte und genuin digitalen Artefakten in Museumsbest├Ąnden eine Vielfalt digitaler Ressourcen langfristig verf├╝gbar gehalten werden muss.
Alle Pr├Ąsentationen der Veranstaltung sind online auf der Homepage einsehbar (Homepage -> Veranstaltungen -> Konferenzen).

Die Zukunft von nestor
Die Projektpartner von nestor haben in den letzen Monaten intensive Gespr├Ąche mit dem Projekttr├Ąger f├╝r das BMBF im DLR (PT-NMB+F) gef├╝hrt. Es wurde Einvernehmen dar├╝ber erzielt, dass die Arbeit von nestor in Form eines Anschlussprojekts "nestor II" fortgef├╝hrt werden soll.
nestor II wird derzeit beantragt als Verbundprojekt der Partner Deutsche Nationalbibliothek, SUB G├Âttingen, BSB M├╝nchen, HUB Berlin, Bundesarchiv, Institut f├╝r Museumskunde und FernUniversit├Ąt Hagen. Ein zentrales inhaltliches Anliegen des Projekts wird es sein, die Bereiche e-Science, Grid-Computing und Langzeitarchivierung digitaler Ressourcen zu vernetzen.
Eine wesentliche Aufgabe der zweiten Projektphase liegt aber auch darin, die notwendigen organisatorischen, politischen und finanziellen Voraussetzungen f├╝r das Kompetenznetzwerk zu schaffen, um eine dauerhafte Verankerung des Themas und der damit verbundenen Aktivit├Ąten in Deutschland zu erreichen. Da diese Aufgabe in gleichem Ma├če auch f├╝r die Erhaltung des schriftlichen (tr├Ągergebundenen) Kulturguts in Deutschland gilt, ist eine gemeinsame Initiative von nestor und der ÔÇÜAllianz zur Erhaltung des schriftlichen Kulturgutes' in Vorbereitung.

nestor-Memorandum zur Langzeitverf├╝gbarkeit ver├Âffentlicht
Das nestor-Projekt hat im Mai 2006 in einem "Memorandum zur Langzeitverf├╝gbarkeit digitaler Informationen in Deutschland" Empfehlungen ver├Âffentlicht. Das Memorandum beschreibt wie Rahmenbedingungen f├╝r die zukunftsorientierte und Erfolg versprechende Erhaltung des digitalen Erbes in Deutschland geschaffen werden k├Ânnen.
Dieses Memorandum basiert auf den Arbeiten und Erfahrungen der nestor-Projektpartner, auf Beitr├Ągen aus der Wissenschaft, einer Umfrage unter deutschen Archiven, Bibliotheken und Museen und den Anregungen einer ├Âffentlichen Diskussionsveranstaltung im Bundesarchiv Koblenz im Februar 2006. In 18 Grunds├Ątzen fixiert das Memorandum eine deutsche "Langzeitarchivierungs-Policy" in den Themenbereichen "Verantwortung f├╝r die Langzeiterhaltung digitaler Informationen", "Auswahl, Verf├╝gbarkeit und Zugriff", "Technische Vorkehrungen" und "Vernetzung und Professionalisierung". Durch eine breit angelegte ├ľffentlichkeitsarbeit in diesem Zusammenhang wollen die nestor-Partner erreichen, dass das Bewusstsein f├╝r die Notwendigkeit von Investitionen in die Langzeitverf├╝gbarkeit digitaler Ressourcen weiter w├Ąchst.
Im Einzelnen h├Ąlt das Memorandum nach einer Einf├╝hrung in die Thematik der digitalen Langzeitarchivierung unter der ├ťberschrift "Verantwortung f├╝r die Langzeiterhaltung digitaler Informationen" fest, dass die Erhaltung und langfristige Verf├╝gbarkeit digitaler Objekte eine Aufgabe von nationaler Bedeutung ist, die auch entsprechende Ber├╝cksichtigung in allen relevanten Bereichen der Gesetzgebung finden mu├č. Dar├╝ber hinaus wird explizit betont, dass die nationale Herausforderung nur gemeinsam durch verteilte und arbeitsteilige Kooperation bew├Ąltigt werden kann. Die Entwicklung einer nachhaltigen Organisationsstruktur verbunden mit einer Koordinationsstruktur soll dabei sicherstellen, dass diese Aufgaben dauerhaft und langfristig bew├Ąltigt werden k├Ânnen. Eine der wesentlichen Herausforderungen besteht zum Beispiel auch darin, die Integrit├Ąt, Authentizit├Ąt und Verf├╝gbarkeit des digitalen kulturellen Erbes zu gew├Ąhrleisten. Der Begriff der Verf├╝gbarkeit beinhaltet explizit die Vorkehrung organisatorischer und technischer Ma├čnahmen gegen den Verlust des digitalen Erbes.
Unter der ├ťberschrift "Auswahl, Verf├╝gbarkeit und Zugriff" werden Aspekte betont, die zum Beispiel auf das gesamte heterogene Spektrum des digitalen Kulturerbes hinweisen wie Verwaltungsschriftgut, digitales Museumsgut oder digitale Objekte aus Film oder Musik. Instrumentarien zu entwickeln, die in verantwortlicher Weise eine Auswahl unter der gro├čen Bandbreite digitaler Sammlungen treffen und diese Entscheidungskriterien transparent dokumentieren, geh├Ârt sicherlich zu einer der gr├Â├čten Herausforderungen im digitalen Informationszeitalter. Alle Beteiligten sind sich nur zu sehr dar├╝ber bewusst, dass "keiner alles langfristig archivieren kann". Neben der dauerhaften Archivierung des digitalen Kulturguts spielt der langfristige Zugriff auf die digitalen Sammlungen eine bedeutende Rolle und wird in dem Memorandum auch ausdr├╝cklich betont. Dieser Zugriff kann nat├╝rlich auch dadurch gew├Ąhrleistet werden, dass Informationen auf nicht-digitalen Medien wie Papier oder Mikrofilm durch geeignete Digitalisierungsma├čnahmen einer breiteren ├ľffentlichkeit dauerhaft zug├Ąnglich gemacht werden. Alles in allem wird in dem nestor Memorandum betont, dass es w├╝nschenswert w├Ąre, eine Transparenz von Informationen im Sinne einer "Wissenskartierung" zu f├Ârdern.
Unter der Rubrik "Technische Vorkehrungen" wird als notwendige technische Innovation die Entwicklung digitaler Langzeit-Archive gefordert, die den vollst├Ąndigen Erhalt von Inhalt und Funktionalit├Ąt digitaler Informationen sicherstellen. Ausdr├╝cklich wird die Nutzung nichtpropriet├Ąrer, offener und gut dokumentierter Formate und Standards gew├╝nscht.
Das letzte Kapitel "Vernetzung und Professionalisierung" stellt die Bed├╝rfnisse und Interessen der (zuk├╝nftigen) Nutzer in den Vordergrund und betont, dass diese in die Gedanken, Strategien und Entwicklungen einbezogen werden sollen. Auch eine Vernetzung in Richtung europ├Ąischer und internationaler Diskussionen wird explizit als sinnvoll erachtet, um den Anschlu├č an und die Kompatibilit├Ąt mit anderen Ged├Ąchtnisorganisationen zu sichern. Ein letzter, als ebenfalls sehr wichtig erachteter Aspekt gilt der Aus- und Fortbildung im gesamten Bereich der digitalen Langzeitarchivierung, um professionell geschultes Personal mit diesen verantwortungsvollen Aufgaben betrauen zu k├Ânnen.

Das nestor "Memorandum zur Langzeitverf├╝gbarkeit digitaler Informationen in Deutschland" wird zurzeit an relevante institutionelle wie politische Entscheidungstr├Ąger versandt und einer breiteren ├ľffentlichkeit bekannt gemacht.

Kriterienkatalog vertrauensw├╝rdige digitale Langzeitarchive ver├Âffentlicht
Der Kriterienkatalog Vertrauensw├╝rdige digitale Langzeitarchive ist nun als Entwurf zur ├Âffentlichen Kommentierung verf├╝gbar.
Die nestor-AG "Vertrauensw├╝rdige Archive - Zertifizierung" hat Kriterien identifiziert, die die Bewertung der Vertrauensw├╝rdigkeit eines digitalen Langzeitarchivs sowohl in organisatorischer als auch in technischer Hinsicht erm├Âglichen. Die Definition der Kriterien geschieht in engem Kontakt mit unterschiedlichsten Ged├Ąchtnisorganisationen und Produzenten von Information sowie weiteren Betroffenen und Experten. Der nun vorliegende Kriterienkatalog zur ├Âffentlichen Kommentierung bildet einen wichtigen Meilenstein bei der Erreichung der Ziele der AG.
Einerseits soll ein fundiertes, abgestimmtes und praxisgerechtes Hilfsmittel zur Erlangung und Darstellung von Vertrauensw├╝rdigkeit bereitgestellt werden. Andererseits soll auch die Option er├Âffnet werden, die Vertrauensw├╝rdigkeit durch eine Zertifizierung im Rahmen eines national bzw. international standardisierten Verfahrens nachzuweisen. Der nun fertig gestellte Entwurf unterst├╝tzt auch die aktive Teilnahme an bereits laufenden internationalen Standardisierungsarbeiten.
Der Katalog richtet sich in erster Linie an Ged├Ąchtnisorganisationen (Archive, Bibliotheken, Museen) und dient als Leitfaden, um ein vertrauensw├╝rdiges digitales Langzeitarchiv zu konzipieren, zu planen und umzusetzen. Ferner kann er auf allen Stufen der Entwicklung zur Selbstkontrolle und Darstellung eingesetzt werden. Dar├╝ber hinaus soll dieser Katalog allen Institutionen, die selbst archivieren, sowie Dienstleistern aus dem kommerziellen und nichtkommerziellen Bereich und Drittanbietern von Produkten als Orientierungshilfe dienen.
Um einen breit akzeptierten Kriterienkatalog zu entwickeln, ben├Âtigt die nestor-AG Beitr├Ąge und Kommentare der betroffenen und interessierten Institutionen. Daher hat die AG von Anfang an ein offenes Verfahren gew├Ąhlt, um gemeinsam an dieser Problematik zu arbeiten und fr├╝hzeitig alle Interessensgruppen einzubeziehen. Zus├Ątzlich zu einer Umfrage, einem ├Âffentlichen Workshop und einem Expertengespr├Ąch soll nun allen Interessierten eine weitere M├Âglichkeit zur Beteiligung gegeben werden:

Die AG ruft hiermit auf, den vorliegenden Entwurf des Kriterienkataloges bis zum 31. Oktober 2006 zu kommentieren.
Bitte senden Sie Ihre Kommentare, Anregungen, Fragen per e-Mail an Frau Dobratz (dobratz@cms.hu-berlin.de) und Frau Dr. Schoger (schoger@bsb-muenchen.de).


JCDL 2006 Workshop: Digital Curation and Trusted Repositories
Im Rahmen der diesj├Ąhrigen Joint Conference on Digital Libraries (11.-15. Juni 2006 - Chapel Hill, NC, USA) hat ein Workshop zu vertrauensw├╝rdigen Archiven stattgefunden. Der Workshop war mit 57 Teilnehmern sehr gut besucht.
Die sehr umfangreiche Tagesordnung bot eine Reihe von interessanten Beitr├Ągen zu den Themen Institutional Repository und Trusted Digital Repositories.
Im Themenblock Vertrauensw├╝rdige Archive hat die RLG/NARA - Certification task force (Robin Dale & Bruce Ambacher) von ihren Erfahrungen mit den ersten drei Testevaluationen und ├╝ber den Stand der ├ťberarbeitung der RLG Audit Checklist for the Certification of Trusted Digital Repositories berichtet. Eine in wesentlichen Punkten ├╝berarbeitete Version der Audit Checklist ist f├╝r den Sp├Ątsommer zu erwarten.
Die nestor-AG "Vertrauensw├╝rdige Archive ÔÇô Zertifizierung" (vertreten durch Stefan Strathmann, SUB) hat den Kriterienkatalog vertrauensw├╝rdige digitale Langzeitarchive der internationalen ├ľffentlichkeit vorgestellt und zur Beteiligung an der Kommentierung aufgerufen.
Reagan W. Moore und MacKenzie Smith berichteten von Erfahrungen bei der Implementierung von Teilen der RLG-Audit Checklist als Regeln in eine DSpace Umgebung.
Andrew McHugh (DCC) hat zum Ende der Veranstaltung die Kommentierung der beiden Ans├Ątze zur Evaluation von vertrauensw├╝rdigen Archiven mit der Vorstellung eines Papiers zu Fragen der Evidence aufgegriffen bzw. er├Âffnet.


Informationen zu verwandten Projekten
Gastbeitr├Ąge geben die Meinung der jeweiligen Autorin bzw. des jeweiligen Autors wieder. Die Verantwortung f├╝r den Inhalt des Beitrags tr├Ągt die Autorin / der Autor.

kopal
F├╝r die Aufnahme des Produktionsbetriebs hat das Projekt kopal in den letzten Wochen einige Grundlagen geschaffen. Hierzu z├Ąhlen folgende Aktivit├Ąten:
  • Technische Infrastruktur: Bereitstellung, Installation und Test der Server f├╝r den Produktionsbetrieb durch die Gesellschaft f├╝r wissenschaftliche Datenverarbeitung mbH G├Âttingen (GWDG) und IBM
  • Ingest: Beginn des Einspielens von Daten f├╝r den dauerhaften Verbleib im Langzeitarchiv, Auswertung der Einspielergebnisse und Verbesserungen an Workflow und Software
  • Erste Vorbereitungen zum k├╝nftigen kopal-Service f├╝r weitere Nutzer des Archivsystems
Bei der GWDG sind nun die Server mit einer Installation der Archivsoftware DIAS der IBM f├╝r den Produktionsbetrieb bereitgestellt. Nach einer kurzen Testphase sowohl von Seiten des Betreibers GWDG wie von Seiten der Nutzer Deutsche Nationalbibliothek (DNB) und Nieders├Ąchsische Staats- und Universit├Ątsbibliothek (SUB) G├Âttingen, ist nun damit begonnen worden, digitale Best├Ąnde, die zum Verbleib im Archiv bestimmt sind, in das System einzuspielen. Einzuspielende Daten umfassen elektronische Dissertationen, Netzpublikationen und Digitalisate sowie auf CD-ROM vorliegende Quellen und zuk├╝nftig auch Filme, Multimedia-Anwendungen etc.
Die Projektpartner DNB und SUB entwickeln gemeinsam eine unter einer Open-Source-Lizenz stehende Software, die "kopal Library for Retrieval and Ingest" (koLibRI). Mit ihrer Hilfe werden die jeweiligen Workflows der Institutionen modelliert. Die einzelnen Module der Softwarebibliothek koLibRI finden, bezogen auf das Einspielen von Daten, insbesondere folgende Anwendungen:
  • Optionales Einsammeln von deskriptiven Metadaten aus den Informationssystemen, z. B. dem Bibliothekskatalog
  • Extraktion von technischen Metadaten aus den einzuspielenden digitalen Objekten wie etwa Format und Gr├Â├čenangaben etc.
  • Erstellung und ├ťberpr├╝fung von Archivpaketen
  • ├ťbergabe der Archivpakete an den sog. "Loader" des Archivsystems
Die ersten eingespielten Best├Ąnde werden auf m├Âgliche Fehlerquellen ├╝berpr├╝ft, um den Bedarf an etwaigen Zusatzmodulen f├╝r die Qualit├Ątskontrolle zu ermitteln.
In Entwicklung ist au├čerdem ein Serviceangebot f├╝r weitere Interessenten am kopal-Archivsystem. Ziel des Angebotes wird es zun├Ąchst sein, den Interessenten die M├Âglichkeit zu bieten, die Langzeitarchivierung des kopal-Projekts f├╝r die eigenen Belange intensiv zu testen und zu evaluieren. Ein entsprechendes Servicemodell mit unterliegendem Betriebskonzept befindet sich derzeit in Entwicklung.
Autor: Birgit Schmidt bschmidt@sub.uni-goettingen.de

Content Addressed Storage an der HAAB Weimar
Seit dem 23. Mai 2006 sind rund 160 B├Ąnde der Weimarer Herzogin Anna Amalia Bibliothek im Internet einsehbar. Weitere 20.000 der wertvollsten B├╝cher sollen in den kommenden Jahren digitalisiert werden. W├Ąhrend das Projekt selbst in den Medien hinreichend (hier und hier) vorgestellt wurde, sind die folgenden Details eher f├╝r die Fachwelt interessant.
Die Scans stammen aus verschiedenen Digitalisierungsprojekten, ├╝berwiegend aus dem Projekt "Sicherungsverfilmung" (hier und hier). Allerdings sind nicht die Original-Scandaten (bis zu 145 MB gro├če TIFF-Dateien), sondern nur datenreduzierte Derivate (1600 x 2400 Pixel) im JPEG-Format online verf├╝gbar. Obwohl JPEG wegen seiner Blockartefakte f├╝r Text und Strichdaten suboptimal ist, entschied man sich f├╝r dieses eigentlich f├╝r Halbtonbilder (Fotos) konzipierte Format. "Gerade in vielen Bibliotheken und Archiven sind noch Rechner im Einsatz, die modernere Kompressionsformate (JPEG2000, PNG) nicht ohne weiteres unterst├╝tzen", begr├╝ndet Olaf Mokansky, Referatsleiter Fotothek/Digitalisierungszentrum der Klassik-Stiftung, diese Vorgabe. Aus demselben Grund werden auch keine serverseitigen Zoom-Oberfl├Ąchen genutzt, obwohl sie bandbreitenschonender, eleganter und schneller w├Ąren, als die hier gew├Ąhlte clientseitige L├Âsung, bei der mit etwas Geschick auch das komplette Werk herunterladbar ist. Bei einer serverseitigen L├Âsung sind dagegen immer nur die gerade sichtbaren Bildschirmdaten am Client verf├╝gbar. Skalierung und Komprimierung der Rohscans erfolgen an der HAAB im Batchbetrieb, wodurch allerdings unterschiedlich gro├če Vorlagen in unterschiedlicher Bildqualit├Ąt angezeigt werden.

Content Addressed Storage f├╝r Kulturg├╝ter
F├╝r die Speicherung der Originaldaten hat der US-Hersteller EMC zwei Centera-Speichermodule mit einer Kapazit├Ąt von zus. 28 TeraByte kostenlos zur Verf├╝gung gestellt, die mit ihrer verzeichnislosen Adressierungstechnik CAS (Content Addressed Storage) f├╝r die hochsichere Langzeitspeicherung von Fixed Content in einem virtuellen Filesystem entwickelt wurden.
Unter Fixed Content versteht man Inhalte, die ├╝ber lange Zeitr├Ąume ihre G├╝ltigkeit beibehalten und, einmal erzeugt, nicht mehr ver├Ąndert werden d├╝rfen. Alte Zeitungen geh├Âren ebenso dazu, wie Videos, Filme, Tonaufnahmen und nat├╝rlich B├╝cher. Diese Inhalte repr├Ąsentieren einen gro├čen Teil des kulturellen Erbes einer Gesellschaft. Fixed Content macht mittlerweile etwa 50 Prozent des weltweit neu anfallenden Datenvolumens aus. Dazu z├Ąhlen neben den erw├Ąhnten Kulturg├╝tern auch E-Mails, Vertr├Ąge, R├Ântgenbilder, Patientenakten, Satellitenfotos und zahllose andere elektronisch erzeugte Dokumente. Der Speicherbedarf f├╝r Fixed Content ist gigantisch: So lagern etwa in den Archiven der NASA Satellitenbilder der Erde in der Gr├Â├čenordnung von etwa 10 PetaByte (10.000 TeraByte).

"Hash mich, ich bin der Content"
Das Content Addressed Storage (CAS) wurde 2002 vom Speicherhersteller EMC speziell f├╝r Content-Objekte entwickelt, die nicht mehr ver├Ąndert werden d├╝rfen. Adressiert werden diese Objekte ├╝ber einen automatisch generierten contentspezifischen Objektnamen, einem digitalen Fingerabdruck ("Hash") mit 128 bit. Mit diesem eindeutigen, 27 Zeichen langen Identifier l├Ąsst sich eine versehentliche Mehrfachspeicherung derselben Daten unter verschiedenem Namen vermeiden, anders als bei den herk├Âmmlichen hierarchischen (verzeichnisbasierten) Speicherarchitekturen. Auffindbar sind die Objekte in einem CAS-System ├╝ber das sogen. C-Clip Descriptor File CDF, das neben der Objektadresse auch einen Zeitstempel und die anwendungsspezifischen Metadaten enth├Ąlt. Die Anwendung adressiert plattformunabh├Ąngig also immer dieses CDF, nicht das eigentliche Content-Objekt. Verschiedene Clients k├Ânnen dabei auch ├╝ber unterschiedliche CDFs auf dasselbe Content-Objekt zugreifen. Umgekehrt kann ein einzelnes CDF auch mehre Assets oder ganze Sammlungen adressieren.
CAS-Systeme reduzieren das Filevolumen durchschnittlich im Verh├Ąltnis 10:1 und verteilen die Daten redundant in einem beliebig gro├čen, auch standort├╝bergreifenden Netz. Von jeder archivierten Datei wird automatisch und sofort auf einer zweiten Speichereinheit eine Kopie erstellt und die logische Datenintegrit├Ąt permanent ├╝berwacht. Wird ein fehlerhaftes Datenobjekt erkannt, erzeugt das System selbstst├Ąndig eine neue Kopie. Dies garantiert zus├Ątzlich die Authentizit├Ąt der Daten und spart Kapazit├Ąten. Das System kann so konfiguriert werden, dass Kopien des Fixed Contents an einem zweiten, r├Ąumlich getrennten Standort vorgehalten werden: ein entscheidender Faktor in einer Katastrophenvorsorge. Zudem sch├╝tzt die CAS-Technologie das System vor unerlaubten Zugriffen.

"Non-disruptive upgrade" bei laufendem Betrieb
Der physikalische Speicherort spielt f├╝r die Adressierung keine Rolle: ein Netz mit beliebig vielen Knoten tritt an die Stelle des Speicherorts. In Anlehnung an die RAID-Technologie spricht man daher von RAIN: Redundant Array of Independent Nodes. Ein Knoten ist im Prinzip ein eigener Rechner mit mehreren gro├čen Festplatten und Netzwerkverbindungen; bis zu 32 Knoten stecken in einem 19-Zoll-Schrank f├╝r 10 TB gespiegelte Daten. Sechzehn Schr├Ąnke bilden (bei der EMC-L├Âsung) ein Cluster zu 160 TeraByte, max. sieben Cluster ergeben eine Domain mit einem PetaByte. Da jederzeit, sogar im laufenden Betrieb, neue Knoten hinzugef├╝gt werden k├Ânnen, sind CAS-Systeme beliebig bis in den Petabyte-Bereich skalierbar und finden ein Objekt auch in extrem gro├čen Best├Ąnden in Bruchteilen von Sekunden, selbst wenn sich der physikalische Speicherort zwischenzeitlich ge├Ąndert hat. Solche Zugriffszeiten sind f├╝r Offline- und Nearline-Speicher nat├╝rlich unerreichbar.
Wenn sich irgendeine Katastrophe ereignet oder gar ein kompletter Netzknoten ausf├Ąllt, repariert sich das CAS-Netzwerk selbstt├Ątig: der Techniker kann in aller Ruhe, etwa im viertelj├Ąhrlichen Wartungsintervall, das defekte Teil ersetzen, das dann sofort und automatisch wieder in den CAS-Organismus integriert wird. W├Ąhrend man bei herk├Âmmlichen Offline-Archivmedien nie ganz sicher sein kann, ob sie nicht schon l├Ąngst unlesbar geworden sind, "leben" die Daten in einem CAS-System: der physikalische Ausfall einer Speichereinheit wird sofort bemerkt und verlustfrei abgefangen (Selbstheilung). CAS reduziert die Kosten und den Managementaufwand f├╝r die Dateiorganisation dramatisch gegen├╝ber herk├Âmmlichen L├Âsungen. Die Kosten der CAS-L├Âsung Centera sind klar kalkulierbar und beginnen bei 185.000 US-Dollar f├╝r 5 TeraByte redundant gesicherter Nutzkapazit├Ąt (10 TB brutto). In Schritten von 2,5 TB ist ein Ausbau bis in den PetaByte-Bereich m├Âglich. Ein einziger Administrator kann 160 TB managen.

Fazit:
Ein nationaler Kulturgutspeicher auf der Basis eines Content Addressed Storage Systems k├Ânnte eine praktikable Erg├Ąnzung, wenn nicht gar eine Alternative zur Mikrofilmeinlagerung im Zentralen Bergungsstollen des Bundes sein, bei der sich Zugriffszeit, Verwertbarkeit und Datenqualit├Ąt doch in ganz anderen Dimensionen bewegen.
Autor: Roland Dreyer dreyer@contentmanagement.de

Die ARCHE ist im Wasser
Rund 100 Experten trafen sich am 27. Juni 2006 zur Ergebnispr├Ąsentation des gemeinsamen InnoNet-Projekts Arche des Landesarchivs BaW├╝, der Universit├Ątsbibliothek Stuttgart und des Freiburger Fraunhofer-Instituts f├╝r Physikalische Messtechnik IPM in Zusammenarbeit mit dem Bundesamt f├╝r Bev├Âlkerungsschutz und Katastrophenhilfe und f├╝nf weiteren Partnern aus der Wirtschaft. Mit dem farbt├╝chtigen digitalen Laserbelichter f├╝r unperforierten 35 mm Mikrorollfilm steht der Archivwelt eines neuartiges Konversionsinstrument zur Bestandserhaltung und Langzeitarchivierung analoger und digitaler Daten zur Verf├╝gung; ├╝ber das technologische Prinzip berichteten wir bereits im letzten nestor-Newsletter. Eine Variante des Arche-Lasers, die den Mikrofilm als optisches Datenband f├╝r Bin├Ąrdaten nutzt, ist in der Entwicklung.
Das 32 x 45 mm gro├če Bildfenster des Arche-Lasers kann in 40 Sekunden mit 10.666 x 15.000 RGB-Pixel beschrieben werden. Ein Filmmagazin fasst Rollen bis 600 m L├Ąnge und kann unbeaufsichtigt belichtet werden. Die farbgemanagten Bilddaten sollen trotz prinzipieller Schw├Ąchen des Ilfochrome-Materials so hochwertig ausbelichtet werden, dass ein R├╝ckdigitalisat vom Mikrofilm weitestgehend mit den digitalen Quelldaten identisch sei, erkl├Ąrte Physiker Wolfgang Riedel vom IPM. Als noch nicht ausreichend diskutiert empfindet der Berichterstatter indessen Riedels Aussage, dass die Notwendigkeit eines digitalen Langzeitarchivs damit entfalle. Angesichts der Kosten und der Manpower f├╝r die Gewinnung der digitalen Daten w├Ąre es zumindest bei Objekten von allgemeinem Interesse fatal, sie nach Ausbelichtung einfach zu verwerfen, anstatt sie auch digital vorzuhalten. Zumal sich die Qualit├Ąt und Praktikabilit├Ąt der R├╝ckdigitalisierung erst noch beweisen muss, denn abgesehen von dem noch gar nicht verf├╝gbaren Rollfilm-Scanner und der Farbdatenqualit├Ąt k├Ânnen auch Staub und Kratzer auf dem Mikrofilm die G├╝te des Redigitalisats erheblich beeintr├Ąchtigen.

Workflow f├╝r die Metadaten
Den Workflow f├╝r die Aufbringung und R├╝ckgewinnung der Bild- und Metadaten beschrieb Klaus Wendel von der UB Stuttgart. Bisher wurden 6000 Bilder verschiedenester Art mit einem Datenvolumen von 1,2 TeraByte erfolgreich ausbelichtet. Die Ergebnisse k├Ânnen sich im Wortsinne allesamt sehen lassen, aber eine quantitative G├╝tebewertung steht noch aus. Die spannendste Frage richtet sich wohl an die Wirtschaftlichkeit des Systems. David Gubler, Gesch├Ąftsf├╝hrer der f├╝r die Vermarktung zust├Ąndigen Microarchive Systems GmbH Frankfurt, stellte eine Nutzung auf Dienstleistungsbasis im direkten sowie im indirekten Vertrieb durch Bilddienstleister vor. Besonders aufmerksam nahm das Auditorium die ersten Preisvorgaben f├╝r die ab sofort erh├Ąltliche Auftragsbelichtung zur Kenntnis: f├╝r ein Frame seien in s/w, 2,- und in Farbe 3,60 EUR zu veranschlagen. Bei ausgepr├Ągtem Nesting, also dem B├╝ndeln von max. 64 Einzelbildern pro Frame, seinen so markt├╝bliche Kosten von 3 Cent (s/w) bzw. 6 Cent (RGB) pro Bild erzielbar.

Fazit:
Der Arche-Laser ist fraglos ein sehr bedeutender Meilenstein f├╝r die Langzeitsicherung analoger und digitaler Daten. Seine Belichtungsqualit├Ąt steht zumindest so lange au├čer Frage, so lange die Digitalisierung der Originale noch als qualitativer Flaschenhals gesehen werden muss. Schuld daran hat vor allem die m├Ą├čige spektrale Qualit├Ąt der Lichtquellen, um die sich bis heute anscheinend keiner der ma├čgeblichen Scannerhersteller so richtig k├╝mmern will. Mit Standard-Leuchtstoffr├Âhren oder gar Excimer-Lampen entstehen irreparable Farbverf├Ąlschungen beim Scan, die kein Colormanagement der Welt wieder ausb├╝geln kann. Bleibt nur noch zu w├╝nschen, dass die Website www.microarchive.com alsbald in die G├Ąnge kommt und der Fachwelt umfassende Informationen zu diesem System zur Verf├╝gung stellt.
Roland Dreyer dreyer@contentmanagement.de


├ľffentlichkeitsarbeit / Pr├Ąsentationen

Veranstaltungen, auf denen nestor vorgestellt wurde:



nestor Email-Listen

M├Âchten Sie an der Diskussion um digitale Langzeitarchivierung teilnehmen? Dann subskribieren Sie sich bitte f├╝r die folgende Email-Liste:
nestor@langzeitarchivierung.de,
indem Sie eine Mail mit dem Betreff subscribe langzeitarchivierung-nestor an die Adresse lists@langzeitarchivierung.de schicken.
Hier werden wir Ergebnisse zum Beispiel der nestor Workshops mit Ihnen gemeinsam diskutieren.

Haben Sie Fragen an das Projektteam? Dann senden Sie bitte eine Email an die folgende Adresse: info@langzeitarchivierung.de


Newsletter

Der Newsletter wird von den nestor Partnern kooperativ erstellt. Bei inhaltlichen Fragen, Anregungen, Kommentaren zu dem Newsletter schreiben Sie bitte eine Email an:
neuroth@sub.uni-goettingen.de
Bei technischen Problemen schreiben Sie bitte an:
bwendland@cms.hu-berlin.de

Bestellen/Abbestellen des nestor Newsletters
Zum Bestellen des Newsletters schicken Sie bitte eine Mail an die Adresse
lists@langzeitarchivierung.de mit dem Betreff subscribe langzeitarchivierung-newsletter.
Zum Abmelden schicken Sie bitte eine Mail an die Adresse
lists@langzeitarchivierung.de mit dem Betreff unsubscribe langzeitarchivierung-newsletter.

Archiv
Die nestor Newsletter werden auch auf folgender Seite archiviert: http://indi.langzeitarchivierung.de/newsletter/

1. Newsletter vom 18.12.2003
2. Newsletter vom 18.03.2004
3. Newsletter vom 24.08.2004
4. Newsletter vom 18.12.2004
5. Newsletter vom 20.04.2005
6. Newsletter vom 12.08.2005
7. Newsletter vom 15.12.2005
8. Newsletter vom 21.03.2006

 

Export
[Seite drucken]  
   
 
  RSS   RSS