Příručka Audiovisual Core
On this page
- 1. Úvod
- 2 Shrnutí
- 3 termíny Audiovisual Core
- 4 Motivace a odůvodnění
- 5 Stávající normy
- 6 Časté obavy týkající se jiných standardů pro informace o biologické rozmanitosti
- 7 Concerns Not Emphasized in Other Biodiversity Information Standards
- 8 Multimedia Resource Descriptions
- 9 záznamy Audiovisual Core
- 10 Implementation and Compliance
- 11 Further Information
- 12 Příloha I: Slovníček pojmů
- 13 Appendix II: Audiovisual Core Development History
- 14 Endnotes
Příručka Audiovisual Core
- Název
- Příručka Audiovisual Core
- Datum vydání verze
- 2023-02-24
- Datum vytvoření
- 2013-10-15
- Součást TDWG Standardu
- http://www.tdwg.org/standards/638
- Tato verze
- http://rs.tdwg.org/ac/doc/guide/2023-02-24
- Poslední verze
- http://rs.tdwg.org/ac/doc/guide/
- Předchozí verze
- http://rs.tdwg.org/ac/doc/guide/2013-10-15
- Abstrakt
- Audiovisual Core je soubor slovníků určených k reprezentaci metadat pro multimediální zdroje a sbírky týkající se biologické rozmanitosti. Tento nenormativní dokument poskytuje některé základní informace o cílech a použití normy.
- Přispěvatelé
- Robert A. Morris (University of Massachusetts at Boston, USA), Vijay Barve (), Mihail Carausu (Danish Biodiversity Information Facility (DanBIF), Copenhagen, Denmark), Vishwas Chavan (Global Biodiversity Information Facility, Copenhagen, Denmark), José Cuadra (), Chris Freeland (Missouri Botanical Garden, St. Louis, USA), Gregor Hagedorn (JKI, Federal Research Institute for Cultivated Plants, Berlin, Germany), Patrick Leary (), Dimitry Mozzherin (Encyclopedia of Life, Woods Hole, USA), Annette Olson (American Association for the Advancement of Science), Greg Riccardi (Florida State University, Tallahassee, USA), Ivan Teage ()
- Tvůrce
- GBIF/TDWG Pracovní skupina pro multimediální zdroje a Skupina pro údržbu audiovizuálního jádra
- Bibliografická citace
- GBIF/TDWG Multimedia Resources Task Group and Audiovisual Core Maintenance Group. 2023. Příručka Audiovisual Core. Biodiversity Information Standards (TDWG). http://rs.tdwg.org/ac/doc/guide/2023-02-24
1. Úvod
Audiovisual Core Multimedia Resources Metadata Schema (Audiovisual Core) je datový standard pro výměnu dat popisujících multimediální zdroje a sbírky týkající se biologické rozmanitosti, který vytvořila společná pracovní skupina GBIF/TDWG pro metadata multimediálních zdrojů (MRTG). Norma se skládá ze čtyř dokumentů. Tento dokument je průvodcem po cílech a použití normy. Dokument Úvod do Audiovisual Core poskytuje stručný úvod do Audiovisual Core Standard. Podrobné informace o struktuře Audiovisual Core naleznete v dokumentu Audiovisual Core Structure. Podrobnosti o termínech najdete v dokumentu Seznam termínů Audiovisual Core.
Zkratky a názvy institucí a projektů jsou uvedeny ve slovníku v příloze I.
1.1 Status obsahu tohoto dokumentu
Všechny části tohoto dokumentu jsou nenormativní.
2 Shrnutí
Audiovisual Core Multimedia Resources Metadata schema („schéma AC“ nebo jednoduše „AC“) je soubor slovníků metadat pro popis multimediálních zdrojů a sbírek souvisejících s biologickou rozmanitostí. Specifikace je nezávislá na tom, jak mohou být tyto slovníky zobrazeny pro strojové využití.
Multimediální zdroje jsou digitální nebo fyzické artefakty, které obvykle obsahují více než jen text. Mezi ně patří obrázky, umělecká díla, kresby, fotografie, zvukové záznamy, videa, animace, prezentační materiály a interaktivní online média, včetně např. identifikačních nástrojů. Multimediální sbírka je souborem takovýchto objektů, ať už kurátorských či nikoli, a ať už elektronicky přístupných či nikoli. Pro účely tohoto dokumentu považujeme soubor multimediálních zdrojů sám o sobě za ‘multimediální zdroj’. Kdykoli se diskuse nebo specifikace může vztahovat pouze na sbírku nebo pouze na jeden mediální zdroj, výslovně to uvádíme.
Multimediální popisy jsou digitální záznamy, které dokumentují základní multimediální zdroje nebo sbírky. AC se zaměřuje na multimediální zdroje související s biologickou rozmanitostí. Sdílí terminologii a zájmy s mnoha známými a důležitými standardy pro popis přístupu k zdrojům, jako jsou Dublin Core (DC), Darwin Core (DwC), Adobe Extensible Metadata Platform (XMP), International Press and Telecommunications Council (IPTC), Metadata Working Group (MWG) schema, Natural Collections Schema (NCD) a další. V případě přesné shody s použitím těchto standardů přijímá AC jejich identifikátory a definice. Mnohé sbírky multimédií o biologické rozmanitosti již obsahují popisy svých médií vyjádřené v DwC nebo DC. Použitím těchto slovníků tam, kde je to vhodné, chce AC zejména usnadnit opětovné použití stávajících popisů v těchto sbírkách, v případě potřeby doplněných o další termíny.
This guide accompanies the normative parts of the AC standard, which are included in two documents: one that describes the structure of the document [1] and a Term List document [2]. Seznam termínů dokumentuje řadu termínů, z nichž každý je identifikován jedinečným identifikátorem URI (Uniform Resource Identifier), spolu s normativními definicemi. In addition, the Audiovisual Core Maintenance Group may develop recommended representations for AC descriptions in several important forms including RDF [3], XML Schema [4], and Comma Separated Values (CSV) [5].
Figure 1 below augments a portion of Figure 2 of the non-normative portion of the NCD document [6]. Ukazuje řadu druhů zdrojů zaměřených na data o biologické rozmanitosti a ilustruje typické uživatelské komunity, standardy dat a metadat a síťové služby, které podporují vyhledávání, analýzu a integraci dat. Z údajů NCD jsme extrahovali zdroje a vztahy mezi nimi, které jsme doplnili o tři typy, které nespadají do hlavní působnosti NCD. Jedná se o: Pozorování, ekologické modely a zaměření této práce, multimediální zdroje. Applications exploiting each kind of these resources find utility, or sometimes require the use of multimedia resources to document them. Například Biological Heritage Library je projekt, který poskytuje naskenované obrázky starší literatury v mnohem větším rozsahu, než kolik může poskytnout digitalizovaných verzí založených na optickém rozpoznávání znaků, a tyto obrázky zůstávají k dispozici jako zdroje pro jakékoli následné odvozené produkty. Digitálně zpracovaná historická literatura je tedy dokumentována pomocí obrázků stránek. Většina vědecké literatury je samozřejmě také ilustrována fotografiemi, grafy nebo jinými artefakty, které spadají do působnosti Audiovisual Core. Dokonce i poskytovatelé zdrojů „molekulární DNA“ někdy nabízejí původní data ve formě digitálních obrazů na mikročipech.

Obrázek 1. Vztahy multimediálních zdrojů k primárním typům zdrojů biologické rozmanitosti
3 termíny Audiovisual Core
An Audiovisual Core record is a description, using the Audiovisual Core terms, of a multimedia resource. AC specifikuje dva druhy termínů: termíny na úrovni záznamu a termíny na úrovni přístupu. Termíny na úrovni záznamu se vztahují k popisovanému mediálnímu zdroji. Almost all terms are record-level terms. One such term, serviceAccessPoint plays a special role in helping to retrieve the resource that the record describes. A multimedia resource may have more than one serviceAccessPoint, each of which is described by values of one or more access-level terms. The access-level terms provide such things as a web address at which a digital representation of the resource can be retrieved, the size of such a retrieved object, etc.
An Audiovisual Core record is thus a set of terms that conforms to the normative documents, contains at least the four mandatory terms described below, and which provides metadata that describes a single multimedia resource (possibly including a Collection). Obvykle obsahuje identifikátor, který mohl být zdroji přidělen externí autoritou nebo poskytovatelem záznamu metadat.
Každý termín Audiovisual Core má prostý textový název, URI a prostý textový normativní definici. Termíny mohou také obsahovat pokyny k použití, které vysvětlují, jak se termín používá v kontextu Audiovisual Core, a poznámky, které poskytují další informace a příklady. URI pro termíny odpovídají schématu http URI. Neformálně lze toto pochopit takto: http URI má syntaxi http URL, ale neočekává se, že jeho zadání do webového prohlížeče povede k vrácení jakýchkoli informací do prohlížeče, a pokud ano, vrácené informace nemusí mít žádný význam.
Protože adresy URL jsou poměrně dlouhé, dokumenty AC se řídí standardní praxí zavádění krátké předpony sestávající z „kvalifikátoru jmenného prostoru“ odděleného dvojtečkou od mnemotechnického názvu úzce souvisejícího s názvem termínu. Jmenný prostor termínů převzatých z jiných slovníků je stejný jako jmenný prostor původních termínů. The namespace of denovo AC terms is http://rs.tdwg.org/ac/terms/. V tabulce termínů má každý termínový záznam řádek s názvem termínu. Following the practice of the Darwin Core term list [7], for borrowed terms, this term name is generally an “unqualified name” preceded by a widely accepted prefix designating an abbreviation for the namespace, whereas for denovo AC terms, no such prefix is prepended. Implementátorům, kteří potřebují předponu jmenného prostoru pro jmenný prostor AC, se doporučuje používat “ac”, kdykoli je to možné. The result is known as a qualified name. Například normativní wiki dokumentace pro vypůjčený termín dcterms:identifier má URI http://purl.org/dc/terms/identifier. V tomto dokumentu budeme dodržovat zavedenou konvenci kvalifikovaných názvů. Ve skutečnosti se většina URI pro termíny převzaté z externích slovníků (asi polovina z nich) ve skutečnosti odkazuje na něco v příslušné dokumentaci pro daný externí standard. Někdy to není přesné, protože dokumentace je ve formátu PDF a několik (různých!) URI mohou zřejmě směřovat na stejné místo.
Příklady z termínového seznamu jsou uvedeny níže.
| Název termínu: | dcterms:type |
| Normativní URI: | http://purl.org/dc/terms/type |
| Štítek | Typ |
| Layer: 1 — Required: Yes — Repeatable: No | |
| Definice: | Povaha nebo druh zdroje. |
| Použití: | A full URI preferably from among the type URIs specified in the DCMI Type Vocabulary, http://dublincore.org/documents/dcmi-type-vocabulary/#section-7-dcmi-type-vocabulary. Doporučené termíny jsou ty URI, jejichž označení jsou Collection, StillImage, Sound, MovingImage, InteractiveResource nebo Text (např. . Doporučujeme také úplné URI adresy ac:PanAndZoomImage, ac:3DStillImage a ac: 3DMovingImage. Hodnoty NESMÍ být řetězcem, ale URI s úplným jmenným prostorem (např. z řízeného slovníku. Implementátoři a komunity praxe mohou určit, zda je nutné používat konkrétní řízené slovníky. Pokud je zdroj sbírkou, tato položka neurčuje, jaké typy objektů může obsahovat. V souladu s doporučeními DC na adrese http://purl.org/dc/dcmitype/Text by obrázky textu měly mít tuto URI. |
| Poznámky: | V souladu s doporučeními DC pro typ textu http://purl.org/dc/terms/DCMIType by obrázky textu měly být uvedeny jako http://purl.org/dc/dcmitype/Text, pokud jsou uvedeny jako URI. Viz také heslo dc:type v dokumentu Audiovisual Core term list (Seznam základních audiovizuálních termínů) a viz DCMI FAQ on DC and DCTERMS Namespaces (Často kladené otázky týkající se jmenných prostorů DC a DCTERMS), https://github.com/dcmi/repository/blob/master/mediawiki_wiki/FAQ/DC_and_DCTERMS_Namespaces.md, kde se diskutuje o důvodech pro použití termínů ve dvou jmenných prostorech. Obvyklým postupem je použít stejný štítek, pokud jsou k dispozici oba. Labels have no effect on information discovery and are only suggestions. At least one of dc:type and dcterms:type must be supplied but, when feasible, supplying both may make the metadata more widely useful. The values of each should designate the same type, but in case of ambiguity dcterms:type prevails. |
| Název termínu: | ac:reviewerLiteral |
| Normativní URI: | http://rs.tdwg.org/ac/terms/reviewerLiteral |
| Štítek | Recenzent |
| Layer: 2 — Required: No — Repeatable: Yes | |
| Definice: | String providing the name of a reviewer. If present, then resource is peer-reviewed, even if Reviewer Comments is absent or empty. Its presence tells whether an expert in the subject featured in the media has reviewed the media item or collection and approved its metadata description; must display a name or the literal "anonymous" (= anonymously reviewed). |
| Poznámky: | Poskytovatel tvrdí, že tuto recenzi přijímá jako kompetentní. Viz také ac:reviewer a část Jmenné prostory, předpony a názvy termínů v dokumentu Audiovisual Core Term List, kde se diskutuje o důvodech pro oddělení termínů, které používají hodnoty URI, od termínů, které používají textové hodnoty, pokud jsou možné obě varianty. Obvyklým postupem je použít stejný štítek, pokud jsou k dispozici oba. Štítky nemají žádný vliv na vyhledávání informací a slouží pouze jako doporučení. |
Hlavní kvalifikátory jmenného prostoru pro termínové URI v tomto dokumentu jsou
-
dcterms: and dc: The DCMI vocabulary documented at http://dublincore.org/documents/dcmi-terms
-
dwc: Slovník Darwin Core popsaný na adrese http://rs.tdwg.org/dwc/index.htm
-
Iptc4ampExt: Geografická rozšíření IPTC s jmenným prostorem http://iptc.org/std/Iptc4xmpExt/2008-02-29/ zdokumentovaná v http://www.iptc.org/std/photometadata/specification/IPTC-PhotoMetadata-201007_1.pdf
-
ac: Termíny v jmenném prostoru http://rs.tdwg.org/ac/terms které nepocházejí z jiných řízených slovníků. Normativní definice těchto dokumentů lze nalézt v dokumentu Seznam termínů Audiovisual Core
-
xmp: Slovníky Adobe XMP s jmenným prostorem http://ns.adobe.com/xap/1.0/, dokumentované v oddíle 8.4 dokumentu https://wwwimages2.adobe.com/content/dam/acom/en/devnet/xmp/pdfs/XMP%20SDK%20Release%20cc-2016-08/XMPSpecificationPart1.pdf
-
xmpRights: Slovník práv Adobe XMP s jmenným prostorem http://ns.adobe.com/xap/1.0/rights, dokumentovaný v oddíle 8.5 na adrese https://wwwimages2.adobe.com/content/dam/acom/en/devnet/xmp/pdfs/XMP%20SDK%20Release%20cc-2016-08/XMPSpecificationPart1.pdf
-
photoshop: Další vlastnosti Adobe XMP s jmenným prostorem http://ns.adobe.com/photoshop/1.0/ jsou dokumentovány na adrese http://wwwimages.adobe.com/www.adobe.com/content/dam/acom/en/devnet/xmp/pdfs/XMP%20SDK%20Release%20cc-2014-12/XMPSpecificationPart2.pdf
-
exif: slovník formátu Exchangeable Image File Format asociace Camera and Imaging Products Association s jmenným prostorem http://ns.adobe.com/exif/1.0/ zdokumentovaný v http://www.cipa.jp/std/documents/e/DC-008-2012_E.pdf
4 Motivace a odůvodnění
Existuje mnoho cenných multimediálních zdrojů, které neobsahují žádné informace uložené v databázích. Někteří mohou mít webovou prezentaci, jiní nikoli. I ty, které jsou dostupné online, nemusí být pro vyhledávače dostatečně zjistitelné, nebo se mohou ztratit v záplavě obrázků z nespolehlivých zdrojů. Stručný popisný záznam, jak je definován standardem Audiovisual Core, může sloužit jako „vizitka“ multimediálního zdroje a poskytovat dostatek informací k identifikaci a vyhledání mediálních zdrojů výzkumníky, agregátory, rozhodovacími činiteli, pedagogy nebo širokou veřejností.
Standard umožňuje agregaci popisů multimediálních zdrojů z mnoha zdrojů a usnadňuje vyhledávání zdrojů, včetně vytváření vztahů mezi multimediálními zdroji na několika místech. Záznamy AC lze také použít jako pomůcku pro procesy správy multimediálních zdrojů, což umožňuje instituci udělat krok zpět a zjistit, které sbírky nejvíce potřebují konzervaci nebo by měly vyšší prioritu pro katalogizaci na úrovni jednotlivých položek.
Mezi důležité využití identifikované pracovní skupinou, které jsou usnadněny metadaty, patří:
-
Discovery;
-
Hodnocení vhodnosti použití před načtením zdroje (zejména relevantní pro offline zdroje);
-
Použití záznamů metadat jako potenciálního důkazu výskytu taxonu nebo jiných biologických závěrů, jako jsou důkazy o interakcích druhů, stanovištích a fenotypových variacích;
-
Identifikační pomůcky;
-
Snížení zátěže poskytovatelů a producentů multimediálních zdrojů při shromažďování a poskytování zdrojů od široké škály producentů a správců, zejména těch, kteří mají malé nebo žádné znalosti v oblasti IT nebo podpory.
Aby byly překážky použití co nejmenší, jsou pouze čtyři vlastnosti záznamu Audiovisual Core považovány za povinné:
-
Identifier (dcterms:identifier): An arbitrary code that is unique for the resource, with the resource being either a provider, collection, or media item. Whereas the identifier must be globally unique for providers and collections (e. g. a URI), identifiers for media items may be unique only within the context of a collection or provider. In fact the standard strongly recommends but does not require an Identifier for media items, though it does so for a provider or collection.
-
Type (dcterms:type): Any dcmi type term from http://dublincore.org/documents/dcmi-type-vocabulary/#section-7-dcmi-type-vocabulary may be used. Recommended terms are Collection, StillImage, Sound, MovingImage, InteractiveResource, and Text.
-
Metadata Language (ac:MetadataLanguage): Language of description and other metadata (but not necessarily of the image itself)
-
Copyright Statement (dcterms:rights): Information about rights held in and over the resource. Úplné znění čitelného prohlášení o autorských právech, jak vyžadují vnitrostátní právní předpisy držitele autorských práv. U sbírek se to vztahuje na všechny obsažené objekty, pokud objekt sám nemá jiné prohlášení. Pokud je to možné, doporučuje se také uvedení vlastníka autorských práv pomocí xmpRights:Owner
Kromě toho se důrazně doporučuje uvést stručný název zdroje pomocí dcterms:title
5 Stávající normy
Audiovisual Core má v úmyslu poskytovat metadata, která popisují buď samotné mediální zdroje, nebo jejich sbírky. Existuje několik známých nebo nově vznikajících standardů, které se těmito otázkami zabývají, takže by se dalo položit otázku: proč je prostě nepoužít? In fact, AC does exactly that in about half of its 80 elements, almost all of which are optional. Indeed, as shown above, most of the mandatory terms come from external controlled vocabularies. However, all existing controlled vocabularies, most notably the widely used Dublin Core, present very few opportunities to provide media resource content metadata that is specifically biologically relevant. Use of the Dublin Core alone would make it difficult to do media resource discovery with high precision. Thus, one consequence of using Dublin Core alone would be that queries will not be selective enough. By contrast the Darwin Core TDWG standard [8] has more support for some such concerns, but little about important intellectual property rights issues, or ways to express relationships between alternate versions of media resources (e.g. different resolution versions). In turn, neither of these controlled vocabularies has mechanisms for capturing technical metadata, such as EXIF, which the imaging systems themselves, or metadata embedding tools, such as Adobe Photoshop(tm) and the GIMP open source image editor, can insert into media files and streams. To address this, and in furtherance of the above goals, the Audiovisual Core should be regarded as a synthesis of DC, DwC, and, where those are inadequate, some forward looking metadata standards that the camera manufacturers are presently planning to support within the cameras themselves, much as they now use EXIF [9]. Where any of these standards suffice, AC metadata terms and definitions are those of such standards. In some instances, we find that none of these address concerns that our experience suggests are held by a wide variety of image contributors, especially those with limited access to sophisticated IT staff or to Digital Librarians. Schéma AC lze považovat za rozšíření sjednocení malých podskupin několika přijatých standardů (spolu s rámcem, který zajišťuje, že použití metadat z těchto standardů mohou lidé i stroje chápat jako odkaz na stejný zdroj). Jinými slovy, velkou část AC lze považovat za obal kolem DwC, DC, XMP a IPTC [10].
Vzhledem k tomu, že drtivá většina polí metadat AC je volitelná, poskytovatel zdrojů, který již může poskytovat metadata Dublin Core, by v podstatě nemohl poskytovat nic jiného než to, plus vhodný globálně jedinečný identifikátor, který by propojil všechna metadata se stejným objektem. Podobně poskytovatel, který popisuje obsah obrázku výhradně pomocí termínů Darwin Core, nemusí dělat o moc víc. Oba tito poskytovatelé by však zjistili, že služby s přidanou hodnotou, jako jsou indexovače metadat a agregátory mezipaměti, by byly méně pravděpodobné, že by uchovávaly odkazy na své mediální zdroje a metadata, než kdyby měly bohatší metadata. To poskytovatelům dává jasnou strategii, jak zvýšit užitečnost svých multimediálních zdrojů s malým nebo žádným dopadem na jejich služby IT kyberinfrastruktury. Možná budou potřebovat pouze aktualizovat přiřazení mezi svými interními názvy polí a metadatovými termíny specifikovanými AC, jakmile budou mít k dispozici personál, který to provede. Jakmile bude k dispozici více zdrojů pro zaznamenávání dalších metadat a jakmile vzniknou mechanismy komunitních anotací, které to podpoří, budou moci přidávat další metadata tempem, které si samy určí podle svých zdrojů. Pokud sběratelé metadat sledují (volitelnou) vlastnost Metadata Date (xmp:MetadataDate), mohou být aktualizovaná metadata automaticky načtena těmito službami s přidanou hodnotou a více dotazů vrátí metadata poskytovatele a odkazy na jeho mediální zdroje.
6 Časté obavy týkající se jiných standardů pro informace o biologické rozmanitosti
Audiovisual Core považuje sbírky multimediálních zdrojů samotné za druh zdroje. Mnoho typů sbírek lze popsat v navrhovaném standardu TDWG Natural History Collections (NCD). Pokud poskytovatel chce pouze umožnit vyhledávání multimediální sbírky bez ohledu na vyhledávání a přístup k jejímu obsahu (kromě podsbírek), často nebude mít význam, zda jsou poskytována metadata NCD nebo AC, nebo obojí. To platí tím spíše, pokud mají NCD CollectionIdentifier a Audiovisual Core Identifier stejnou hodnotu. While Audiovisual Core Collection types are richer than NCD types, it is an open question whether Audiovisual Core’s variety in this case is useful.
There is substantial overlap with use of Darwin Core terms, notably with respect to taxonomic, geographic, and temporal coverage of the data being described by the metadata record. We use DwC terms for most of those metadata and the entirety of the Darwin Core geolocation vocabulary are included by reference. GPS point locations increasingly common in image data created by cameras is easily mapped to the ‘verbatim’ locality terms of Darwin Core.
7 Concerns Not Emphasized in Other Biodiversity Information Standards
Some of the concerns mentioned here are also those of bibliographic metadata such as the Dublin Core. These are, however, not explicitly of detailed concern in existing TDWG biodiversity standards, and some are not adequately addressed by DC. Some such concerns are below.
Size: Individual multimedia resources such as images, and especially video and sound are very large compared to specimen records, observation data, or species descriptions. The main consequence of this is that multimedia metadata must support use cases for which humans or software agents can, without fetching the resource, attempt to assess the fitness of the underlying media resource for the desired use, typically by use of a search based on a fine-grained controlled vocabulary. However, without hit-and-miss natural language searches, it is not possible, even using both DC and DwC, for a metadata provider to answer a request of the form “Supply me with sizes and URL access points for still images of Dictyophora indusiata and which have Spanish metatdata available.
Intellectual Property Rights: DwC describes physical objects, whose ownership is generally governed by property laws not considered part of the Intellectual Property Rights corpus of law. Some impending standards about scientific literature address these, but rarely are publication reproduction permission issues as varied as for multimedia, which have a history of being treated as creative works of art, not necessarily as facts.
Provenance: For any scientific data, it is clearly important to know how and when the data may have been changed from its original gathering. This is particularly important for media, which are commonly edited for one or another purpose. If carelessly done, this may destroy some if the modified object’s utility. No TDWG standards or proposed standards seem very robust about provenance, including Audiovisual Core, which provides only the Derived From property in order to provide a reference to another resource. This is somewhat akin to the NCD DerivedCollection term, which identifies a Collection record as having been produced by a query to another Collection. However, that apparently does not identify the source collection or the query. A future version of Audiovisual Core will add more provenance terms.
8 Multimedia Resource Descriptions
The term Multimedia Resources encompasses a wide variety of objects of interest to biologists and the communities with whom they interact for research, education, and public service. Some instances of multimedia are familiar. These include:
-
Still images from cameras, scanners, or medical and industrial imaging devices
-
Movies with or without sound
-
Audio recordings
In some of the above cases, these resources may exist in electronic or non-electronic form or both. The electronic form may be analog or digital, the latter being more amenable to storage and exchange with computers. The digital form may have been born digital, i.e. originally captured as a digital object, or it may have been created from a non-digital object. As with biological specimen records, publications, field notes, experimental data and other artifacts of the practice of science, there is a large quantity of such material that has not yet been digitized, yet which may be available, albeit with greater expense and inconvenience than digital resources. These analog (including paper) resources still require descriptive metadata to promote discovery and to ascertain fitness-for-use. At least as important, some of the metadata is itself of scientific and educational use even if the object is not conveniently accessible. Evidence for georeferenced taxon occurrence is one such use.
Audiovisual Core metadata also can describe resources less often thought of as multimedia objects. To zahrnuje:
-
Interaktivní softwarové aplikace, buď na webu, nebo dostupné pro samostatné použití
-
Taxonomické identifikační klíče
-
Sbírky multimediálních zdrojů
-
Webové stránky, které nespadají do žádné z výše uvedených kategorií
9 záznamy Audiovisual Core
Normativní specifikace záznamů audiovizuálních základních metadat je nezávislá na způsobu, jakým jsou tyto záznamy převáděny do elektronické podoby. MRTG má v úmyslu zveřejnit specifikace pro takové zobrazení reprezentované v XML omezeném XML schématem a reprezentované v prostém textu jako hodnoty oddělené čárkami (CSV). Sections 4.4 to 4.5 of the TDWG Standards Documentation Specification describe how basic term metadata should be expressed in machine-readable forms such as RDF serializations. Budoucí pracovní skupina by mohla vyvinout sémanticky bohatší strojově čitelnou ontologii podle postupů uvedených v sekci 4 specifikace údržby slovníku TDWG.
Jazykem normativní specifikace Audiovisual Core je angličtina, ale to nijak neomezuje aplikace v používání štítků nebo obsahu metadat v místních jazycích. Protože je jazykem normativního dokumentu angličtina, má každ metadatová položka v normativním dokumentu anglický název (který může být například součástí uživatelského rozhraní), ale ani tyto názvy nemusí být aplikacemi používány, ačkoli se jejich použití důrazně doporučuje, alespoň v dokumentaci.
Jak již bylo zmíněno, záznam metadat Audiovisual Core je soubor termínů popisujících základní multimediální zdroj, který záznam popisuje. Každý termín je identifikován jednotným identifikátorem zdroje (URI). These are URIs of the attribute, not of the underlying resource, and they simply specify which term is being provided. There are many URI schemes, some of which have been registered with the Internet Assigned Names Authority (IANA). All Audiovisual Core term URIs, conform to the http URI Scheme. This is chosen because this widely used URI scheme uses the familiar internet URL syntax as its URI syntax. But this familiarity gives rise to a common misconception, namely that pasting the URI into a browser URL line, or providing it to some other application that respects the http protocol, should result in the application returning some information about the object identified by the URI. Such behavior is usually called resolution (or, more technically, resolution and dereferencing) of the URI and is in no way guaranteed for Audiovisual Core term URIs. Where possible, we in fact try to make http URIs be resolvable, with the information returned being documentation for how the metadata attribute identified by that URI is defined or use. To reiterate: for Audiovisual Core term URIs, any such resolution will never contain information about the underlying multimedia resource being described. For this reason, few human-centric Audiovisual Core applications should ever present the URIs to users, nor use them as linking mechanisms. (One possible exception is an application for assigning metadata to multimedia resources, where such a use may provide a thesaurus entry aiding the user in the semantics of the metadata property. However, the incidental nature of the resolution, and its lack of guaranteed long term persistence, makes even this approach one that should be considered with extreme caution.) Finally, note that some external controlled vocabularies are defined in PDF or other documents that do not have URL links directly to each defined term. In these cases, any resolution available from the normative document may only link to the beginning of the document, leaving it necessary to search in the document for the referenced definition.
Associated to each Audiovisual Core property is its value. The datatype of this value is also specified in the normative document. Datatypes can include free text, specific literals taken from a controlled vocabulary specified in the normative document, or a number of other datatypes specified and described in the normative document. In the case of a controlled vocabulary, it is important to note that whatever an application may present in a user interface, any Audiovisual Core metadata interchange should use the literals from a specified controlled vocabulary when one is specified, even if the record is declared to be a record in a different language than that of the controlled term. An important example is the Type metadata field, which is recommended to come from the corresponding vocabulary from Dublin Core, augmented by some recommended in the normative document. (We also add to that an optional field Subtype.) Similarly, agents answering Audiovisual Core metadata queries MUST be able to consume and respond to queries framed with the controlled vocabulary. Nothing in the normative document prevents an Audiovisual Core data provider from asserting it has no records with a given controlled term, nor from internally mapping between a controlled vocabulary and its internal attributes, whose names may well be in a language other than English. Only a small number of Audiovisual Core properties take values in a specific, English-based controlled vocabulary. This will become relevant only for metadata interchange. Of the mandatory terms, only Type has any such requirements.
An Audiovisual Core record consists minimally of the four mandatory fields (Identifier, Type, Metadata Language, and Copyright Statement).
In some cases, some metadata terms are necessarily related to others (e.g. various versions of an image must be associated the “main” version). However, spreadsheets and other flat sources of contributor metadata are regarded as particularly important, and in many of these it is difficult to represent such structural relationships. Consequently an Audiovisual Core record is itself mainly flat, the exception being the object of a property named hasServiceAccessPoint. This object itself has further properties that describe how to fetch the actual media described by the AC record. One consequence of this is that, for some purposes, a metadata Provider might have to make several metadata records available about the same underlying resource, because the representation-neutral Audiovisual Core specification does not provide for “subproperties” on its properties, or for relations in most cases. An important case surrounds multilingual metadata. Because each metadata record is in a fixed language specified by the Metadata Language property (this is the language of the record, not the multimedia resource, in case it should have one), a Provider might have to offer several metadata records about the same multimedia resource. The values of the four required terms must be provided in every metadata record, even if repeated in other metadata records describing the same resource. At the date of this writing, the normative document does not provide a mechanism for identifying a metadata record that might be overarching, in the sense that its optional terms may be regarded as defaults for any not specified in other records about the same resource. This point is under discussion on the MRTG Wiki.
Many items may be repeated in an Audiovisual Core record, but some may not, as indicated in the normative document. For example the Modified item corresponds to a date at which the media resource was modified and may be repeated to reflect the history of the resource. By contrast, Date Available is a single date or a single range of dates at which the underlying resource became, or will become, available.
10 Implementation and Compliance
Audiovisual Core is defined in a way that is as representation-neutral as possible. It provides natural language definitions of classes, properties and instances that are identified by URIs and it makes recommendations on the use and content of properties from other vocabularies.
The URIs defined here may be used across a number of technologies, such as namespaces in XML Schema-valid table documents, RDF, and column headings in comma delimited text files.
This approach facilitates:
-
Embedding of Audiovisual Core data within other standards such as descriptions of specimens or literature.
-
The extension of Audiovisual Core records with other data types such as the extensive geographic controlled vocabularies of the Open Geospatial Consortium (OGC)
-
Cross walking between technologies such as a Comma Separated Value file, an RDF graph, an XML document and a JSON object.
The Audiovisual Core representation-neutral normative standard itself does not provide an off-the-shelf, self validating exchange format. Multiple such exchange formats meeting different requirements can be defined and this standard allows mapping between them.
11 Further Information
-
Audiovisual Core Maintenance Group Charter https://github.com/tdwg/ac/blob/master/Audiovisual-core_maintenance-group_charter.md
-
Discussion of the Audiovisual Core takes place at https://github.com/tdwg/ac/issues
-
Register for the mailing list tdwg-content@lists.tdwg.org at http://lists.tdwg.org/mailman/listinfo/tdwg-content. This email list tracks all discussion about the content of TDWG standards.
12 Příloha I: Slovníček pojmů
| DC | Dublin Core. Sada metadatových prvků, která je standardem pro vyhledávání informačních zdrojů napříč doménami. |
| DCMI | Dublin Core Metadata Initiative. Organizace zabývající se vývojem standardu metadat Dublin Core. |
| DwC | Darwin Core je standard TDWG pro reprezentaci záznamů o vzorcích. Již několik let se široce používá v řadě nestandardních, někdy nekonzistentních verzí. Nedávno přijatá standardní verze je k dispozici na adrese http://rs.tdwg.org/dwc/index.htm. |
| EOL | Encyclopedia of Life. Informace o mnoha druzích. |
| EXIF | Široce používaný formát značek pro metadata digitálních obrázků, který je často vkládán do obrazových souborů, zejména moderními digitálními fotoaparáty. Mnoho aplikací pro vykreslování obrázků dokáže číst a zobrazovat data EXIF. Historie a popis viz http://en.wikipedia.org/wiki/Exchangeable_image_file_format. |
| GBIF | Global Biodiversity Information Facility. Interoperabilní síť databází biologické rozmanitosti a nástrojů informačních technologií. |
| IANA | Internet Assigned Names Authority. Specifikuje formy a registruje instance názvů různých protokolů používaných na internetu. Viz zejména informace o schématu http URI IANA. |
| IPTC | IPTC je vyspělý standard Mezinárodní rady pro tisk a telekomunikace. Jeho práva duševního vlastnictví podporují jemnější kontrolované slovníky než DC, což zajišťuje lepší strojové zpracování pro vyhledávání a vhodnost pro použití. Aktuální verze je slovník pro XMP. |
| JSON | JavaScript Object Notation. Lehký formát pro výměnu dat. |
| Morphbank | Úložiště obrázků vzorků. |
| MWG | Pracovní skupina pro metadata je průmyslové konsorcium (Adobe, Apple, Canon, Microsoft, Nokia a Sony), které bylo založeno za účelem specifikace způsobu využití platformy Adobe Extensible Metadata Platform, XMP, pro vkládání metadat do běžných formátů obrazových souborů v několika široce používaných řízených slovnících. Ačkoli se MWG zaměřuje hlavně na spotřebitelské aplikace, více než dvě desítky open source a komerčních softwarových produktů a platforem podporují XMP a společnost Adobe uvolnila sadu nástrojů pro vývojáře pod open source licencí. |
| NBII | Bývalá americká Národní infrastruktura biologických informací. Jeho obrazová knihovna, Library of Images From the Environment (LIFE), byla k dispozici na adrese http://images.nbii.gov/ nebo http://life.nbii.gov/. Pokud se LIFE obnoví v jakékoli formě, mohlo by tam být nějaké spojení. |
| NCD | Popis přírodních sbírek je návrh datového standardu určený k popisu sbírek fyzických objektů, jako jsou například vzorky. Může pojmout sbírky mediálních objektů, ale nemůže je propojit s popisy samotných objektů. |
| OGC | Open Geospatial Consortium. Poskytuje standardy pro reprezentaci a výměnu geoprostorových dat. |
| RDF | Resource Description Framework. Lehký ontologický systém na podporu online výměny znalostí. |
| TDWG | Taxonomic Databases Working Group. Nyní známá jako Biodiversity Information Standards (TDWG), je to mezinárodní pracovní skupina, která vyvíjí standardy a protokoly pro sdílení dat o biologické rozmanitosti. |
| URI | Unique Resource Identifier. Obecný termín pro propojení webových zdrojů včetně URL adres. |
| XML | Extensible Markup Language. A simple flexible text format playing an increasingly important role in the exchange of a wide variety of data on the Web. |
| XMP | Adobe Extensible Metadata Platform (XMP) is a framework for embedding metadata into media files. Adobe provides a BSD-licensed open-source XMP developer’s toolkit which includes documentation about how to represent metadata in XMP. The XMP specification itself is licensed by Adobe under a "Public Patent License" by which Adobe grants everyone the right to make XMP-compliant components of their applications, but it reserves the right to withdraw the license in case such a compliant component infringes "Essential Claims" of any patent. See http://www.adobe.com/devnet/xmp/ for download information. See also MWG in this table. |
13 Appendix II: Audiovisual Core Development History
The Audiovisual Core Multimedia Resources Metadata Schema (Audiovisual Core) standard is the culmination of work on multimedia resource descriptions carried out by Key to Nature, the NBII Digital Image Library, Morphbank, and others, together with input from a number of other stakeholder communities including Encyclopedia of Life (EOL), the Biodiversity Heritage Library (BHL) and the University of Massachusetts-Boston. The Global Biodiversity Information Facility (GBIF) commissioned the ‘Multimedia Resources Task Group (MRTG)’ in March 2008 and the group was approved in December 2009 by Biodiversity Information Standards (TDWG) as the ‘Joint GBIF-TDWG Task Group on Multimedia Resources in Biodiversity’.
Participants in drafting the schema (in alphabetical order)
-
Mr. Mihail-Constantin Carausu, Danish Biodiversity Information Facility (DanBIF), Copenhagen, Denmark
-
Dr. Vishwas Chavan, Global Biodiversity Information Facility, Copenhagen, Denmark
-
Mr. Chris Freeland, Missouri Botanical Garden, St. Louis, USA
-
Dr. Gregor Hagedorn, JKI, Federal Research Institute for Cultivated Plants, Berlin, Germany
-
Prof. Robert A. Morris, University of Massachusetts at Boston, USA
-
Dr. Dimitry Mozzherin, Encyclopedia of Life, Woods Hole, USA
-
Dr Annette Olson, American Association for the Advancement of Science
-
Prof. Greg Riccardi, Florida State University, Tallahassee, USA
-
Dr. Éamonn Ó Tuama, Global Biodiversity Information Facility, Copenhagen, Denmark
Tato norma byla vyvinuta společnou pracovní skupinou tak, aby odpovídala souboru standardizovaných zdrojů pro správu dat, které vyvíjí GBIF.
Finanční prostředky poskytl Global Biodiversity Information Facility.
Velký dík patří Woods Hole Marine Biological Laboratory a Encyclopedia of Life za uspořádání jednoho ze setkání. Tento dokument, včetně některých popisů, je upravenou verzí odpovídajícího dokumentu vypracovaného pracovní skupinou TDWG Natural Collections Descriptions (NCD).
13.1 Časová osa
2006, listopad Založena TDWG Image Interest Group
2008, March GBIF commissions Multimedia Resources Task Group (MRTG)
2008, June GBIF Multimedia Resources Task Group met in Copenhagen, Denmark
2008, August GBIF Multimedia Resources Task Group meeting in Woods Hole, USA
2008, October TDWG Image Interest Group met in Fremantle, Australia at the ‘TDWG Annual Conference 2008’
2008, December Joint GBIF-TDWG Task Group on Multimedia Resources in Biodiversity commissioned
2009, February GBIF Multimedia Resources Task Group met in Copenhagen, Denmark to refine the metadata schema
2009, March GBIF – TDWG Multimedia Resources Metadata Schema (MRTG) ver. 0.4414 drafted and opened for informal comment, evolving through v 0.9
2010, February Schema v 0.9 submitted to TDWG for internal Review
2010, July TDWG Internal Review 1 completed
2010, November v1.0 submitted to TDWG Executive committee with response to Internal Review 1. Proposed Standard renamed Audiovisual Core Multimedia Resources Metadata Schema (AC).
2011, June Response to Internal Review 2 under way.
2011, September Responses to Internal Review 2 and 3 completed and submitted to TDWG Executive Committee
2011, November Prepared responses to “Review g” and “Review h” and to some comments of the Review Manager, Steve Baskauf. Prepare submission for permission to have public comment.
January-November 2012 Further preparation for submission for permission to have public comment
13.2 Historie revizí dokumentu
0.7v1
-
Harmonized document to the fact that Subtype is optional in normative v0.7
-
Fix mismatched parentheses, extra spaces, missing spaces, etc.
ACv1.0 docv1.0
- Harmonized to v1.0: replace “MRTG” with “Audiovisual Core” where used as name of schema. Opravy drobných překlepů. Add “dcterms” as prefix.
ACv1.0 docv1.0
- Further replacement of MRTG with “Audiovisual Core” or “AC”.
AC v1.0 docv 1.2
-
Address Internal Review 2 comments
-
Fix mismatched parentheses, extra spaces, missing spaces, etc.
AC v1.0 docv1.3
- Remove requirement to have Copyright Owner provided.
AC v1.0 docv1.4
- Clean up citations of six mandatory elements instead of five.
AC v1.0 docv1.5
- Replace “keytonature.eu” with “species-id.net” to reflect move of normative wiki. Remove some unused Glossary terms. Update docv to 1.5
AC v1.0docv1.6
- Remove dcterms:title from mandatory list. Add description of it as strongly recommended. Add mention of xmpRights:Owner in Copyright Statement item in the mandatory list. Change to “four” the references of “five” mandatory elements or remove the count altogether where text becomes unambiguous. Mention acterms namespace. Correct Iptc4xmpExt namespace to http://iptc.org/std/Iptc4xmpExt/2008-02-29/. Update docv to 1.6.
AC v1docv1.7
- Clarify relation of this document to the normative docs. Set major major text to left-align, unjustified.
AC v1.0docv1.8
-
Remove mention of crosswalks since no longer in normative termlist.
-
On p. 5 force URL of DwC terms into footnote.
-
Improved language about use of literals with dcterms.
C v1.0docv1.91
-
Various minor grammar and punctuation corrections.
-
Reconciliation to current normative docs.
AC v1.0docv1.92
- More minor grammar fixes.
AC v1.0docv1.93
- Fixed inconsistent internal version references to current version. No substantive or grammatical changes. Note that v1.92 was submitted to TDWG executive committee with request for permission to hold public review.
AC v1.0docv1.94
- Change references from species-id wiki to gbif terms wiki. Adjust Fig 1
AC v1.0docv1.95
- Correct “hasAccentPoint” to “hasAcccessPoint”. Remove text suggesting this is a draft
14 Endnotes
[1] http://rs.tdwg.org/ac/doc/structure/
[2] http://rs.tdwg.org/ac/doc/termlist/
[4] http://www.w3.org/standards/xml/schema
[5] http://en.wikipedia.org/wiki/Comma-separated_values
[6] https://github.com/tdwg/ncd/blob/master/NCD-v090_TDWG/NCD-v090_TDWG-NonNormative.pdf
[7] http://rs.tdwg.org/dwc/terms/
[8] http://rs.tdwg.org/dwc/index.htm
[9] The Metadata Working Group (MWG, http://www.metadataworkinggroup.org/) is an industry consortium (Adobe, Apple, Canon, Microsoft, Nokia, and Sony) organized to specify how to exploit the Adobe Extensible Metadata Platform, XMP (http://en.wikipedia.org/wiki/Extensible_Metadata_Platform) for embedding into common image file formats metadata in several widely used controlled vocabularies. Ačkoli se MWG zaměřuje hlavně na spotřebitelské aplikace, více než dvě desítky open source a komerčních softwarových produktů a platforem podporují XMP a Adobe umístilo Developers’ Toolkit pod open source licenci. Spolu s návrhy na standardní serializace reprezentace neutrálního schématu Audiovisual Core hodlá MRTG navrhnout TDWG Best Practice pro vkládání takových serializací do multimediálních souborů pomocí XMP.
[10] IPTC is a mature standard from the International Press and Telecommunications Council (http://www.iptc.org). Jeho práva duševního vlastnictví podporují jemnější řízené slovníky než DC, což poskytuje lepší strojové zpracování pro vyhledávání a vhodnost pro použití.