Struktura Audiovisual Core
Struktura Audiovisual Core
- Název
- Struktura Audiovisual Core
- Datum vydání verze
- 2023-02-24
- Datum vytvoření
- 2013-10-23
- Součást TDWG Standardu
- http://www.tdwg.org/standards/638
- Tato verze
- http://rs.tdwg.org/ac/doc/structure/2023-02-24
- Poslední verze
- http://rs.tdwg.org/ac/doc/structure/
- Předchozí verze
- http://rs.tdwg.org/ac/doc/structure/2021-10-05
- Abstrakt
- Dokument Audiovisual Core Structure poskytuje pokyny, jak lze multimediální záznamy serializovat jako XML a v tabulkové formě. Navrhuje také, jak lze hodnoty textového seznamu oddělit.
- Přispěvatelé
- Robert A. Morris (University of Massachusetts at Boston, USA), Vijay Barve (), Mihail Carausu (Danish Biodiversity Information Facility (DanBIF), Copenhagen, Denmark), Vishwas Chavan (Global Biodiversity Information Facility, Copenhagen, Denmark), José Cuadra (), Chris Freeland (Missouri Botanical Garden, St. Louis, USA), Gregor Hagedorn (JKI, Federal Research Institute for Cultivated Plants, Berlin, Germany), Patrick Leary (), Dimitry Mozzherin (Encyclopedia of Life, Woods Hole, USA), Annette Olson (American Association for the Advancement of Science), Greg Riccardi (Florida State University, Tallahassee, USA), Ivan Teage (), Steve Baskauf (Vanderbilt University, Nashville, TN, USA), Steve Baskauf (Vanderbilt University, Nashville, TN, USA)
- Tvůrce
- GBIF/TDWG Pracovní skupina pro multimediální zdroje a Skupina pro údržbu audiovizuálního jádra
- Bibliografická citace
- GBIF/TDWG Multimedia Resources Task Group and Audiovisual Core Maintenance Group. 2023. Struktura Audiovisual Core. Biodiversity Information Standards (TDWG). http://rs.tdwg.org/ac/doc/structure/2023-02-24
1. Úvod
Tato dokumentace popisuje strukturu standardu TDWG Audiovisual Core Multimedia Resources Metadata Standard (Audiovisual Core, nebo jednoduše AC).
If you are unfamiliar with the Audiovisual Core, please read the Audiovisual Core Introduction before reading this document. The introduction lays out why there is perceived a need for a biodiversity media resource metadata schema, and how the standard attempts to use existing metadata standards where possible.
For term details, see the Audiovisual Core Terms List document and for a more detailed guide to the use of Audiovisual Core, see the Audiovisual Core Guide document.
During development, Audiovisual core was colloquially known as MRTG, after its developers, the GBIF-TDWG Joint Multimedia Resources Metadata Task Group. Please see the Audiovisual Core Guide and also MRTG Development History for the development history in detail.
1.1 Status obsahu tohoto dokumentu
Sections 2 through 4 of this document are normative except for example sections, which are labeled as non-normative.
1.2 Klíčová slova RFC 2119
Klíčová slova “MUST”, “MUST NOT”, “REQUIRED”, “SHALL”, “SHALL NOT”, “SHOULD”, “SHOULD NOT”, “RECOMMENDED”, “MAY” a “OPTIONAL” v tomto dokumentu je třeba interpretovat podle popisu v RFC 2119.
2 Terminologie této specifikace
Existuje mnoho způsobů, jak organizovat specifikace metadat, zejména pokud jde o názvosloví složek metadat. Vezměte na vědomí následující informace, které se vztahují k Audiovisual Core:
- Multimediální zdroj je cokoli, co poskytovatel identifikuje jako patřící k jedné z možných hodnot termínu AC Type a volitelně k jedné nebo více hodnotám termínu Subtype. A mechanism is provided by which providers can supply a privately defined subtype that will not collide with the AC defined Subtype values.
- An AC record is a set of terms with any values conforming to this document, and which contain at least the four mandatory terms described in the Audiovisual Core Core Term List, and which describes a single multimedia resource (possibly including a Collection). One of these, the value of Identifier is a Globally Unique IDentifier (GUID), which may have been assigned to the resource by an external authority or by the provider of the metadata record.
In the Audiovisual Core Term List, every AC term has a term name following a table entry “Term:”, a URI, a plain text normative Definition, a recommended English Label, an optional Notes attribute. In addition, a term has an attribute telling whether it is mandatory and one telling whether it is repeatable.
AC metadata can describe either individual multimedia resources or collections of resources. A few, but not many, of the AC properties have different values for collections than for individual media. If no such distinction is mentioned, AC does not assume one.
Term Names for terms borrowed from other vocabularies are those in use for the corresponding term in those vocabularies. Term Names are intended principally for navigation in the AC documentation. Term Labels are suggestions for English labels in applications. They are recommendations only and are offered only in English, with the added expectation that they may clarify intended usage of the term. Communities may wish to promulgate recommendations for Labels in other languages, or even alternative English Labels for specialized audiences, e.g. school children. Labels MAY be used for navigation within the Term List, and are often used within the Term List itself when a term is mentioned within the documentation of another term. The Term List provides indices both by name and label.
URI’s for terms conform to the http URI scheme (see http://en.wikipedia.org/wiki/URI_scheme, http://www.w3.org/TR/uri-clarification, or http://www.ietf.org/rfc/rfc2396.txt). Informally, one may understand this as follows: an http URI has the syntax of an http URL, but there is no expectation that putting it in a web browser will result in any information being returned to the browser, and if there is, it may have no relevance. This conformance requirement applies only to the URIs that identify AC terms. A few AC terms permit values to be taken from another controlled vocabulary chosen by the user. In this case, those values may involve URIs conforming to a scheme given by that external vocabulary, and AC is silent on what that scheme is.
Pole Poznámky v dokumentaci k termínu odkazuje na další informace o termínu, pokud existují. Zejména u termínů převzatých z jiných slovníků obsahuje toto pole obvykle odkaz na dokumentaci původního slovníku pro daný termín.
3 Multiplicita a kardinalita
Řada termínů se opakuje. Způsob implementace opakovatelnosti v dané serializaci není definován Audiovisual Core. Následující část obsahuje rady ohledně osvědčených postupů v kontextu opakovatelnosti.
Nejjednodušším případem je jediný opakovatelný termín (např.
dcterms:identifier). V reprezentacích založených na schématu XML, které
umožňuje opakování prvků, lze takový termín jednoduše opakovat (např.
“...<dcterms:identifier>http://example.com/123</dcterms:identifier><dcterms:identifier>http://example.com</dcterms:identifier>...”).
V serializacích, které se nehodí pro opakovatelné
prvky (např. „plochá“ schémata, kde se všechny prvky vyskytují pouze jednou
v jinak nestrukturovaném záznamu), je možné definovat
oddělovače pro podporu seznamu hodnot v rámci jednoho prvku (např.
„…
V některých případech se páry nebo dvojice vlastností opakují. V Audiovisual Core k této situaci dochází například v následujících případech:
- Metadata závislá na jazyku, jako je název, popis atd., musí
být spojena s
ac:metadataLanguage. Jedním z přístupů je použít kompletní záznamy Audiovisual Core společně s vlastností Metadata Language; další podrobnosti naleznete tam. - Hodnoty vlastností týkající se přístupového bodu služby MUSÍ zůstat spojeny s tímto přístupovým bodem služby, i když existuje více přístupových bodů služby. Viz ac:hasServiceAccessPoint pro další podrobnosti.
- Termíny
dwc:scientificNameadwc:identificationQualifierMOHOU být volitelně strukturovány do párů. (See the notes on dwc:identificationQualifier.) - The terms Reviewer, being the name of an individual providing some expert review of a resource, and the review text itself in Reviewer Comments are desirable to store as pairs.
3.1 Strukturované serializace
Mnoho serializačních jazyků poskytuje dostatečně strukturované formy, aby jednoznačně zpracovaly opakující se termíny. V XML můžeme definovat kontejnerový prvek a použít vnořenou strukturu, jak je uvedeno v oddíle 3.1.1. Alternativně můžeme v XML odkazovat na přístupové body pomocí identifikátoru, jak je uvedeno v oddíle 3.1.2. Pokud takové struktury nejsou možné nebo nejsou žádoucí, alternativním řešením je povolit pouze jeden přístupový bod na kontejnerový prvek, ale opakovat kontejnerový prvek pro jeden mediální zdroj, jak je uvedeno v části 3.1.3. To je podobné jedné z možností diskutovaných pro vícejazyčná metadata (viz Metadata Language).
Poznámka: V příkladech byly pro lepší srozumitelnost použity doslovné výrazy „dc:format“ a „ac:variantLiteral“. Za nejlepší postup se však považuje použití termínů s hodnotou IRI „dcterms:format“ a „ac:variant“ s kontrolovanými hodnotami IRI z kontrolovaného slovníku pro formát a kontrolovaného slovníku pro variantu. Další informace naleznete v poznámkách k dc:format a ac:variantLiteral.
3.1.1 Příklad vnořené struktury XML (nenormativní)
```
<MEDIA_METADATA_CONTAINER>
<dcterms:identifier>http//:example.com/pictures/thePicture.jpg</dcterms:identifier>
...
<ac:hasServiceAccessPoint>
<dc:format>image/jpeg</dc:format>
<ac:accessURI>http://example.com/fullres/thePicture.jpg</ac:accessURI>
...
</ac:hasServiceAccessPoint>
<ac:hasServiceAccessPoint>
...
</ac:hasServiceAccessPoint>
<MEDIA_METADATA_CONTAINER>
```
3.1.2 Příklad odkazu XML podle identifikátoru (nenormativní)
```
<MEDIA_METADATA_CONTAINER>
<dcterms:identifier>http://example.com/pictures/thePicture.jpg</dcterms:identifier>
...
<ac:hasServiceAccessPoint>http://example.com/pictures/thePicture.jpg#ac0001</ac:hasServiceAccessPoint>
<ac:hasServiceAccessPoint>http://example.com/pictures/thePicture.jpg#ac0002</ac:hasServiceAccessPoint>
<ac:ServiceAccessPoint id="http://example.com/pictures/thePicture.jpg#ac0001">
<dc:format>image/jpeg</dc:format>
<ac:accessURI>http://example.com/fullres/thePicture.jpg</ac:accessURI>
...
</ac:ServiceAccessPoint>
...
<MEDIA_METADATA_CONTAINER>
```
3.1.3 Příklad opakovaného prvku kontejneru XML (nenormativní)
```
<MEDIA_METADATA_CONTAINER>
<dcterms:identifier>http//:example.com/pictures/thePicture.jpg</dcterms:identifier>
<dcterms:title>List červeného buku</dcterms:title>
<dct:format>image/jpeg</dc:format>
<ac:accessURI>http://example.com/fullres/thePicture.jpg</ac:accessURI>
...
<MEDIA_METADATA_CONTAINER>
<MEDIA_METADATA_CONTAINER>
<dcterms:identifier>http://example.com/pictures/thePicture.jpg</dcterms:identifier>
<dc:format>image/png</dc:format>
<ac:accessURI>http://example.com/fullres/thePicture-hires.png</ac:accessURI>
...
<MEDIA_METADATA_CONTAINER>
```
3.2 Tabulkové serializace
Stejná data jako v příkladech 3.1.1 až 3.1.3 lze serializovat jako „plochou“ tabulku podobnou tabulce v tabulkovém procesoru.
V příkladu v oddíle 3.2.1 se opakuje pouze požadovaný identifikátor, nikoli však
pole názvu. Zda se mají opakovat všechna pole, nebo zda se mají poskytnout všechna
pole pouze v prvním záznamu, přičemž pozdější záznamy se omezí na
identifikátor a vlastnosti přístupového bodu služby, je ponecháno na konkrétních
implementacích. V příkladu v části 3.2.1 je vlastnost ac:hasServiceAccessPoint potlačena
jako zbytečná.
3.2.1 Příklad tabulky, ve které je každý přístupový bod služby uveden v samostatném řádku (nenormativní)
| dcterms:identifier | dcterms:title | ac:variantLiteral | dc:format | ac:accessURI |
| http://example.com/pictures/thePicture.jpg | List červeného buku | Nejvyšší kvalita | image/jpeg | http://example.com/fullres/thePicture.jpg |
| http://example.com/pictures/thePicture.jpg | Nejvyšší kvalita | image/png | http://example.com/fullres/thePicture-hires.png | |
| http://example.com/pictures/thePicture.jpg | Náhled | image/png | http://example.com/thumbs/thePicture-thumb.png |
Další přístup (sekce 3.2.2) také eliminuje potřebu vlastnosti ac:hasServiceAccessPoint při
zploštění struktury ac. Je založeno na zavedení nových termínů
využívajících hodnoty ac:variantLiteral:
„Thumbnail“, „Trailer“, „Lower Quality“, „Medium Quality“, „Good
Quality“, „Best Quality“, „Offline“ jako předpony pro další
vlastnosti v novém jmenném prostoru.
3.2.2 Příklad tabulky s metadaty pro všechny přístupové body služby ve stejném řádku (nenormativní)
| dcterms:identifier | dcterms:title | acf:thumbnailAccessURI | acf:thumbnailFormat | acf:thumbnailImageWidth | acf:thumbnailImageHeight | acf:goodQualityAccessURI | acf:goodQualityFormat | acf:goodQualityImageWidth | acf:goodQualityImageHeight | acf:bestQualityAccessURI | acf:bestQualityFormat | acf:bestQualityImageWidth | acf:bestQualityImageHeight |
| http://ex.com/pictures/thePicture.jpg | List červeného buku | http://example.com/thumb/thePic.jpg | image/jpeg | 100 | 100 | http://ex.com/img/thePic.jpg | image/jpeg | 1000 | 1000 | http://ex.com/hr/thePic.png | image/png | 10000 | 10000 |
Poznámka: acf: (zkratka pro „Audiovisual Core Flat“) je vymyšlený jmenný prostor. Zájmové komunity mohou takové termíny vytvářet, aby mohly využívat tento druh struktury.
4 Seznamy hodnot v prostém textu
Některé termíny AC povolují hodnoty, které jsou seznamy, aby byly reprezentovány jako prostý text. Volba způsobu oddělení položek seznamu je nakonec ponechána na implementátorech AC. Typickým použitím je volba interpunkčního znaménka, jako je „,“, „;“ nebo „|“. V těchto případech je třeba definovat speciální únikovou syntaxi pro případy, kdy je oddělovač součástí hodnoty metadat. Bohužel i u standardních formátů seznamů, jako je CSV, používají různé softwarové balíčky různé metody únikových znaků, což brání výměně dat. V případě, že neexistuje možnost volby specifická pro danou implementaci, DOPORUČUJEME použít jako oddělovač znak “|” a jako escapovaný svislý pruh znak “\|”.