Metadados são dados sobre dados: ou seja, suas propriedades, histórico, origem, versões e outras informações sobre um ativo de dados.
Metadados referem-se a dados sobre dados, que basicamente encapsulam as diferentes propriedades, histórico, origem, versões e outras informações sobre um ativo de dados em campos altamente estruturados, usados principalmente para rastreamento, classificação e análise. Este artigo explica os tipos de metadados e seus usos com exemplos.
O que são metadados?
Metadados são dados sobre dados, que basicamente encapsulam as diferentes propriedades, histórico, origem, versões e outras informações sobre um ativo de dados em campos altamente estruturados, usados principalmente para rastreamento, classificação e análise.
Metadados são definidos aproximadamente como dados que oferecem informações sobre algum outro conteúdo, mas não sobre a substância dos dados, como a própria imagem ou o conteúdo da mensagem de texto. Ele ajuda os usuários a entender o significado dos dados e é essencial para garantir a conformidade com os regulamentos e as iniciativas de governança de dados.
Os metadados fornecem informações como a origem dos dados, seu significado, sua localização, sua propriedade e sua criação. Por exemplo, os metadados em uma imagem digital podem consistir em informações como tamanho, resolução, tempo de criação e profundidade de cor. É útil na classificação, organização, rotulagem, classificação e pesquisa de dados.
Um repositório de metadados é um banco de dados que armazena e gerência metadados. Deve-se fornecer conteúdo a um banco de dados para garantir que ele seja usado conforme pretendido e adequadamente identificado, por exemplo, um banco de dados de uma coleção de imagens digitais.
A seguir estão as funções dos metadados:
- Organização e descrição: Metadados descrevem e ordenam recursos de dados em um repositório. As informações em um repositório são organizadas com base em seu público ou tópico. Ele também é organizado hierarquicamente, construindo páginas dinamicamente usando informações armazenadas em banco de dados. Os especialistas podem produzir novos metadados por meio de procedimentos de registro, catalogação e indexação.
- Pesquisa e recuperação: Metadados descritivos apropriados simplificam a localização dos usuários e a obtenção de metadados e informações de recursos de dados necessários. Permite agrupar recursos semelhantes e distinguir recursos diferentes.
- Utilização e preservação: os metadados ajudam a rastrear o ciclo de vida de um recurso de dados. Ele monitora a modificação, o gerenciamento de permissões e o gerenciamento de versões. Para garantir sua disponibilidade sustentada, os recursos de dados devem ser expostos a um regime de preservação contínua e passar por operações como atualização, migração e verificação de integridade.
- Criação de informações, multiversão e reutilização: várias iterações de um recurso podem ser desenvolvidas para preservação, estudo ou desenvolvimento de produto. Os digitalizadores devem incluir metadados administrativos e descritivos no recurso. Os metadados são vitais para preservar e tornar os materiais acessíveis no futuro. A preservação e manutenção de recursos necessitam de aspectos únicos para rastrear a proveniência de objetos digitais e descrever suas propriedades físicas.
- Facilita a interoperabilidade: usando esquemas de metadados estabelecidos, mecanismos de transferência padronizados e cruzamentos entre esquemas e APIs, é simples compartilhar recursos como coleta de metadados e pesquisa entre sistemas.
No entanto, os metadados apresentam alguns desafios. As organizações podem relatar pouco retorno sobre o investimento, portanto, preferem manter métodos tradicionais, como planilhas, em vez de um sistema de gerenciamento de banco de dados (DBMS) adequado. Além disso, está espalhado em formulários difíceis de usar, como bancos de dados e planilhas do Excel, em grandes organizações. Metadados armazenados neste formulário são difíceis de rastrear; às vezes, nem é atualizado.
Software de gerenciamento de metadados
O software de gerenciamento de metadados ajuda a avaliar, selecionar, capturar e armazenar metadados. Idealmente, as organizações devem automatizar o gerenciamento de dados para facilitar o rastreamento e a responsabilidade de dados.
Seguem alguns exemplos desse tipo de software:
- Alation Data Catalog por Alation: Oferece uma interface intuitiva e fácil de usar. É valorizado por sua publicação de consulta Standard Query Language (SQL).
- SAP Power Designer da SAP: Esta solução de gerenciamento de dados é relativamente estável. É valorizado pela sua função, que permite o teste de modelos.
- Informatica Enterprise Data Catalog da Informática: esta solução é valorizada por sua ferramenta que captura metadados de várias fontes e possui recursos de verificação.
- SAP Information Steward by SAP: Esta solução é valorizada por seus insights de dados.
- IBM InfoSphere Information Governance Catalog da IBM: Esta solução é valiosa por permitir que os usuários aproveitem o Open IGC para criar ativos customizados e linhagens de dados.
Benefícios do gerenciamento de metadados
A seguir estão os benefícios de centralizar metadados usando software especializado:
- Um repositório centralizado pode conter informações como relatórios e configurações. Esses dados podem ser armazenados em arquivos ou pastas protegidos por uma chave de segurança. A presença de uma chave de segurança garante acesso restrito aos arquivos e oferece mais segurança aos dados.
- O repositório melhora a eficiência operacional e o gerenciamento. Os usuários podem recuperar, acessar e realizar análises de dados de várias fontes em um único local, promovendo a produtividade.
- Metadados centralizados também promovem economia de custo e tempo. Menos tempo e esforço são usados para realizar a manutenção, facilitando a análise e o rastreamento de dados mais precisos.
- Ele oferece um banco de dados de modelo de suporte onde vários usuários podem oferecer seus insights.
6 Tipos de Metadados
Os metadados podem ser de vários tipos, dependendo de sua funcionalidade e origem. Os seis principais tipos de metadados a serem observados incluem o seguinte:
1. Metadados estruturais
Os metadados estruturais fornecem informações valiosas que ajudam a estabelecer o relacionamento entre os objetos. Isso permite que os usuários entendam e recorram ao recurso de dados eficazmente. Os metadados estruturais também fornecem informações sobre as estruturas hierárquicas entre os diferentes recursos de dados. Isso pode incluir um índice, página, seção e numeração de capítulos.
Seu principal objetivo é melhorar a exibição e navegação dos dados coletados, o que é facilitado por um programa de virada de página especificando a ordem dos gráficos da página. É influenciado pela forma como as fotografias são fornecidas ao usuário e salvas no repositório.
2. Metadados descritivos
Metadados descritivos fornecem informações úteis para descobrir e identificar um recurso de dados. Ele descreve o quê, quando, onde e quem de um recurso. Consiste em informações sobre o conteúdo e o contexto dos dados. É organizado e frequentemente adere a um ou mais esquemas padrão, reconhecidos como Dublin Core ou MARC. Também pode definir as características físicas do recurso, como seu tipo de meio e dimensões.
Ele ajuda os usuários a pesquisar e recuperar informações no nível do sistema. No nível da Web, ele permite que os usuários descubram recursos, por exemplo, por meio de hiperlinks de documentos.
3. Metadados de preservação
Metadados de preservação referem-se às informações relacionadas ao gerenciamento de preservação de coleções e recursos de informação. Envolve a documentação do processo de preservação das versões físicas e digitais dos recursos e engloba todas as informações necessárias para gerenciar e proteger os ativos digitais ao longo do tempo.
Nos repositórios digitais, os metadados de preservação podem tratar da gestão de direitos e consistem em informações sobre os titulares de direitos que autorizam tais ações. Ele se baseia em outras estruturas, como metadados estruturais e administrativos. Está associado principalmente à análise e às ações realizadas em um recurso após ser submetido a um repositório.
4. Metadados administrativos
Os metadados administrativos fornecem informações úteis no gerenciamento de recursos. Ele fornece informações relacionadas à governança, controles de acesso e segurança. Inclui dados técnicos sobre informações de direitos autorais, gerenciamento de direitos e contratos de licença. Pode consistir em dados técnicos sobre a criação e controle de qualidade das obras, gestão de direitos, controle de acesso, requisitos do usuário e preservação de informações de ação.
É regido por procedimentos específicos do projeto com base nos requisitos locais do projeto e pode conter acordos contratuais e informações de pagamento. Inclui tanto a preservação quanto o conhecimento técnico. Pode-se usar a política de arquivamento de metadados administrativos para o gerenciamento interno de recursos.
5. Metadados de proveniência
Os metadados de proveniência fornecem informações úteis sobre as origens de um recurso de dados. Inclui informações sobre a propriedade, qualquer transformação que os dados possam ter sofrido, o uso dos dados e o arquivamento do recurso de dados. Essas informações ajudam a rastrear o ciclo de vida de um recurso.
Os metadados de proveniência são gerados sempre que uma nova versão de um conjunto de dados é criada e indica o relacionamento entre diferentes versões de objetos de dados. Isso permite que os usuários consultem o relacionamento entre as versões e incluem dados de proveniência de granulação fina ou grossa em recursos de dados.
6. Metadados de definição
Metadados de definição referem-se aos metadados que fornecem um vocabulário comum que facilita uma compreensão compartilhada do significado dos dados. O significado dos dados inclui informações sobre as definições dos dados, regras que regem o contexto dos dados e cálculos. Também pode incluir informações sobre a lógica usada ao criar dados derivados para entender completamente seu significado.
Metadados de definição são categorizados em semânticos e esquemáticos. Você pode descrever conjuntos de dados estruturados e não estruturados semanticamente com uma descrição textual ou vocabulário. Um esquema de banco de dados pode apresentar conjuntos de dados estruturados.
6 Usos de Metadados
Pode-se usar várias formas de metadados de várias maneiras. Aqui estão as principais aplicações de metadados em uma organização:
1. Gerenciamento de banco de dados
Metadados em um sistema de gerenciamento de banco de dados (DBMS) consistem em um nome de coluna e um número de linha que é anexado ao dado. O padrão SQL oferece um método padronizado para acessar os metadados chamados de esquema; no entanto, nem todos os bancos de dados implementam esse método. Os metadados facilitam a organização, interpretação e solicitação de dados.
Os metadados podem ser um diretório no banco de dados que permite aos usuários classificar e filtrar facilmente os dados por tipo e estabelecer relacionamentos entre diferentes conjuntos de dados. Um catálogo DBMS está associado à coleta de dados e contém informações que definem os artigos do banco de dados.
2. Pesquisas em sites
Os sites são incorporados com metadados que afetam significativamente sua classificação e sucesso. Ao criar uma página da Web, é importante incluir detalhes de metadados, como um meta título e uma meta descrição. Um meta título descreve brevemente o tópico da página para dar aos leitores uma prévia do que esperar.
Uma meta descrição fornece mais informações sobre o conteúdo da página, embora seja breve. Uma metatag só aparece no código de uma página e ajuda os mecanismos de pesquisa a categorizar a página. Os mecanismos de pesquisa leem esses metadados para determinar palavras-chave e os usam para categorizar o site.
3. Mídias sociais
Os metadados nas mídias sociais permitem que os usuários tenham mais controle sobre como desejam que seu conteúdo seja compartilhado em plataformas como Facebook ou Twitter. Quando os usuários otimizam seu conteúdo, eles obtêm mais interações de suas postagens do que de postagens sem otimização.
Por exemplo, quando os usuários publicam links no Facebook, ele extrai metadados como o título da postagem, uma breve descrição da postagem e a imagem em destaque, a URL da postagem e o nome do site. Os usuários podem aproveitar o Open Graph no Facebook e os Cartões do Twitter no Twitter para otimizar e determinar como suas postagens são exibidas.
4. Linguagens de marcação
As linguagens de marcação permitem que os usuários identifiquem elementos individuais de um documento, como um parágrafo ou um cabeçalho. Eles incluem uma linguagem de marcação generalizada padrão (SGML) ou linguagem de marcação extensível (XML). O SGML permitia o compartilhamento de documentos legíveis por máquinas. XML consiste em regras padronizadas para anexar informações ao texto para torná-lo legível por máquinas.
Ele funciona envolvendo pedaços de texto, como palavras, frases ou parágrafos, em tags que descrevem o que está entre eles. O conteúdo de marcação permite que os usuários pesquisem palavras-chave em muitos documentos diferentes.
5. Aplicativos de rastreamento de consumidores
Sites de compras online e de varejo costumam usar metadados para rastrear hábitos e movimentos do consumidor. Eles coletam todos os dados para os quais têm permissão legal, como tipo de dispositivo do consumidor, localizações, compras, cliques e horários em que acessam os sites.
Usando essas informações, eles criam uma imagem das preferências, associações e hábitos de seus consumidores e as usam para comercializar seus produtos para eles. Essas informações também podem segmentar consumidores e enviar anúncios direcionados. Da mesma forma, os governos podem usar metadados de páginas da Web e e-mails para monitorar a atividade na Web. Esta informação pode ser usada na vigilância em massa.
6. Classificação das informações
A classificação envolve organizar as informações logicamente para encontrá-las quando necessário. Colocar essas informações em classes ou categorias é conhecido como taxonomia e os dados associados aos itens são metadados. Os usuários podem incorporar essas informações no conteúdo ou em um sistema de gerenciamento de conteúdo externo.
Compreender os metadados é vital para criar um sistema de gerenciamento de conteúdo (CMS) eficaz. Nas taxonomias, vocabulários controlados podem promover uma compreensão do propósito pretendido. As tags de metadados podem ajudar na descoberta de recursos e melhorar a organização dos recursos. As informações devidamente classificadas facilitam a análise e a interação dos usuários com os dados.
6 Exemplos de Metadados
Agora que analisamos os usos críticos dos metadados, aqui estão alguns exemplos para ilustrar ainda mais sua aplicação.
1. Metadados para um documento
Os metadados do documento fornecem informações adicionais sobre um documento para contexto adicional. Essas informações são úteis na classificação, pesquisa e recuperação. Os metadados incluem detalhes como o autor do documento, tamanho e título.
As tags permitem que os usuários classifiquem e categorizem documentos rapidamente. As etiquetas de informação fornecem notas adicionais sobre um documento, enquanto as etiquetas de segurança permitem acesso restrito. Os metadados da versão do documento permitem que os usuários rastreiem as alterações e visualizem informações sobre a data em que foi criado e modificado pela última vez.
Sistemas confiáveis de gerenciamento de conteúdo e sistemas de gerenciamento de documentos suportam links de documentos. Esses links podem estabelecer relacionamentos entre um ou mais documentos.
2. Metadados sociais
Metadados sociais referem-se a dados adicionados a um conteúdo por outras pessoas além do criador do conteúdo, como tags, classificações e comentários. As metatags do Facebook no Open Graph consistem em informações como o título de uma postagem, uma breve descrição da postagem e a imagem em destaque, a URL da postagem e o nome do site. As metatags do Twitter nos Cartões do Twitter consistem em informações como título, uma breve descrição da postagem, uma miniatura de imagem e atribuição da conta do Twitter. Essas tags são incorporadas ao código HTML.
3. Metadados em HTML
O código HTML é incorporado em um site para fornecer informações essenciais adicionais ao site. Uma metatag é usada para fornecer essas informações adicionais. Meta tags são colocadas no cabeçalho do documento. Eles podem ter informações como o título e o autor do site.
Metatags podem ser usadas para especificar palavras-chave importantes relacionadas ao documento. As palavras-chave são úteis para os mecanismos de pesquisa ao indexar páginas da Web para fins de pesquisa. Pode-se também usar metatags, o qual também podem ser utilizadas para fornecer uma breve descrição do documento. Da mesma forma, eles podem ser usados para fornecer informações sobre quando o documento foi atualizado pela última vez.
4. Metadados em um banco de dados relacional
Os bancos de dados relacionais são usados para armazenar e fornecer acesso aos metadados em uma estrutura conhecida como dicionário de dados. O dicionário de dados contém informações de metadados sobre tabelas, colunas, tipos de dados, restrições, relacionamentos de tabelas, exibições e índices.
As colunas contêm os atributos dos dados, enquanto as linhas representam um registro com um ID exclusivo conhecido como chave. Cada registro consiste em um valor de atributo correspondente, facilitando o estabelecimento de relacionamentos entre os pontos de dados. As chaves estrangeiras permitem pesquisas de dados e manipulação entre bancos de dados.
5. Metadados em um e-mail
Os cabeçalhos das mensagens de e-mails enviados ou recebidos consistem em campos de metadados que não são visíveis no cliente de e-mail. Os e-mails consistem em metadados, como a data e a hora em que o e-mail foi recebido, exemplos disso incluem os endereços de e-mail do remetente, do destinatário, seus nomes, título e assunto do e-mail.
Eles também podem conter informações sobre o conteúdo completo do documento, incluindo e excluindo a formatação HTML. Além disso, pode incluir metadados no documento original, incluindo o tipo de conteúdo, tamanho do arquivo e URL de download. Uma lista de todos os documentos anexados ao e-mail, juntamente com os URLs para recuperá-los, também pode ser incluída, e esses metadados desempenham um papel vital na segurança do e-mail.
6. Metadados geoespaciais
Metadados geoespaciais descrevem objetos geográficos como mapas e conjuntos de dados. Geralmente descreve quem, quando, onde, o quê, porque e como dos arquivos do sistema de informações geográficas (GIS).
Exemplos de metadados geoespaciais incluem detalhes como a data de criação dos dados, informações de contato do autor, projeção do mapa e sistema de coordenadas, escalas usadas nos dados, quaisquer erros nos dados e uma chave contendo explicações de vários símbolos e atributos que são usados. Também pode incluir um esquema de banco de dados para uso em um sistema de dados, reproduções de dados e informações de licença.
Conclusão
Os metadados formam a base de várias funcionalidades avançadas orientadas por dados, desde malhas e malhas de dados até data lakes e armazéns. À medida que mais e mais informações são geradas por usuários e máquinas em todo o mundo, os metadados ajudam a acompanhar esses ativos e atribui a cada conjunto de dados uma identidade exclusiva. As organizações podem aproveitar essa tecnologia para melhorar as operações em serviços personalizados, segurança orientada a dados e muito mais.