A web semântica — também conhecida como web inteligente, web 3.0 e web de dados — foi proposta pela primeira vez em 2001 pelo criador da World Wide Web, Tim Berners-Lee, em seu artigo The Semantic Web, publicado na Scientific American. O conceito principal é estruturar todo o conteúdo da internet de uma forma semântica, para uma melhor interação humano-computador. Não é necessário o desenvolvimento de novas tecnologias para fazer a web semântica funcionar, mas sim a convergência de tecnologias já existentes. Apesar de o conceito geral envolver inteligência artificial, o objetivo não é treinar e ensinar os computadores a se comportarem como humanos, e sim fazer com que os computadores entendam os conteúdos da internet.

Conceitos e termos

Web 3.0: É importante ressaltar que o termo web 3.0 pode referir-se a duas coisas distintas: a web semântica e a web descentralizada. A web semântica, que é o foco desse texto, propõe o aperfeiçoamento da internet atual com a reestruturação dos conteúdos. Já a web descentralizada, versa sobre criar uma nova internet baseada em blockchain — tecnologia usada por trás das criptomoedas.

Grafo de conhecimento: Na matemática, um grafo é definido por um conjunto de vértices ligados por arestas. Ou, de outra forma, é um conjunto de nós ligados por relações.

Grafo simples.

Agora, imagine uma empresa que tenha uma planilha no Excel com informações (nome, e-mail, CPF, endereço, estado civil, etc.) sobre seus funcionários. São apenas dados. Olhando para essa planilha, você não consegue determinar as relações entre eles. Quando você define as relações, as informações transformam-se em conhecimento. Além disso, cada nó do grafo pode ser um conhecimento, não necessariamente são dados.

Grafo de conhecimento.

Isso é um grafo de conhecimento. É arranjar uma base de conhecimento e estruturá-la em grafo. Armazenar informações em um grafo de conhecimento responde perguntas que uma simples planilha no Excel ou um banco de dados padrão não responderia. Você pode ter informações individuais sobre Pedro e Maria, mas não tem o conhecimento de que são casados. Isso implica em buscas e filtros mais avançados, por exemplo.

O que é a web semântica?

O conceito fundamental da web semântica baseia-se em um grafo no qual os vértices/nós representam conceitos, e as arestas/relações representam relações semânticas entre os conceitos. É uma internet em que o computador atribui sentido às palavras.

Web Atual x Web Semântica

Na internet atual, o mecanismo de busca dos navegadores é baseado em palavras-chave. Não há semântica alguma. Se você faz uma pesquisa em um mecanismo de busca, ele vai isolar as palavras digitadas e procurar conteúdos em que todas — ou quase todas — essas palavras isoladas estão inseridas. No Google Chrome, por exemplo, caso a busca não consiga achar um conteúdo com todas as palavras, ele vai mostrar os conteúdos que possuem a maior parte das palavras-chave que você digitou e destacar a palavra não encontrada.

Exemplo do funcionamento por palavras-chave.

Na web semântica, o objetivo é interpretar as palavras-chave da pesquisa não apenas como uma sequência de caracteres arbitrários, mas vinculá-las a objetos, pessoas e lugares do mundo real. Hoje, cada empresa tem seu próprio banco de dados, a ideia é implementar uma cultura de dados abertos. O objetivo é conectar dados, e não pessoas.

Implementação

A implementação da web 3.0 vai ocorrer aos poucos e não de um dia para o outro. Da mesma forma, a web 1.0 não se tornou a web 2.0 do dia para a noite. São processos, aplicações e acontecimentos.

O próprio Tim Berners-Lee disse:

O termo web 2.0 é um jargão difícil de explicar e um conjunto de tecnologias com exatamente os mesmos objetivos da web 1.0.

Tim O’Reilley, criador do termo web 2.0, defende que a mesma foi concebida quando as grandes empresas de tecnologia (Amazon, Microsoft, Google e Apple) começaram a prosperar nesse meio, principalmente depois da bolha da internet em 2000, que faliu inúmeras empresas de tecnologia.

Da mesma forma que a web 2.0 foi uma expansão da web 1.0, a web 3.0 vai ser uma expansão da web 2.0. Na verdade, a web semântica já está sendo implementada em algumas aplicações. A cultura da internet vai mudando aos poucos, site por site e aplicação por aplicação.

Exemplo e conclusão

O Google Knowledge Graph é um exemplo disso. Desde 2012, sua rede semântica (contendo cerca de 3,5 bilhões atributos) é usada ​​para compreender o significado das palavras-chave da pesquisa. Ele fornece informações estruturadas e detalhadas sobre o tema, além de uma lista de links para outros sites. O objetivo é prover aos usuários as informações necessárias para responder às suas dúvidas consultadas sem precisarem navegar para outros sites. Você já deve ter visto muitas vezes o Google Knowledge Graph funcionando nas suas buscas. Um exemplo de um Knowledge Graph sobre Thomas Jefferson:

Knowledge Graph sobre Thomas Jefferson.

Todas as informações que são mostradas, são conhecimentos que estão armazenados em um grafo de conhecimento utilizando processamento de linguagem natural e aprendizado de máquina para aprimorar as relações.

Essa funcionalidade é apenas um exemplo simples do poder da web semântica. As aplicações que podem ser criadas utilizando esta tecnologia são amplas e promissoras.