segunda-feira, 13 de dezembro de 2010

Web Semântica e sua contribuição para o jornalismo

A Web Semântica, também conhecida como Web 3.0, se propõe a organizar a vasta quantidade de informações disponíveis na Web, inclusive na forma de dados, tornando-a inteligente ao ponto de que os sistemas computacionais possam diferenciar conteúdos e oferecer ao usuário o que ele realmente deseja.
Proposta em um artigo escrito por Tim Berners-Lee, criador da WWW, James Hendler e Ora Lassila, para a revista Scientific American, em 2001, a Web Semântica é uma variação da Web atual, chamada de sintática e que, segundo Lee, é uma Web onde as informações chegam de diversos lugares e não possuem uma estrutura clara, o que torna dificultoso o processo de indexação pelos sistemas de busca e impossibilita a comunicação entre aplicativos.

De acordo com Lee, a Web Semântica foi concebida com a finalidade de atribuir valor semântico aos dados, possibilitando aos agentes inteligentes – máquinas responsáveis por buscar informações na Web – reuni-las de maneira contextualizada, levando em conta os interesses do usuário.
Embora a Web já tenha nascido com esse propósito, devido às limitações de tags proporcionadas pela linguagem HTML (Linguagem de Marcação de Texto, na sigla em inglês), que não oferece uma delimitação precisa de cada parte do conteúdo, dar significado real a cada termo tornou-se impossível.
As tags utilizadas em HTML como a “h” (cabeçalho) e a “p” (parágrafo), simplesmente dizem ao navegador que formatação ele deve dar a determinado conteúdo e os buscadores, por sua vez, dão mais relevância a determinada linha de código que outra, contribuindo para a indexação das informações.

A pesquisa na Web

Quantos de nós, ao procurarmos um termo em um buscador, não nos deparamos com vários resultados inúteis; que apontam para sites que sequer tem relação com o conteúdo que procuramos? Com documentos e dados distribuídos em uma estrutura semântica, os agentes inteligentes retornariam resultados que estariam realmente dentro do contexto daquilo que procuramos.

A estrutura semântica é possibilitada pelo uso da ontologia, modelo de dados responsável por apresentar um conjunto de conceitos dentro de um domínio.
Através da ontologia, existe a possibilidade de relacionarmos termos uns aos outros, inclusive seus objetos e características. Isso é possível ao utilizarmos linguagens como o XML (Linguagem de Marcação Extensível, na sigla em inglês), presente, por exemplo, em protocolos RSS (Agregação Realmente Simples, em tradução livre).

O RSS como ferramenta de pesquisa jornalística

O RSS, utilizado em larga escala por portais noticiosos, é um subconjunto da linguagem XML, que permite ao usuário, através de programas chamados agregadores, receber informações sobre a publicação de novas matérias.

Esses sites disponibilizam um endereço que contém as informações em XML. Ao adicionar esse endereço num programa agregador, o usuário passa a receber avisos sempre que um novo conteúdo for publicado.

Já reparou no canto superior direito aqui do blog? Pois é, você pode se tornar assinante do Risoto e receber um aviso sempre que um novo post for publicado. Basta inscrever o endereço no seu agregador favorito.

A organização da informação baseada na ontologia facilita, inclusive, o trabalho de jornalistas que atuam com o meio on-line como suporte. Com tanta informação estruturada de maneira contextualizada, fica significativamente mais fácil encontrar o que se procura.

Imagine um assessor de imprensa que tem como tarefa vasculhar diversos sites que tenham relação com o campo de atuação de sua empresa. Esse profissional teria que procurar informações em um buscador, eventualmente adicionar o endereço dos resultados que mais lhe agradassem no “Favoritos” do seu navegador e visitar frequentemente esses sites, a fim de obter informações.

Utilizando um agregador de RSS, as informações são atualizadas frequentemente e o usuário tem, em um só local, acesso ao conteúdo de diversos sites espalhados pela Web.

http://www.douglasteixeira.com.br/2010/07/12/a-web-semantica-e-sua-contribuicao-para-o-jornalismo/

Nenhum comentário:

Postar um comentário