Miguel Ramalho foi o grande vencedor do Prémio Arquivo.pt 2020, vendo distinguido o seu trabalho Desarquivo – uma plataforma que analisa notícias preservadas pelo Arquivo.pt para estabelecer relações entre entidades, pessoas e locais. À Forum Estudante, o diplomado da Faculdade de Engenharia da Universidade do Porto (FEUP) explica a utilidade desta plataforma, descrevendo o contexto que esteve na base da sua criação.
O projeto Desarquivo foi distinguido com o 1.º Prémio do Prémio Arquivo.pt 2020. Pode explicar-nos em que consiste esta solução?
O nome Desarquivo é parcialmente auto-explicativo. É, pelo menos, indicativo do que faz. Trata-se de um projeto que analisa o texto de notícias arquivadas ao longo dos últimos 20 anos, identifica referências a pessoas, organizações, locais e outras entidades; cria uma rede de relações entre estas entidades com base na presença mútua num corpo de notícia e, por fim, permite pesquisar esta rede, chamemos-lhe grafo, de forma visual e intuitiva. Parte de notícias arquivadas, e termina com um grafo, um desarquivo, das ligações entre estas pessoas, organizações, locais e mais.
A aplicação que idealizei inicialmente é o jornalismo de investigação. Precisamente por isso é que o foco foi criar uma nova forma de encontrar coisas escondidas. Neste caso, essas coisas são ligações. Ligações que vão desde descobrir que dois políticos estiveram no mesmo evento, em 2004, até perceber quais as empresas que mais interagem com uma dada universidade. Para além do jornalismo de investigação, o Desarquivo pode ser usado para exploração ou aprendizagem pessoal e verificação de factos. Estas são aplicações que permitem aprender ou responder a questões e que têm uma natureza diferente daquela a que já nos habituamos nos motores de busca convencionais. Claro está, o Desarquivo usa fontes de informação que a maior parte dos motores de busca não usa, ou à qual não têm acesso, por se tratarem de páginas que já não estão presentes na web.
A desinformação é vista como uma das tendências marcantes do século XXI, sendo muitas vezes destacada a forma como impacta negativamente a nossa sociedade. Acredita que o Desarquivo pode ajudar a responder a este fenómeno? De que forma?
O problema da desinformação assenta na preguiça generalizada que nós humanos temos, é tão mais fácil fazer scroll e continuar a ler um feed do que investigar cada notícia, facto, estatística ou comentário com que nos deparamos. Nesse sentido, não sou ingénuo ao ponto de achar que o Desarquivo vá mudar os padrões de consumo e eliminar o ócio do século XXI. Contudo, vejo-o a ter um impacto a complementar aquele jornalismo que, de facto, assenta em factos e fontes de informação fidedignas e, nesse sentido, ser mais uma ferramenta que ajuda a verdade a tornar-se conhecida, ainda que depois tenha de batalhar por atenção com a mentira. Também tenho estado a manter um outro projeto direcionado a compreender este problema nas redes sociais em Portugal, que foca, para já, apenas o Twitter: o Election Watch.
O contexto foi precisamente num projeto de investigação jornalística por parte do ICIJ (International Consortium of Investigative Journalists) – os Luanda Leaks – cujos documentos se veio a saber mais tarde serem responsabilidade do Português Rui Pinto. No seguimento deste episódio, lembro-me de ler um artigo que explicava alguns dos desafios e abordagens usadas para analisar uma quantidade de dados e ficheiros tão grandes. Daí, e por já ter ouvido falar do prémio Arquivo.pt, juntei o útil ao agradável e tentei pegar numa quantidade de dados de semelhante grandeza, neste caso orientada a um contexto mais abrangente: o conteúdo noticioso Português e como este espelha o nosso país. Encarei muito este projeto como um desafio de fazer algo simultaneamente relevante e inovador. Se resultou ou não, creio que o tempo o dirá.
Olhando o futuro próximo, qual pensa que será o impacto desta distinção?