Hendrik Macedo
02/10/2015

HAL 9000 de Pixabay/Creative Commons
HAL 9000. [1]
Aficionados por ficção científica devem lembrar do computador HAL 9000, principal antagonista do livro “2001: Uma Odisseia no Espaço” do escritor Arthur C. Clarke e do filme homônimo dirigido por Stanley Kubrick. HAL 9000 era um computador dotado de Inteligência Artificial que controlava todos os sistemas da espaçonave Discovery One e possuía alta capacidade de compreensão da linguagem humana, o que lhe permitia interagir com toda a tripulação via comunicação natural.

Em 2011, a empresa IBM aproximou um pouco mais a ficção da realidade ao apresentar para o mundo uma máquina capaz de competir com seres humanos em um tradicional programa norte americano de TV de perguntas e respostas, o Jeopardy!. O sistema Watson [2], como foi batizado, competiu contra dois dos mais conhecidos e bem-sucedidos campeões do Jeopardy!, Ken Jennings e Brad Rutter, tendo-os vencido na competição de duas partidas, transmitida em três noites consecutivas no programa de TV, a partir de 14 de fevereiro de 2011.

Watson é um sistema de perguntas e respostas (QA) que utiliza técnicas de Processamento de Linguagem Natural (NLP) [3] para analisar a pergunta em questão, identificar entidades e relações, gerar hipóteses para a resposta, encontrar evidências, ranquear as hipóteses para então, construir uma resposta adequada e sintaticamente bem formada. A base de conhecimento do Watson é formada por 200 milhões de páginas de conteúdo em linguagem natural, o que equivale à leitura de aproximadamente um milhão de livros. A arquitetura paralela de QA do Watson permite que todo o processamento seja dividido entre seus 2.880 processadores presentes num cluster de 90 servidores.

Vale ressaltar que esta arquitetura é adaptável para diferentes tipos de aplicações e domínios. Mais recentemente, em 2014, o Watson mostrou mais uma vez sua grande capacidade de revelar padrões e descobrir conexões desconhecidas em grandes volumes de informação textual já disponível. Nesta ocasião, o Watson “leu” 70 mil artigos científicos sobre a proteína p53, associada a muitos tipos de câncer e, em poucas semanas, permitiu a identificação precisa de várias proteínas que modificam a p53 [4]. Levando-se em conta que nos últimos 30 anos os cientistas descobriram em média uma proteína por ano, o potencial de uso do Watson para este fim é “assustador”. Graças a esta capacidade cognitiva do Watson, pesquisadores da Baylor College of Medicine selecionaram 6 destas proteínas para serem investigadas com mais profundidade quanto à capacidade de desativar a p53.

Em um mundo onde a maior parte da informação e rastros da comunicação humana reside em forma textual não estruturada de portais Web, blogs, artigos científicos e, particularmente, redes sociais virtuais, como Facebook, Twitter, Whatsapp e outros, sistemas automatizados de compreensão dessa linguagem natural humana, como o Watson, possuem um enorme potencial para transformar definitivamente o modo como os computadores podem ajudar as pessoas em sua vida pessoal ou profissional.

[1] Crédito da imagem: Pixabay / Creative Commons CC0. URL: https://pixabay.com/en/artificial-intelligence-155161/.

[2] D Ferrucci et al. Building Watson: An overview of the DeepQA project. AI magazine 31, 59 (2010).

[3] J Hirschberg and CD Manning. Advances in natural language processing. Science 349, 261 (2015).

[4] S Spangler et al. Automated hypothesis generation based on mining scientific literature. In Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining (pp. 1877-1886). ACM. (2014).

Como citar este artigo: Hendrik Macedo. Máquinas que compreendem a linguagem humana. Saense. URL: http://www.saense.com.br/2015/10/maquinas-que-compreendem-a-linguagem-humana/. Publicado em 02 de outubro (2015).

Artigos de Hendrik Macedo     Home