| Detecção de Hiperônimos com BERT e Padrões de Hearst |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
01/04/2021 |
| Área |
CIÊNCIA DA COMPUTAÇÃO |
| Orientador(es) |
- Eraldo Luis Rezende Fernandes
|
| Coorientador(es) |
|
| Orientando(s) |
|
| Banca |
- Anderson Vicoso de Araujo
- Bruno Magalhaes Nogueira
- Edson Takashi Matsubara
- Eraldo Luis Rezende Fernandes
- Rafael Geraldeli Rossi
|
| Resumo |
A relação de hiperônimo é uma importante relação semântica entre palavras que é útil para resolver problemas como resolução de correferência, extração de relações, textual entailment, dentre outros. Um hiperônimo é uma palavra de sentido mais genérico, enquanto um hipônimo é uma palavra de
sentido mais específico. Por exemplo, cidade é hiperônimo de roma, e cachorro é hipônimo de animal. Neste trabalho, propomos um algoritmo não-supervisionado para a tarefa de detecção de hiperônimo que combina os chamados padrões de Hearst com o modelo de linguagem BERT. Padrões de Hearst são padrões linguísticos como banana é um tipo de fruta, o qual é um
indício que fruta é um hiperônimo de banana. Uma limitação deste tipo de abordagem é o problema de escassez (sparsity), comum a métodos baseados em padrões linguísticos.
O modelo de linguagem BERT é um modelo profundo de representação contextual que é treinado para predizer palavras mascaradas na sequência de entrada.
Nós combinamos esta característica do BERT com padrões de Hearst para derivar um algoritmo de detecção de hiperônimo que obtém os melhores resultados da literatura em 7 de 13 datasets considerados.
Dentre estes datasets, estão os três primeiros datasets em português e
que foram desenvolvidos neste trabalho. Nós comparamos nosso método com
o algoritmo DIVE, uma extensão do conhecido algoritmo word2vec que detinha os melhores resultados na maioria dos datasets em inglês para detecção
de hiperônimo. Nosso método alcança um desempenho 3 pontos acima do
DIVE na média dos treze datasets considerados. |
| Download |
|
|
| Mecanismos para apoiar o desenvolvimento de interfaces Web acessíveis para surdos |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
05/03/2021 |
| Área |
CIÊNCIA DA COMPUTAÇÃO |
| Orientador(es) |
- Maria Istela Cagnin Machado
|
| Coorientador(es) |
|
| Orientando(s) |
- Gênesis Medeiros do Carmo
|
| Banca |
- Cássio Leonardo Rodrigues
- Debora Maria Barroso Paiva
- Jane Dirce Alves Sandim Eleuterio
- Marcelo Medeiros Eler
- Maria Istela Cagnin Machado
|
| Resumo |
|
| Download |
|
|
| Extração de Relações Complexas em Denúncias Jurídicas por meio de Rotulação de Palavras |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
05/03/2021 |
| Área |
CIÊNCIA DA COMPUTAÇÃO |
| Orientador(es) |
- Eraldo Luis Rezende Fernandes
|
| Coorientador(es) |
|
| Orientando(s) |
- Lucas Marques Macedo Navarezi
|
| Banca |
- Anderson Vicoso de Araujo
- Bruno Magalhaes Nogueira
- Edson Takashi Matsubara
- Eraldo Luis Rezende Fernandes
- Leandro Guimarães Marques Alvim
|
| Resumo |
|
|
| Segmentação da Área de Olho de Lombo usando Aprendizado Profundo |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
02/03/2021 |
| Área |
CIÊNCIA DA COMPUTAÇÃO |
| Orientador(es) |
|
| Coorientador(es) |
|
| Orientando(s) |
- Maximilian Jaderson de Melo
|
| Banca |
- Gedson Faria
- Hemerson Pistori
- Jose Marcato Junior
- Marina de Nadai Bonin Gomes
- Wesley Nunes Goncalves
|
| Resumo |
|
|
| Contador de objetos em vídeos usando redes neurais convolucionais |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
02/03/2021 |
| Área |
CIÊNCIA DA COMPUTAÇÃO |
| Orientador(es) |
|
| Coorientador(es) |
|
| Orientando(s) |
|
| Banca |
- Amaury Antonio de Castro Junior
- Hemerson Pistori
- Jonathan de Andrade Silva
- Jose Marcato Junior
- Wesley Nunes Goncalves
|
| Resumo |
|
| Download |
|
|
| Similaridade DCJ Livre de Famílias |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
28/01/2021 |
| Área |
CIÊNCIA DA COMPUTAÇÃO |
| Orientador(es) |
- Fabio Henrique Viduani Martinez
|
| Coorientador(es) |
|
| Orientando(s) |
|
| Banca |
- Carlos Henrique Aguena Higa
- Diego Padilha Rubert
- Fabio Henrique Viduani Martinez
- Francisco Eloi Soares de Araujo
- Luiz Carlos da Silva Rozante
|
| Resumo |
|
|
| Infraestrutura Computacional para Detecção e Análise de Particulados em Plantas Solares Fotovoltaicas |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
04/09/2020 |
| Área |
CIÊNCIA DA COMPUTAÇÃO |
| Orientador(es) |
- Ricardo Ribeiro dos Santos
|
| Coorientador(es) |
|
| Orientando(s) |
- Guilherme Gloriano de Souza
|
| Banca |
- Édler Lins de Albuquerque
- Edson Antonio Batista
- Liana Dessandre Duenha Garanhani
- Marco Hiroshi Naka
- Ricardo Ribeiro dos Santos
|
| Resumo |
|
| Download |
|
|
| Generating Search Strings for Secondary Studies Using Text Mining |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
01/09/2020 |
| Área |
CIÊNCIA DA COMPUTAÇÃO |
| Orientador(es) |
|
| Coorientador(es) |
|
| Orientando(s) |
|
| Banca |
- Bruno Magalhaes Nogueira
- Edson Takashi Matsubara
- Francisco Jose Silveira de Vasconcellos
- José Adson Oliveira Guedes da Cunha
- Rafael Geraldeli Rossi
- Ricardo Marcondes Marcacini
|
| Resumo |
Estudo Secundário (ES) é um importante método de pesquisa utilizado em
diversas áreas. Uma etapa crucial na fase de Condução de um ES é a busca
de estudos. Esta etapa é demorada e sujeita a erros, principalmente devido ao
refinamento da string de busca. O objetivo deste estudo é validar a eficácia de
uma formulação automática de strings de busca para ES. Nossa abordagem,
denominada Search String Generator (SeSG), leva como entrada um pequeno
conjunto de estudos (um Quasi-Gold Standard) e os processa usando mineração de texto. Depois disso, o SeSG gera strings de busca que fornecem
um alto F1-Score do Start Set em estratégias de busca híbridas. Para atingir
esse objetivo, (1) geramos uma representação textual estruturada do conjunto
inicial de estudos de entrada como uma bag-of-words usando Frequência de
Termos e Frequência de Documentos; (2) realizamos uma modelagem automá-
tica de tópicos utilizando LDA (Latent Dirichlet Allocation) e enriquecimento de
termos com uma representação de linguagem densa pré-treinada (embedding)
chamada BERT (Bidirectional Encoder Representations from Transformers); (3)
formulamos e avaliamos a string de busca usando os termos obtidos; e (4)
usamos as strings de busca desenvolvidas em uma biblioteca digital. Para a
validação da nossa abordagem, conduzimos um experimento - usando alguns
ES como objetos - comparando a eficácia de strings de busca formuladas automaticamente pelo SeSG com strings de busca manuais relatadas nesses estudos. O SeSG gera strings de busca que alcançam um melhor F1-Score do Start
Set do que as pesquisas relatadas pelos ES. Nosso estudo mostra que SeSG
pode substituir efetivamente a formulação de strings de busca, em estratégias
de busca híbridas, uma vez que dispensa os refinamentos manuais da string. |
| Download |
|
|
| Modelos Profundos de Linguagem para Reconhecimento de Entidades Nomeadas em Domínio Jurídico |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
03/06/2020 |
| Área |
CIÊNCIA DA COMPUTAÇÃO |
| Orientador(es) |
- Eraldo Luis Rezende Fernandes
|
| Coorientador(es) |
|
| Orientando(s) |
- Luiz Henrique Neves Bonifacio
|
| Banca |
- Anderson Vicoso de Araujo
- Bruno Magalhaes Nogueira
- Edson Takashi Matsubara
- Eraldo Luis Rezende Fernandes
- Leandro Guimarães Marques Alvim
|
| Resumo |
Modelos de linguagem baseados em aprendizagem profunda, como ELMo,
BERT e GPT, alcançaram resultados impressionantes em várias tarefas de
linguagem natural. Tais modelos de linguagem são pré-treinados em gran-
des corpora construídos a partir de textos de domínio geral, sem qualquer
tipo de anotação, e posteriormente treinados de forma supervisionada em
uma tarefa final. Uma etapa opcional consiste em realizar um ajuste fino
no modelo de linguagem utilizando um corpus intradomínio que seja sufici-
entemente grande e sem anotações, antes de treinar o modelo na tarefa de
interesse. Esta abordagem não é amplamente explorada na literatura atual.
Neste trabalho, é investigado o impacto desta etapa no reconhecimento de en-
tidades nomeadas (REN) em documentos jurídicos no idioma Português. São
explorados diferentes cenários, considerando duas arquiteturas de modelo de
linguagem baseadas em aprendizagem profunda (ELMo e BERT), quatro cor-
pora anotados e três tarefas de REN pertencentes ao domínio jurídico para
o Português. Resultados experimentais mostram uma melhora significativa
no desempenho devido ao finetuning do modelo de linguagem em textos in-
tradomínio. Os modelos treinados também foram avaliados em duas tarefas
de REN de domínio geral, com o objetivo de entender se as melhorias obti-
das foram devidas à similaridade entre os domínios ou simplesmente a maior
quantidade de dados de treinamento. Os resultados alcançados indicam que
realizar finetuning em dados do domínio jurídico prejudica o desempenho do
modelo em tarefas de REN em dados de domínio geral. Além disso, o modelo
de linguagem baseado na arquitetura BERT, treinado em um corpus do do-
mínio jurídico melhorou significantemente o resultado estado-da-arte para o
corpus LeNER-Br, um corpus de REN formado por documentos jurídicos em
Português. |
| Download |
|
|
| Abordagens para o Problema da Seleção das Subcadeias Específicas utilizando a Distância de Hamming |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
04/03/2020 |
| Área |
TEORIA DA COMPUTAÇÃO |
| Orientador(es) |
- Francisco Eloi Soares de Araujo
|
| Coorientador(es) |
|
| Orientando(s) |
|
| Banca |
- Carlos Henrique Aguena Higa
- Francisco Eloi Soares de Araujo
- Luiz Carlos da Silva Rozante
- Marco Aurelio Stefanes
- Said Sadique Adi
|
| Resumo |
|
| Download |
|
|
| O problema de roteamento em anéis de dois níveis |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
13/02/2020 |
| Área |
TEORIA DA COMPUTAÇÃO |
| Orientador(es) |
|
| Coorientador(es) |
|
| Orientando(s) |
|
| Banca |
- Edna Ayako Hoshino
- Fabio Henrique Viduani Martinez
- Henrique Mongelli
|
| Resumo |
|
|
| Classificação de Acabamento de Gordura de Carcaças Bovinas usando Redes Convolucionais Profundas |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
17/12/2019 |
| Área |
CIÊNCIA DA COMPUTAÇÃO |
| Orientador(es) |
|
| Coorientador(es) |
|
| Orientando(s) |
|
| Banca |
- Bruno Brandoli Machado
- Hemerson Pistori
- Marina de Nadai Bonin Gomes
- Wesley Nunes Goncalves
|
| Resumo |
|
|
| Predição de Perdas de Potência em Módulos de Usinas Solares Fotovoltaicas |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
10/12/2019 |
| Área |
ARQUITETURA DE SISTEMAS DE COMPUTAÇÃO |
| Orientador(es) |
- Ricardo Ribeiro dos Santos
|
| Coorientador(es) |
|
| Orientando(s) |
- Kymberlim Giovanna Martins Ribeiro
|
| Banca |
- Edson Antonio Batista
- Edson Takashi Matsubara
- Erlandson Ferreira Saraiva
- Ricardo Ribeiro dos Santos
- Ricardo Rüther
|
| Resumo |
|
|
| Arcabouço para apoiar o projeto de interfaces Web acessíveis para usuários com baixa visão |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
09/12/2019 |
| Área |
CIÊNCIA DA COMPUTAÇÃO |
| Orientador(es) |
- Maria Istela Cagnin Machado
|
| Coorientador(es) |
|
| Orientando(s) |
|
| Banca |
- Bruno Barbieri de Pontes Cafeo
- Debora Maria Barroso Paiva
- Jane Dirce Alves Sandim Eleuterio
- Maria Istela Cagnin Machado
- Willian Massami Watanabe
|
| Resumo |
|
| Download |
|
|
| TextCSN: Uma Abordagem Semissupervisionada para Agrupamento de Textos Utilizando Restrições Pareadas e Rede Convolucional Siamesa |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
27/11/2019 |
| Área |
CIÊNCIA DA COMPUTAÇÃO |
| Orientador(es) |
|
| Coorientador(es) |
|
| Orientando(s) |
|
| Banca |
- Anderson Vicoso de Araujo
- Bruno Magalhaes Nogueira
- Edson Takashi Matsubara
- Eraldo Luis Rezende Fernandes
- Rafael Geraldeli Rossi
- Ricardo Marcondes Marcacini
|
| Resumo |
|
|
| Matheurísticas e Problemas de Seleção de Sequências |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
25/11/2019 |
| Área |
TEORIA DA COMPUTAÇÃO |
| Orientador(es) |
|
| Coorientador(es) |
|
| Orientando(s) |
|
| Banca |
- Cid Carvalho de Souza
- Edna Ayako Hoshino
- Edson Norberto Caceres
- Henrique Mongelli
|
| Resumo |
|
|
| Matheurísticas e Problemas de Seleção de Sequências |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
25/11/2019 |
| Área |
CIÊNCIA DA COMPUTAÇÃO |
| Orientador(es) |
|
| Coorientador(es) |
|
| Orientando(s) |
- Jean Patrick Tremeschin Torres
|
| Banca |
- Cid Carvalho de Souza
- Edna Ayako Hoshino
- Edson Norberto Caceres
- Fábio Luiz Usberti
- Henrique Mongelli
|
| Resumo |
|
| Download |
|
|
| Modelos DeepWalk para Agrupamento em Redes de Eventos |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
29/07/2019 |
| Área |
SISTEMAS DE INFORMAÇÃO |
| Orientador(es) |
- Ricardo Marcondes Marcacini
|
| Coorientador(es) |
|
| Orientando(s) |
|
| Banca |
- Bruno Magalhaes Nogueira
- Edson Takashi Matsubara
- Murillo Guimarães Carneiro
- Rafael Geraldeli Rossi
- Rafael Giusti
- Ricardo Marcondes Marcacini
|
| Resumo |
|
|
| Assessing the Characteristics of Popular APIs |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
14/06/2019 |
| Área |
CIÊNCIA DA COMPUTAÇÃO |
| Orientador(es) |
|
| Coorientador(es) |
|
| Orientando(s) |
- Caroline Lima Corrêa da Silva
|
| Banca |
- Andre Cavalcante Hora
- Bruno Barbieri de Pontes Cafeo
- Debora Maria Barroso Paiva
- Francisco Jose Silveira de Vasconcellos
- Maria Istela Cagnin Machado
|
| Resumo |
|
|
| Avaliação da evolução de dependências entre variabilidades em sistemas configuráveis |
|
| Curso |
Mestrado em Ciência da Computação |
| Tipo |
Dissertação |
| Data |
05/06/2019 |
| Área |
CIÊNCIA DA COMPUTAÇÃO |
| Orientador(es) |
- Bruno Barbieri de Pontes Cafeo
|
| Coorientador(es) |
|
| Orientando(s) |
- Raiza Artemam de Oliveira
|
| Banca |
- Alessandro Fabricio Garcia
- Andre Cavalcante Hora
- Bruno Barbieri de Pontes Cafeo
- Debora Maria Barroso Paiva
- Elder José Reioli Cirilo
- Maria Istela Cagnin Machado
|
| Resumo |
|
|