24 de março

Aula: 24 de março

DMT Daniel Makoto Tokunaga

Notas de Aula

Discussão Algoritmos Genéticos

Considerando a situação de onde um código (execução) de um programa (tarefa) é dado de forma sequencial, Holland argumenta, em seu livro (referencia 10 do modelagem-e-simulacao-de-humanos), que existem algumas formas para a execução:

  • Mutação: alteração direta de partes do código para se explorar formas de melhorar o desempenho.
  • Cross-Over: partes de dois diferentes códigos são trocados para se verificar se há uma melhora no desempenho deste, como cromossomos em reprodução sexuada.

Holland alega que a dentre estas formas “Cross-Over” é a forma que, em média, apresenta maiores chances de aumentar o desempenho do código, assim como na natureza. Apesar de que na área de algoritmos genéticos, serem mais exploradas as formas de “Mutação”.

Considera-se que os casos onde os algoritmos genéticos possuem melhor resultados são os que existem humanos para fazer parte de detecção dos melhores casos, porem onde os casos convencionais utilizados na área não os picos globais, assim estas propostas podem apresentar resultados inesperados para a área (onde a intuição falha).

Contra estas propostas de algoritmos genéticos, existem também métodos como simulated annealing, que são produzem bons resultados em muitos casos. (Outros métodos citados: métodos de Monte Carlo e métodos de força bruta).

Artigos Pentland

Sandy Pentland

(site pessoal: [http://web.media.mit.edu/~sandy/])

Baseia muitas de duas pesquisas através do uso de conhecimentos nas áreas de:

  • Psicologia
  • Psicofísica

Gerando um modelo computacional de casos, de forma á criar usos computacionais destes conhecimentos.

As ferramentas computacionais para estas análises e predições utilizados por Pentland são:

  • Principal Component Analysis (PCA)
  • Hidden Markov Models (HMM)
  • Kalman filter

artigo: Social Dynamics

Artigo trata de formas de reconhecimento e predição em discussões entre participantes de uma conversa, utilizando parâmetros não linguísticos como stress, engajamento, nível de atividade e espelhamento em uma conversa.

Este artigo, de forma inicial, apresenta o uso de conhecimentos de psicologia e psicofísica para se obter resultados computacionais.

Discutiram-se alguns pontos fracos da proposta apresentada neste artigo como: uso de variáveis não confiáveis e muitos sendo somente de primeira ordem, uso de pouca informação de audio (áudio de menos de 30 segundos), e não analisar pistas visuais mais ricas como formas de sentar etc.

Porem, mesmo com estas restrições o artigo apresenta bons resultados, mostrando que apesar de utilizar poucas ferramentas e variáveis, é possível de se obter alguns bons resultados, mesmo de forma preliminar.

Problemas dos artigos em geral

Um grande problema levantado em sala sobre os artigos está no fato que muitos das taxas de acerto são de 70%, que são resultados, para sistemas de detecção e predição, muito baixos em termos de percepção do usuário. (Foi comentado que sistemas de detecção com taxas de acertos menores de 95% são sistemas onde os usuários tem percepção destes erros, se tornando um incomodo).

Porem, estes erros são derivados dos próprios limites dos modelos e teorias de psicologia e psicofísicas utilizadas como base.

PCA: Principal Component Analysis

Técnica utilizada para gerar eixos que melhor representam certa massa de dados capturados. Estes novos eixos podem não só facilitar a representação destas ocorrências, mas também podem gerar eixos, que representam de forma aproximada (i.e. com certo erro), com numero de dimensões menores do que do espaço de possibilidades da capturada.

Imagem representativa (source)
220px-GaussianScatterPCA.png

Exemplo de uso: eigenfaces

Projeto de detecção de faces que inicialmente mapeou diversas fotos de faces em um espaço de n dimensões onde n = numero total de pixeis das fotos. Através da PCA, observou-se que muitas faces poderiam ser representadas em espaço de dimensão 30, onde cada eixo apresentam características das faces.

Imagem representativa (source):

eigenfaces.jpg

Curiosidades: Magic Numbers em pesquisas.

  • acerto de 95%. Mínimo de acertos de sistemas de detecção de padrões para que o usuário não perceba os erros e não se incomode com o sistema. Idealmente 98%.
  • Delay de 50-100ms entre uma ação até a geração de reações sonoras. Mínimo aceitável para sistemas de interação sonora, desta forma inviabilizando em muitos casos o uso de câmeras convencionais. Para profissionais este numero diminui para 20ms.