• Fernando Giannini

Como a geometria, dados e vizinhos prevêem seus filmes favoritos

Um pouco de geometria do ensino médio pode ajudá-lo a entender a matemática básica por trás dos mecanismos de recomendação de filmes.

Fonte: big mouth

Adriana é fanática por filmes da Marvel: seus filmes favoritos envolvem o Hulk, Thor e Pantera Negra. Bruna prefere filmes de animação como Inside Out, os Incríveis e qualquer coisa com Buzz Lightyear (super-herói de brinquedo). Não gosto de nenhum dos dois tipos, embora provavelmente seja mais próximo da Bruna do que da Renata. E posso inclinar-me um pouco para o Carlos, que adora thrillers como Get Out e The Shining.


Quais preferências de filme são mais próximas das suas: Renata, Silvia ou Ivan? E o quão longe estão seus gostos cinematográficos dos outros dois? Pode parecer estranho perguntar “quão longe”. Afinal, essa é uma questão de distância. O que distância significa quando se trata de quais filmes você gosta? Como mediríamos?


Por mais estranho que possa parecer, empresas como a Netflix medem e fazem uso desse tipo de distância todos os dias. Assistindo ao que você assiste e analisando os dados, eles medem sua predileção por comédias, romances, documentários e outros tipos de filmes e usam essas informações para imaginar sua posição no espaço abstrato das preferências cinematográficas.


Então, ao identificar as pessoas mais próximas de você neste espaço abstrato - seus vizinhos mais próximos, por assim dizer - a Netflix pode recomendar coisas novas para você assistir: e saber, as coisas que seus vizinhos gostam.


Quando se trata desses tipos de mecanismos preditivos, saber quem está mais próximo de quem é crucial para entender, classificar e analisar conjuntos de dados complexos. E tudo começa com algumas ideias simples desenvolvidas na geometria do ensino médio.


Vamos começar pensando na Renata e na Silvia como pontos no espaço

.Na realidade, o espaço de preferência do filme é muito maior e mais complexo (e os motores de recomendação reais são muito mais sofisticados) do que o que estamos imaginando aqui, mas este é um lugar amigável para começar a explorar a matemática.


Para ajudar a ver se estamos mais perto de A ou B , vamos desenhar uma bissetriz perpendicular - um segmento de linha que é perpendicular aA B⎯⎯⎯⎯⎯⎯⎯e corta ao meio. A bissetriz perpendicular é uma ferramenta muito útil na geometria euclidiana. Sempre que você precisar cortar algo ao meio, existem bissetores perpendiculares ao redor.


No plano, a bissetriz perpendicular de um segmento de linha é uma linha, como visto abaixo.

Uma construção típica de segmento de linha A B⎯⎯⎯⎯⎯⎯⎯'s bissectriz perpendicular, utilizando intersectam círculos congruentes centrado em A e B.


Uma propriedade importante das bissetoras perpendiculares é que seus pontos são equidistantes das extremidades do segmento que corta ao meio. Isso conecta intimamente bissetores perpendiculares a triângulos isósceles - triângulos com dois lados do mesmo comprimento. Suponha que um ponto Q esteja na bissetriz perpendicular do segmentoA B⎯⎯⎯⎯⎯⎯⎯, como isso.


Porque está na bissetriz perpendicular do segmento A B⎯⎯⎯⎯⎯⎯⎯, Ponto Q é equidistante de um e B . Ou seja, QAQB . Se Q representa Quentin, então Quentin é tão próximo da Adriana quanto de Bruna



.

Podemos provar QA  =  QB  usando propriedades básicas de triângulos ou reflexos, mas também podemos demonstrá-lo dobrando. Se desenhar este diagrama de uma folha de papel e dobrar ao longo da bissectriz perpendicular, poderá ver Uma linha se com B . E uma vez que Q fica na dobra, o segmento Q A⎯⎯⎯⎯⎯⎯⎯⎯Q B⎯⎯⎯⎯⎯⎯⎯⎯Δ A Q BA B⎯⎯⎯⎯⎯⎯⎯A B⎯⎯⎯⎯⎯⎯⎯como sua base. (Há uma situação com a qual devemos nos preocupar. Consegue identificá-la?)


Uma vez que cada ponto na bissetriz perpendicular do segmento A B⎯⎯⎯⎯⎯⎯⎯

Vamos colocar Yvete em nosso plano, em algum ponto Y que não está na bissetriz perpendicular de A B⎯⎯⎯⎯⎯⎯⎯

Sabemos imediatamente que Y não é equidistante de A e B , mas podemos dizer mais. Podemos mostrar geometricamente que Yvete está mais perto da Bruna do que da Adriana.


Imagine segmentosYUMA⎯⎯⎯⎯⎯⎯⎯YB⎯⎯⎯⎯⎯⎯⎯



Podemos mostrar que  YBYA  adicionando algo ao nosso diagrama. Que eu seja a

interseção de YUMA⎯⎯⎯⎯⎯⎯⎯EuB⎯⎯⎯⎯⎯⎯

Uma vez que I está na bissetriz perpendicular de A B⎯⎯⎯⎯⎯⎯⎯

YA YI + IA  = YI + IB


Mas em um triângulo, qualquer lado deve ser mais curto do que os outros dois lados juntos. Esse fato fundamental, chamado de “desigualdade triangular”, basicamente diz que o caminho mais curto entre dois pontos é o segmento de linha reta que os conecta. Aplicando a desigualdade do triângulo em Δ YEuB


YBYIIB

E como  YI  +  IA  =  YI  +  IBYA , vemos que YBYA .

Observe que Yvete está do lado da Bruna A B⎯⎯⎯⎯⎯⎯⎯A B⎯⎯⎯⎯⎯⎯⎯A B⎯⎯⎯⎯⎯⎯⎯


Essa estratégia funciona com mais de dois pontos. Vamos adicionar o Carlos.



Aqui está a bissetriz perpendicular de A B⎯⎯⎯⎯⎯⎯⎯

Sabemos que isso divide o plano em duas regiões: coisas que estão mais perto de A, e as coisas que estão mais perto de B. Nota-se que uma vez que C encontra-se em 'Um lados, C está mais perto de um de B. Agora vamos construir a bissetriz perpendicular do segmento de linha A C⎯⎯⎯⎯⎯⎯⎯⎯

Isso também divide o plano em duas regiões: coisas que estão mais perto de A e as coisas que estão mais perto de C . Observe que B está mais próximo de C do que de A , uma vez que está no lado de A C⎯⎯⎯⎯⎯⎯⎯⎯


Várias coisas notáveis ​​acontecem quando construímos a bissetriz perpendicular restante de B C⎯⎯⎯⎯⎯⎯⎯⎯

Primeiro, todas as três bissetoras perpendiculares se cruzam em um único ponto. Esta "simultaneidade" das bissetoras perpendiculares deA B⎯⎯⎯⎯⎯⎯⎯B C⎯⎯⎯⎯⎯⎯⎯⎯A C⎯⎯⎯⎯⎯⎯⎯⎯

Vamos chamar a interseção dessas duas bissetoras perpendiculares de ponto O. Por ser o ponto de interseção, O está em ambas as bissetoras perpendiculares. Uma vez que está na bissetriz perpendicular de A B⎯⎯⎯⎯⎯⎯⎯A C⎯⎯⎯⎯⎯⎯⎯⎯


Mas se  OA  =  OB  e  OA  =  OC , então  OB  =  OC . Isso significa que O deve estar na bissetriz perpendicular de B C⎯⎯⎯⎯⎯⎯⎯⎯


Esta notável simultaneidade não é a única coisa notável acontecendo aqui. Vamos dar uma olhada nas regiões criadas por essas três linhas que se cruzam.

Considere a região em vermelho. Esses pontos estão no lado C da bissetriz perpendicular de B C⎯⎯⎯⎯⎯⎯⎯⎯A C⎯⎯⎯⎯⎯⎯⎯⎯


Raciocínio semelhante nos permite preencher o resto do diagrama dessa forma.

Claramente, os pontos vermelhos são todos aqueles mais próximos de C , os pontos amarelos são aqueles mais próximos de A e os pontos azuis são aqueles mais próximos de B. Usando bissetores perpendiculares, criamos um "diagrama de Voronoi": uma partição do plano em regiões de pontos que possuem o mesmo “vizinho mais próximo” entre os pontos A, B e C.


Nessa imaginação simplista do espaço de preferência do filme, aqui estou eu no ponto P : mais perto dos super-heróis de Adriana do que das histórias de brinquedos da Bruna, mas indo em direção ao Carlos e seus shows de terror.

Como estou na região amarela, esta partição me diz que Adriana é minha vizinha mais próxima: Se estou procurando um novo filme para curtir, experimentar algo de que ela goste seria uma boa aposta.


E, em um espaço de preferência de filme com milhões de espectadores, haverá vizinhos ainda mais próximos cujas preferências corresponderão melhor às minhas do que às de Adriana. Conforme você assiste a filmes e se localiza neste espaço, seu vizinho mais próximo pode recomendar filmes para você também.


Esta análise geométrica funciona para qualquer número de pontos em qualquer número de dimensões. A única coisa que realmente muda é a própria natureza da bissetriz perpendicular.


No plano, uma bissetriz perpendicular é uma linha, mas no espaço tridimensional, uma bissetriz perpendicular é um plano. E no espaço de 10 dimensões, uma bissetriz perpendicular é tudo o que divide o espaço de 10 dimensões ao meio (um hiperplano de nove dimensões).


Embora a abordagem possa permanecer a mesma, os cálculos tornam-se mais difíceis à medida que o conjunto de dados fica mais complexo. Ter mais dimensões significa mais coordenadas para cada ponto de dados, o que significa cálculos de distâncias mais complicados.


E como você tem que encontrar a bissetriz perpendicular para cada par de pontos, o número que você deve encontrar cresce muito rapidamente à medida que o número de pontos aumenta: com três pontos, há três bissetores perpendiculares, mas com 100 pontos, há quase 5.000.


Em um espaço de milhões de pontos com milhares de coordenadas cada, processar todas as distâncias necessárias pode se tornar inviável. Para lidar com essa complexidade, matemáticos e cientistas da computação desenvolveram algoritmos para particionar o espaço e encontrar os vizinhos mais próximos que são muito mais eficientes do que simplesmente encontrar todas as bissetoras perpendiculares.


Isso geralmente envolve estimar os vizinhos mais próximos, em vez de localizá-los exatamente, tornando a clássica troca da precisão pela simplicidade na matemática.


Autor: Patrick Honner Fonte: https://www.quantamagazine.org/how-geometry-data-and-neighbors-predict-your-favorite-movies-20190522/

Receba as notícias sobre educação e tecnologia 

Fernando Giannini

 

E-mail:

fernando.giannini@streamer.com.br

logo-3.png

© 2020 por Fernando Giannini