The Relevance of Algorithms

Tarleton Gillespie é pesquisador- chefe da Microsoft Research New England, o mais novo membro permanente do Social Media Collective , (juntando-se a danah boyd , Nancy Baym , Kate Crawford e Mary Gray ) equipe de sociólogos, antropólogos e pesquisadores de comunicação e mídia da Microsoft Research que estudam o impacto da tecnologia da informação na vida social e política. Tarleton também mantém um cargo de Professor Associado adjunto na Cornell University.

Seu ensaio “The Relevance of Algorithms” tem sido um componente chave no recente surgimento de uma sociologia dos algoritmos; Suas contribuições concentram-se em como os algoritmos incorporados nas mídias sociais e nos mecanismos de busca estão organizando informações baseadas em suposições implícitas e não examinadas sobre popularidade, relevância e valor - que têm implicações sobre o funcionamento do discurso público. Este trabalho é projetado para desenvolver um vocabulário para uma sociedade na qual sistemas de informação algorítmica e plataformas de mídia social estão cada vez mais profundamente entrelaçadas na vida dos usuários e nas instituições públicas das quais eles dependem. (Microsoft)



Introdução

"Os algoritmos não são necessariamente softwares: em seu sentido mais amplo, são procedimentos codificados que, com base em cálculos específicos, transformam dados em resultados desejados."

" Podemos considerar como algoritmos, por exemplo, instruções de navegação ou fórmulas matemáticas usadas para prever o movimento de um corpo celestial."

"Uma análise sociológica não deve conceber os algoritmos como realizações técnicas abstratas, mas desvendar as escolhas humanas e institucionais que estão por trás desses mecanismos frios. Suspeito que uma abordagem mais frutífera seria nos voltarmos tanto para a sociologia do conhecimento, quanto para a sociologia da tecnologia - para observarmos como essas ferramentas são convocadas, alistadas como parte de, e negociadas em torno de esforços coletivos para conhecer e se tornar conhecido"

Padrões de inclusão

"Os algoritmos são máquinas inertes e sem sentido até serem combinados com bancos de dados para com eles funcionar. Uma pesquisa sociológica sobre um algoritmo deve sempre levar em consideração os bancos de dados aos quais ele está ligado; não fazê-lo seria o mesmo que estudar o que foi dito em um protesto público, sem perceber que alguns dos protestantes foram barrados na entrada do parque."

Preparada para o algoritmo

"Os dados já vêm dissecados e persistentemente bagunçados. Contudo, existe uma ordem premeditada necessária para que os algoritmos possam funcionar com esses dados. Mais do que qualquer coisa, os algoritmos são projetados e apreciados para serem funcionalmente automáticos; para, quando acionados, agirem sem qualquer intervenção ou supervisão regular de humanos (WINNER, 1977). Isso significa que as informações dos banco de dados devem ser transformadas e institucionalizadas de tal forma que os algoritmos possam agir sobre elas automaticamente."

Exclusão e rebaixamento

"Embora os produtores de banco de dados compartilhem o apetite pela coleta de informações, eles se distinguem mais pelo que escolhem excluir."

" Apesar de os serviços de informação em larga-escala se gabarem por serem abrangentes, esses sites são, e sempre devem ser, censores de informações também. Dados indexados excluem spams e vírus; vigiam violação de direitos autorais e pornografia; e retiram o que é obsceno, condenável ou politicamente controverso das bases de dados (Gillespie no prelo)."

"Conteúdos ofensivos podem ser simplesmente removidos dos dados indexados, ou uma conta pode ser suspensa, antes mesmo de chegar ao conhecimento de outro usuário. Contudo, junto com o algoritmo, é possível lidar com conteúdos problemáticos de formas mais sutis. O YouTube “rebaixa algoritmicamente” vídeos provocantes para que não apareçam nas listas dos mais assistidos ou na página inicial gerada para novos usuários. O Twitter não censura conteúdos profanos de tuítes públicos, mas ele os remove da avaliação algorítmica que determina quais termos figuram nos “Trending”.

"Os padrões específicos pelos quais as informações são excluídas ou incluídas nos bancos de dados, e depois gerenciadas de maneiras particulares, são reminiscências dos debates do século XX (TUSHNET, 2008) sobre as formas em que as decisões feitas pela mídia comercial sobre o que deve ser sistematicamente deixado de fora e quais categorias de fala simplesmente não se qualificam podem moldar a diversidade e o caráter do discurso público."

Ciclos de antecipação

"Algoritmos de busca determinam o que oferecer com base nas informações do usuário. Mas a maioria das plataformas hoje faz do seu negócio saber mais, muito mais, sobre o usuário do que apenas a pesquisa que ele acabou de fazer. Os sites esperam ser capazes de antecipar o usuário quando o algoritmo é acionado, o que requer tanto o conhecimento coletado naquele momento, quanto o conhecimento já acumulado sobre o usuário e sobre outros usuários considerados parecidos com ele em termos estatísticos e demográficos (BEER, 2009) - unindo o que Stalder e Mayer (2009) chamam de “segundo índice”

A avaliação da relevância

"Quando os usuários clicam em “Pesquisar”, carregam seu “Feed de Notícias” do Facebook, ou pedem recomendações do Netflix, os algoritmos precisam identificar instantânea e automaticamente quais, dos trilhões de bits de informação, melhor atendem os critérios em questão, e que vão melhor satisfazer um usuário específico e seus objetivos presumidos. Embora estes cálculos nunca tenham sido simples, eles se tornaram mais complexos à medida que o uso público desses serviços foi amadurecendo. Os algoritmos de pesquisa, por exemplo, eram antes baseados apenas em dizer qual a frequência com que determinados termos de pesquisa apareciam nas páginas indexadas da web. Agora, esses algoritmos incorporam informações contextuais sobre os sites e sobre onde eles estão hospedados; consideram a frequência e como o site é relacionado por outros; e convocam técnicas de processamento de linguagem natural para melhor “entender” tanto a consulta, quanto os recursos que o algoritmo pode oferecer como resposta."

Critérios

"Para ser possível dizer que um determinado algoritmo faz suposições avaliativas, do tipo que tem consequências para o esforço do conhecimento humano, seria preciso fazer uma análise crítica do algoritmo a fim de questionar seus critérios subjacentes. Porém, em quase todos os casos, esses critérios de avaliação estão ocultos e devem permanecer assim. O algoritmo de “Trendings” do Twitter, que informa ao usuário sobre os termos mais discutidos naquele momento em uma determinada área geográfica, deixa inclusive a definição do que seria “mais discutido” sem especificação. Os critérios que eles usam para medir o que é “mais discutido” são descritos apenas em termos gerais: a velocidade do surgimento de um determinado termo; se ele já apareceu na lista “Trendings” do Twitter antes; e se ele circula dentro de um determinado grupo ou se expande através de vários grupos de usuários.

"O que não é declarado pela empresa é como esses critérios são medidos; como são avaliados em relação uns aos outros; quais outros critérios também foram incorporados à avaliação; e se algum desses critérios foi substituído. Isso faz com que os algoritmos estejam eternamente abertos à suspeita dos usuários de que seus critérios seriam enviesados para favorecer os provedores comercial ou politicamente, ou que incorporariam premissas embutidas e não-verificáveis que agem de forma incompreensível, até mesmo para os designers"

Saiba mais sobre o trabalho do autor: