The Relevance of Algorithms
Tarleton Gillespie é pesquisador- chefe da Microsoft Research New England, o mais novo membro permanente do Social Media Collective , (juntando-se a danah boyd , Nancy Baym , Kate Crawford e Mary Gray ) equipe de sociólogos, antropólogos e pesquisadores de comunicação e mídia da Microsoft Research que estudam o impacto da tecnologia da informação na vida social e política. Tarleton também mantém um cargo de Professor Associado adjunto na Cornell University.
Seu ensaio “The Relevance of Algorithms” tem sido um componente chave no recente surgimento de uma sociologia dos algoritmos; Suas contribuições concentram-se em como os algoritmos incorporados nas mídias sociais e nos mecanismos de busca estão organizando informações baseadas em suposições implícitas e não examinadas sobre popularidade, relevância e valor - que têm implicações sobre o funcionamento do discurso público. Este trabalho é projetado para desenvolver um vocabulário para uma sociedade na qual sistemas de informação algorítmica e plataformas de mídia social estão cada vez mais profundamente entrelaçadas na vida dos usuários e nas instituições públicas das quais eles dependem. (Microsoft)
Introdução
"Os algoritmos não são necessariamente softwares:
em seu sentido mais amplo, são procedimentos
codificados que, com base em cálculos
específicos, transformam dados em resultados
desejados."
" Podemos considerar
como algoritmos, por exemplo, instruções de navegação
ou fórmulas matemáticas usadas para prever
o movimento de um corpo celestial."
"Uma análise sociológica não deve conceber os algoritmos
como realizações técnicas abstratas, mas
desvendar as escolhas humanas e institucionais
que estão por trás desses mecanismos frios. Suspeito
que uma abordagem mais frutífera seria nos
voltarmos tanto para a sociologia do conhecimento,
quanto para a sociologia da tecnologia - para observarmos
como essas ferramentas são convocadas,
alistadas como parte de, e negociadas em torno de
esforços coletivos para conhecer e se tornar conhecido"
Padrões de inclusão
"Os algoritmos são máquinas inertes e sem
sentido até serem combinados com bancos de
dados para com eles funcionar. Uma pesquisa sociológica
sobre um algoritmo deve sempre levar
em consideração os bancos de dados aos quais
ele está ligado; não fazê-lo seria o mesmo que estudar
o que foi dito em um protesto público, sem perceber que alguns dos protestantes foram barrados
na entrada do parque."
Preparada para o algoritmo
"Os dados já vêm dissecados e
persistentemente bagunçados. Contudo, existe
uma ordem premeditada necessária para que os
algoritmos possam funcionar com esses dados.
Mais do que qualquer coisa, os algoritmos são
projetados e apreciados para serem funcionalmente
automáticos; para, quando acionados, agirem
sem qualquer intervenção ou supervisão regular
de humanos (WINNER, 1977). Isso significa
que as informações dos banco de dados devem
ser transformadas e institucionalizadas de tal forma
que os algoritmos possam agir sobre elas automaticamente."
Exclusão e rebaixamento
"Embora os produtores de banco de dados
compartilhem o apetite pela coleta de informações,
eles se distinguem mais pelo que escolhem excluir."
" Apesar de os serviços
de informação em larga-escala se gabarem por
serem abrangentes, esses sites são, e sempre devem
ser, censores de informações também. Dados
indexados excluem spams e vírus; vigiam violação
de direitos autorais e pornografia; e retiram o que é
obsceno, condenável ou politicamente controverso
das bases de dados (Gillespie no prelo)."
"Conteúdos ofensivos podem ser simplesmente
removidos dos dados indexados, ou uma conta
pode ser suspensa, antes mesmo de chegar ao conhecimento
de outro usuário. Contudo, junto com o
algoritmo, é possível lidar com conteúdos problemáticos
de formas mais sutis. O YouTube “rebaixa
algoritmicamente” vídeos provocantes para que não
apareçam nas listas dos mais assistidos ou na página
inicial gerada para novos usuários. O Twitter
não censura conteúdos profanos de tuítes públicos,
mas ele os remove da avaliação algorítmica que determina
quais termos figuram nos “Trending”.
"Os padrões específicos pelos quais as informações
são excluídas ou incluídas nos bancos de
dados, e depois gerenciadas de maneiras particulares,
são reminiscências dos debates do século
XX (TUSHNET, 2008) sobre as formas em que
as decisões feitas pela mídia comercial sobre o
que deve ser sistematicamente deixado de fora
e quais categorias de fala simplesmente não se
qualificam podem moldar a diversidade e o caráter
do discurso público."
Ciclos de antecipação
"Algoritmos de busca determinam o que oferecer
com base nas informações do usuário. Mas
a maioria das plataformas hoje faz do seu negócio
saber mais, muito mais, sobre o usuário do que
apenas a pesquisa que ele acabou de fazer. Os sites
esperam ser capazes de antecipar o usuário
quando o algoritmo é acionado, o que requer tanto
o conhecimento coletado naquele momento, quanto
o conhecimento já acumulado sobre o usuário e
sobre outros usuários considerados parecidos com
ele em termos estatísticos e demográficos (BEER,
2009) - unindo o que Stalder e Mayer (2009) chamam
de “segundo índice”
A avaliação da relevância
"Quando os usuários clicam em “Pesquisar”,
carregam seu “Feed de Notícias” do Facebook, ou
pedem recomendações do Netflix, os algoritmos
precisam identificar instantânea e automaticamente
quais, dos trilhões de bits de informação, melhor
atendem os critérios em questão, e que vão melhor
satisfazer um usuário específico e seus objetivos
presumidos. Embora estes cálculos nunca tenham
sido simples, eles se tornaram mais complexos à
medida que o uso público desses serviços foi amadurecendo.
Os algoritmos de pesquisa, por exemplo,
eram antes baseados apenas em dizer qual a frequência
com que determinados termos de pesquisa
apareciam nas páginas indexadas da web. Agora,
esses algoritmos incorporam informações contextuais
sobre os sites e sobre onde eles estão hospedados;
consideram a frequência e como o site
é relacionado por outros; e convocam técnicas de
processamento de linguagem natural para melhor
“entender” tanto a consulta, quanto os recursos que
o algoritmo pode oferecer como resposta."
Critérios
"Para ser possível dizer que um determinado
algoritmo faz suposições avaliativas, do tipo que
tem consequências para o esforço do conhecimento
humano, seria preciso fazer uma análise
crítica do algoritmo a fim de questionar seus critérios
subjacentes. Porém, em quase todos os
casos, esses critérios de avaliação estão ocultos
e devem permanecer assim. O algoritmo de “Trendings”
do Twitter, que informa ao usuário sobre
os termos mais discutidos naquele momento em
uma determinada área geográfica, deixa inclusive
a definição do que seria “mais discutido” sem
especificação. Os critérios que eles usam para
medir o que é “mais discutido” são descritos apenas
em termos gerais: a velocidade do surgimento
de um determinado termo; se ele já apareceu na
lista “Trendings” do Twitter antes; e se ele circula
dentro de um determinado grupo ou se expande
através de vários grupos de usuários.
"O que não
é declarado pela empresa é como esses critérios
são medidos; como são avaliados em relação uns aos outros; quais outros critérios também foram
incorporados à avaliação; e se algum desses critérios
foi substituído. Isso faz com que os algoritmos
estejam eternamente abertos à suspeita
dos usuários de que seus critérios seriam enviesados
para favorecer os provedores comercial ou
politicamente, ou que incorporariam premissas
embutidas e não-verificáveis que agem de forma
incompreensível, até mesmo para os designers"
Saiba mais sobre o trabalho do autor:

0 Comentários