Nos últimos meses, saíram duas novas versões da Facebook Graph API (a interface de coleta de dados da plataforma). Sempre que é divulgada uma API, há preocupações, rumores e mitos tanto da comunidade de pesquisa quanto do mercado sobre limitações no acesso aos dados. Em abril de 2015, o Facebook desativou a versão 1.0. Com isso, impossibilitou a extração de postagens por meio de palavras-chave, como ainda ocorre no Twitter.
Rapidamente, correu o rumor do “fim do monitoramento” já que a principal técnica de coleta de menções não funcionava mais. Em texto publicado no livro do IBPAD, argumentei que, embora a modificação criasse uma limitação para a análise da plataforma, há diversas outras técnicas de amostragem que podem ser implementadas para pesquisa no Facebook, principalmente se aproveitando métodos amostrais da análise de redes sociais. Novamente, o Facebook atualizou suas APIs e voltam a surgir preocupações com menor volume de dados. Frequentemente, esquecemos que as “redes sociais” nada mais são do que plataformas proprietárias desenvolvidas com fins mercadológicos. Isso quer dizer que os rastros de todas nossas postagens e conversações valem ouro. Todo um modelo de negócio de monitoramento foi desenvolvido, capacitando profissionais em metodologias específicas, para a utilização de softwares de análise da opinião pública digital. Por isso, é importante conhecer como as mudanças limitam a cessão de dados e como isso impacta a pesquisa acadêmica e mercadológica. Modificações A implementação de uma versão nova da API não invalida, necessariamente, as anteriores. Atualmente (fevereiro de 2018), o Facebook possui oito versões da interface em funcionamento. Cada uma tem duração aproximada de dois anos. Quando a documentação de uma API é publicada, há dois tipos de mudanças:
A outra alteração não é da API 2.11. Oficialmente, desenvolvedores do Facebook argumentam que ainda é um bug de instabilidade da API. Na prática, esse bug inviabiliza a extração de dados históricos. Já não consigo coletar quase nada além de 600 posts no passado. A partir disso, a API retorna uma dezena de publicações a cada três meses. Como é um erro, ainda não afetou todos usuários ou todas páginas. Mas já tem sido reportado no fórum de desenvolvedores do Facebook por diversos pesquisadores de vários países. Como isso afeta A modificação da API 2.11 impede a extração de dados de ID e Nome em locais públicos, como postagens de fan-pages. No entanto, ainda é possível ter essa informação se você for gestor da página a partir de seu Page Token. Na prática, ainda conseguiremos analisar quem são nossos fãs mais engajados, qual tipo de reação dão e seus comentários. Só não conseguiremos fazer isso em páginas de concorrentes. Para pesquisa, isso impossibilita a análise que chamei de Mapeamento de Fluxo no capítulo do livro. Isto é, o rastreamento de curtidas e comentários dados por milhares de usuários em várias páginas para entender o que curtem e comentam e tirar insights para perfilizar a audiência. Para o monitoramento, elimina de vez a possibilidade de análise dos perfis do público em larga escala. Já o erro ou instabilidade que corta acesso a dados históricos é mais grave. Ele está há quase um ano sem solução, e, se confirmado, torna a extração de posts no passado bem parecida com a do Twitter. Isso faz com que os projetos de pesquisa tenham que coletar informações praticamente em tempo real. A formação de acervo de dados digitais será ainda mais valiosa para a academia. Como lidar A cada transformação da API, somos lembrados que as “redes sociais” são plataformas empresariais que detém um oligopólio sobre a gestão, uso e análise de nossos dados. Essas implementações visam, de um lado, proteger a privacidade dos usuários, e de outro, controlar ainda mais o acesso. Na prática, isso gera uma nova assimetria de poder entre quem pode ou não realizar pesquisas e se beneficiar dos insights de dados digitais, na medida em que sempre será possível comprar os dados de algum revendedor autorizado pelo Facebook. O caminho para fazer pesquisa é aperfeiçoar os métodos de extração e de composição de amostra em universos digitais. Além disso, é fundamental debater a economia política da internet e aprofundar o conhecimento teórico sobre o direito a acesso aos dados. Principalmente para os fins de pesquisa, institutos acadêmicos podem se organizar para pressionar o Facebook para gerar APIs Universitárias, com acesso a dados anonimizados para fins de avanço da literatura especializada.
0 Comentários
Enviar uma resposta. |
About mePhD candidate at @uff_br - Rio de Janeiro, Brazil. Investigating #politicalcommunication on #socialmedia with #datascience and #digitalmethods Archives
Dezembro 2017
CategoriesFollow me on TwitterBlogs to followAdriana Amaral
Anatoly Gruzd Andreas Jungherr Anja Bechmann Axel Bruns Bernhard Rieder Damian Trilling Daniel Kreiss David Beer David Karpf Deen Freelon Elizabeth Dubois Insightee Fabio Giglietto Fabio Malini Farida Vis Geoff Gentry Gregory Saxton Jean Burgess Jeff Hemsley Karine Nahon Lada Adamic Lev Manovich Marco Toledo Bastos Max Stabile Pablo Barberá Raquel Recuero Robert Ackland Tarcízio Silva Tommaso Venturini Wasim Ahmed Weiai Wayne Xu Zeinep Tufeck |