Pacote {{newsatlasbr}}
Para se cadastrar na API, clique aqui. Acesse o GitHub do pacote R aqui.
Introdução ao newsatlasbr
newsatlasbr é um pacote criado para a quarta versão (v.4.0, de 2020) do Atlas da Notícia, com a finalidade de facilitar o acesso aos bancos de dados do Atlas da Notícia por parte de pesquisadores e programadores.
O pacote extrai os dados diretamente da API do projeto, desenvolvida pelo Volt Data Lab.
O desenvolvimento do pacote é do cientista político e analista de dados do Volt Data Lab, Lucas Gelape, com contribuições de Sérgio Spagnuolo e Renata Hirota.
ACESSE O PACOTE TAMBÉM NO GITHUB
Instalar e carregar o pacote
Atualmente, o newsatlasbr pode ser instalado diretamente do seu repositório no GitHub:
if (!require("devtools")) install.packages("devtools")
devtools::install_github("voltdatalab/newsatlasbr")
Uma vez instalado, ele pode ser carregado usando-se a função library.
library(newsatlasbr)
Funções
newsatlasbr possui três grupos de funções:
- Logar na API para obter um token;
- Obter dados agregados de municípios, UFs ou regiões e produzir mapas desses dados;
- Obter dados de veículos de notícia.
Esse tutorial examina esses três grupos.
Observação: alguma familiaridade com uso da linguagem R é recomendada.
LOGAR NA API
Para acessar a API do Atlas da Notícia, os usuários devem ser registrados e inserir o e-mail e senha para autenticação. A função atlas_signin registra essa informação na sessão de R do usuário, para ela ser usada na obtenção do Bearer token de acesso a API.
A função grava o e-mail e senha somente na sessão atual do usuário. Assim, ele deve repetir essa operação a cada nova sessão de R em que ele queira utilizar o pacote. O usuário e senha são pessoais. Então, os usuários devem ser cautelosos ao escrevê-los e salvá-los em scripts, para evitar o seu compartilhamento.
atlas_signin(email = "example@account_exeample.com", password = "pass")
DADOS AGREGADOS DE MUNICÍPIOS/ESTADOS/REGIÕES
Usuários que já exploraram artigos ou reportagens sobre o Atlas da Notícia sabem que os municípios brasileiros são classificados em 3 categorias, segundo o número de veículos de notícias em cada uma delas:
- Desertos de notícia: nenhum veículo;
- Quase desertos: 1 ou 2 veículos;
- Outros: 3 ou mais.
A função get_municipalities combina requisições de API para as três categorias acima para criar um dataset único contendo o número de veículos de notícia em cada município brasileiro (além de incluir outras informações sobre esses municípios). Como ela faz três requisições, a função demora mais a retornar um resultado do que as funções que realizam uma única requisição. Contudo, ela é a única que dá um retrato completo dos 5565 municípios.
As funções a seguir têm uma estrutura semelhante (nenhum argumento) e retorna os seguintes bancos:
news_deserts: municípios que são desertos de notícia;almost_deserts: municipalities that are quase desertos;n_orgs_100k: municípios com, pelo menos, um veículo, informando tanto o número absoluto de veículos quanto a sua taxa por 100 mil habitantes.
all_municipalities <- get_municipalities()
deserts_municipalities <- news_deserts()
almost_deserts_muns <- almost_deserts()
at_least_1_org_muns <- n_orgs_100k()
Essas funções têm “pares”, que permitem a extração de dados agregados em estados/regiões:
news_deserts_state: retorna um banco com o número agregado de desertos de notícias em cada estado ou região. O padrão da função são estados (regions = F);almost_deserts_state: retorna um banco com o número agregado de quase desertos em cada estado ou região. O padrão da função são estados (regions = F);n_orgs_100k_state: retorna um banco com o número absoluto e a taxa por 100 mil habitantes de veículos de notícias nos estados e regiões. Essa função é um pouco diferente das duas anteriores, uma vez que o banco de dados resultante dela sempre terá 27 observações. Seregions = T(que, ao contrário das anteriores, é o padrão da função), novas colunas são adicionadas, incluindo informações sobre a região em que cada estado está localizado.
news_deserts_states <- news_deserts_state()
almost_deserts_regions <- almost_deserts_state(regions = T)
organizations_per_state <- n_orgs_100k_state()
Por fim, newsatlasbr também inclui três funções para gerar e exportar mapas com essas informações, usando dados geográficos do pacote geobr e gráficos do ggplot2 (as legendas dos mapas, porém, estão em inglês):
news_deserts_map: plota um mapa dos desertos de notícia brasileiros. Os dados podem ser agregados em municípios, estados ou regiões (as três funções têm o município como padrão:aggregation = "municipalities"). Para estados e regiões, o usuário deve escolhar se ele deseja visualizar o número absoluto de desertos de notícias (padrão) ou o percentual nessas agregações. Como nas demais funções, o usuário pode exportar os mapas como um arquivo .jpg usando o argumentoexport = T.
# Plotar um mapa com o percentual de desertos de noticia em cada estado brasileiro
news_deserts_map(aggregation = "states", percentage = T)
almost_deserts_map: plota um mapa dos quase desertos de notícia. Os dados podem ser agregados em municípios, estados e regiões. Ao contrário da funçãonews_deserts_map, o usuário só pode escolher o número absoluto dos quase desertos em cada agregação.

# Plota um mapa de quase desertos em cada regiao do pais
almost_deserts_map(aggregation = "regions")

n_orgs_100k_map: plota um mapa com informação sobre o número de veículos por 100 mil habitantes. Os dados podem ser em nível municipal, estadual ou regional.
# Plota um mapa com o numero de organizacoes por 100k/hab em cada municipio
n_orgs_100k_map()

#DADOS SOBRE VEÍCULOS DE NOTÍCIA
Existem duas funções para extrair dados de veículos de notícias brasileiros: organizations_state e organizations_region. Ambas têm uma estrutura semelhante: os argumentos padrão retornam dados de estados/regiões informados (o usuário pode inserir uf = "All" ou region = "All" para obter os dados do país inteiro - esta opção demora mais para retornar os dados, porém); somente veículos de notícia (news = 1) - excluindo, portanto os veículos não-jornalísticos; e todos os tipos de mídia (media = "all").
Portanto, o usuário pode escolher obter dados para o país inteiro, como dito. Ele também pode obter todos os veículos (news = "all"), isto é veículos jornalísticos e não-jornalísticos. Por fim, ele pode restringir os dados a somente um subconjunto de mídias, como “impresso”, “online”, “radio” e “tv”.
# Extrair dados de todos veiculos jornalisticos do estado de SP
sao_paulo_media <- organizations_state(uf = "SP")
# Extrair dados de todos os veiculos jornalisticos do pais
brazil_media <- organizations_state(state = "all")
brazil_media <- organizations_region(region = "all")
# Extrair dados de veiculos impressos em Pernambuco
pernambuco_print <- organizations_state(state = "PE", media = "print")
# Extrair dados de veiculos jornalisticos de TV na regiao Centro-Oeste
cw_tv <- organizations_region("Central-West", media = "tv")