Programa de Campeãs e Campeões na América Latina
rOpenSci

Yanina Noemí Bellini Saibene, Elio Campitelli, Marcos Prunello, Mauro Lepore, Haydee Svab, Beatriz Milz, Carolina Pradier, Cesar Luis Aybar Camacho, Paola Corrales

2023-10-18

rOpenSci

rOpenSci

Programa Campeãs/Campeões

Marco conceitual

As pessoas campeãs de uma comunidade são aquelas que assumem maior responsabilidade pelo sucesso, pela sustentabilidade e/ou por seu funcionamento.[1]


Objetivo geral

  • Identificar, reconhecer e recompensar líderes em uma comunidade.
  • Destina-se a pessoas de grupos histórica e sistematicamente excluídos que estejam interessadas em contribuir com a rOpenSci e com as comunidades mais amplas de código aberto e ciência aberta.

illustration for rOpenSci by Lydia Hill

Elegiblidade

  • pessoas que trabalham com STEAM (ciência, tecnologia, engenharia e matemática)
  • de qualquer lugar em qualquer lugar do mundo
  • que tenham conhecimento de desenvolvimento com a linguagem R
  • possuam habilidades básicas de comunicação em inglês (escrita e verbal)

E que desejem:

  • desenvolver um novo pacote, ou
  • ter um pacote em R, já desenvolvio, revisado por pares, ou
  • se tornar revisoras da rOpenSci

Objetivos específicos para campeãs e campeões

  • Adquirir habilidades para desenvolver seu próprio pacote R ou;

  • Adquirir confiança para enviar um pacote R para revisão por pares; ou

  • Tornar-se um revisor

  • Aprender a liderar um workshop, evento ou outra atividade da rOpenSci sobre o tópico de desenvolvimento de pacotes ou revisão por pares de software em sua comunidade local

  • Conectar-se a uma rede dentro do ecossistema R

  • Fornecer feedback para ajudar a rOpenSci a continuar organizando atividades relevantes e acolhedoras para desenvolvedores de R

Como funciona

  • Interessados/as/es devem preencher um formulário, geralmente disponibilizado entre julho e outubro

  • As inscrições são individuais

  • Não há custo para participar

  • Duração: 12 meses

  • Dedicação estimada: de 10 a 16 horas mensais

  • Bolsa: US$ 1.000 para quem concluir o programa

Atividades desenvolvidas

Treinamentos (6 primeiras semanas) com posterior desenvolvimento de projeto e mentoria, além de encontros trimestrais

1a/2a edições - 2022/2023 e 2023/2024

Candidaturas: 171 campeãs/ões, 56 mentoras/es, 55 países


América Latina: 3 mentoras/es | 5 campeãs/ões | 3 instrutoras/es/

Mentoras/es latinoamericanas/os

Beatriz Milz Beatriz Milz, photo

Elio Campitelli Elio Campitelli photo

Mauro Lepore Mauro Lepore photo

Ciclo da mentoria

Lições aprendidas

  • Ferramentas e espaço para que campeãs/ões e mentoras/es desenvolvam seus projetos de desenvolvimento ou revisão de pacotes com:
    • ganho de experiência
    • aprimoramento de competências
    • orientação de mentores
    • apoio de uma comunidade
    • aspecto formal com cronograma definido ajuda a manter o o foco na tarefa e a concluí-la em um tempo razoável

Lições aprendidas

  • Retorno tangível à comunidade latino-americana de pesquisa e desenvolvimento por diferentes meios, como:
    • é necessários que campeãs/ões compartilhem o que aprenderam com a comunidade (blogposts, workshops, etc.)
    • aumento do material atualizado em espanhol e português sobre desenvolvimento/revisão de pacotes
    • aumento da procura de pessoas pelo programa, em todas suas finalidades
Lições aprendidas logo

Pacotes desenvolvidos / revisados

Pacotes desenvolvidos / revisados


eph

eph package logo

Por Carolina Pradier

Carolina Pradier photo

karel

karel package logo

Por Marcos M. Prunello

Marcos Miguel Prunello photo

agromet

agromet package logo

Por Paola Corrales

Paola Corrales photo

rgeeExtra

rgeeextra package logo

Por Cesar L. A. Camacho

Cesar Luis Aybar Camacho photo

odbr

odbr package logo

Por Haydee Svab

Haydee Svab photo

pacote odbr

Objetivo | Motivação


Objetivo

Disponibilizar dados de pesquisas origem destino brasileira num único lugar, tornando estes dados abertos mais acessíveis e potencializando seu uso.


Motivação

  • Minha dissertação de mestrado [2]
  • Dados iniciais: 6 coortes de São Paulo (1977, 1987, 1997, 2007 e 2017) e com outra sendo produzida em 2022
  • Maximizar o uso dos dados em si e do impacto da minha pesquisa [3]

Primeiros passos


  • Há pacotes similares?
    • od
    • Não é um pacote de dados
    • Disponibiliza funções para analisar dados de pesquisas OD
  • Pacotes para inspirar: geobr, aopdata, censobr
    • Pacotes de dados
    • Do Brasil
    • Co-mentoria de Rafael Pereira (IPEA): conversas no 1o e no 2o semestre de 2023

footsteps icon

Questões estratégicas


  • Serão dados de São Paulo ou de todo Brasil?

  • Serão apenas bases no formato original ou haverá algum tipo de hamonização?

  • Havendo harmonização, como serão?

  • Em que língua estãos os dados? Em que língua será feito o pacote?

strategy icon

Principais funções do pacote odbr


  • read_od()
    • parâmetros: city, year e hamonize (TRUE, FALSE)
  • read_dictionary()
    • parâmetros: city, year, hamonize e language (pt, en, es)
  • read_map()
    • parâmetros: city, year, hamonize e geometry (zone, district, municipality)

Funções úteis no pacote odbr


Dificuldades | desafios técnicos | submissão no CRAN

Como lidar com grandes bases de dados

  • apendizado com experiência do geobr
  • solução: utilização do piggyback e disponibilização como assets

odbr repo print screen of assets

Dificuldades | desafios técnicos | submissão no CRAN

Como limitar / controlar o tempo de execução no CRAN

  • da Política do CRAN: “Checking the package should take as little CPU time as possible” (…) “Examples should run for no more than a few seconds each”
  • do stackoverflow / issues no Github: tempo de execução não superior a 5s por exemplo
  • apendizado com experiência do censobr
  • pacotes com download de dados muito dependente de qualidade da conexão
  • solução: não executar os exemplos

exemplo da função read_od()

Dificuldades | desafios técnicos | submissão no CRAN

styler versus lintr

  • seguem regras diferentes
  • conflitos implicavam não passar pelo RMDcheck no CI
  • solução: executar styler antes do linter

exemplo da função read_od()

exemplo da função read_od()

Dificuldades | desafios técnicos | submissão no CRAN

Problemas com idioma latino

  • palavras acentuadas ou outras fora do dicionário “inglês” (por exemplo, São e Paulo) geraram “notes” na submissão para o CRAN
  • tentativa de adoção de uma lista de palavras para “enriquecer o dicionário”
  • solução: retirar palavras não reconhecidas

função build_wordlist()

Comunidade

Sem a oportunidade e as pessoas, não seria possível!

Champions edição 2022/2023

Comunidade | Agradecimentos

Referências


[1] The CSCCE Community Participation Model - Exploring the Champion mode. (2021). Woodley and Pratt doi 10.5281/zenodo.5275270


[2] Svab, H. (2016). Evolução dos padrões de deslocamento na região metropolitana de São Paulo: a necessidade de uma análise de gênero. Dissertação de Mestrado, Escola Politécnica / USP, São Paulo.


[3] Repositórios do GitHub: bases de dados e algoritmos do mestrado, pacote agromet, pacote eph, pacote karel, pacote rgeeExtra, pacote odbr, pacote aopdata, pacote censobr

Obrigada!


@hsvab

hsvab@hsvab.eng.br

Haydee e Yanina na LatinR2023

@ropensci

Champions Program webpage: https://ropensci.org/champions/

info@ropensci.org