DISCOVER SPARK IN 4 HOURS

Resumo

  • Esta é uma proposta de minicurso introdutório a plataforma Apache Spark. O curso está previsto para ser ministrado em 4 horas. Ele cobre a motivação e histórico do desenvolvimento da plataforma, os modelos de execução e de dados, detalhes de implantação e otimização, e exemplos de aplicação como o aprendizado de máquina e também exemplos que evidenciam o impacto do uso da memória na redução do tempo de processamento.
  • *OBS: é recomendável que os ouvintes levem laptop com o vmware player instalado.

Autores

  • Angelo Ciarlini é Gerente de Pesquisa do EMC Brazil R&D Center onde coordena pesquisa em Ciência de Dados e Gerenciamento de Big Data. Ele é Doutor em Informática pela PUC-Rio(1999) com especialidade nas áreas de Banco de Dados e Inteligência Artificial;
  • Bruno Costa é Professor e Pesquisador nas áreas de Informática e Ciência da Computação. Colaborador no centro de pesquisa da EMC Brazil R&D Center. Ele é Mestre e Doutorando em Informática pela UFRJ-PPGI/DCC;
  • Edward Pacheco é Data Scientist no centro de pesquisa da EMC Brazil R&D Center. Ele é Mestre em Informática pela PUC-Rio e Doutorando pela UFRJ- PESC/COPPE;
  • Rodrigo Senra é Senior Principal Data Scientist no centro de pesquisa da EMC Brazil R&D Center. Ele é Mestre e Doutor em Ciência de Computação pelo IC- UNICAMP;
  • Vinicius Gottin é Data Scientist no centro de pesquisa da EMC Brazil R&D Center. Mestre em Sistemas de Informação pela Unirio e Doutorando pela PUC- Rio;
  • Wagner Vieira é Colaborador no centro de pesquisa da EMC Brazil R&D Center. Pesquisador nas áreas de Informática e Ciência da Computação e mestrando em Informática pela UFRJ-PPGI/DCC.