Arquivo da categoria: Data Science

100+ Free Data Science Books by Insane (Updated 2021 List)

54 previsões sobre o estado dos dados em 2021

Todos os Créditos e Originalmente escrito por Gil Press (Forbes)
54 Predictions About The State Of Data In 2021

Abaixo uma tradução do Google Translate do artigo original informado acima.

Segundo Gil Press, de 2010 a 2020, a quantidade de dados criados, capturados, copiados e consumidos no mundo aumentou de 1,2 trilhão de gigabytes para 59 trilhões de gigabytes, um crescimento de quase 5.000%. O que os dados farão na próxima década?

2021 Texto com código binário
Feliz Ano Novo! GETTY
Continuar lendo 54 previsões sobre o estado dos dados em 2021

Classificação de Notícias utilizando Machine Learning

Diante da grande quantidade de informações geradas no mundo atualmente, aqui iremos focar em notícias (mais especificamente em notícias curtas), podemos encontrar diversas fontes dessas notícias ( e etc).

O mundo já vem mudando a alguns anos, e a grande maioria dessas notícias atualmente estão em formato digital, o Jornal em Papel vem cada dia perdendo sua força (como podemos ver na imagem abaixo) e dando lugar a notícias em dispositivos eletrônicos. Notícias em formato digital nos permite uma maior abrangência no que se diz respeito a fontes de notícias, podemos ver notícias de várias fontes de notícias ao mesmo tempo e ainda podemos especificar nossos gostos (recomendadores de notícias por exemplo —  e ).

Vejam a matéria completa (Explicação, Exemplo de Web Scraping, Código fonte do Classificador em Python e ainda uma Live explicando a solução)…

Alex Souza
Linktree

Disseminando a Cultura Data-Driven…

Há alguns anos venho disseminando a cultura Data-Driven abordando assuntos tais como: Dados, Bancos de Dados, Qualidade de Dados, Business Intelligence e Machine Learning…

Foram diversas palestras em faculdades e universidades, congressos, empresas, além disso, alguns cursos, e que por sinal, foi em um desses cursos que nasceu o GPDI (Grupo de Profissionais de Dados e Inteligência) que hoje conta com a participação de excelentes profissionais do Brasil e do Mundo.

Hoje passando por alguns posts do LinkedIn, encontrei algumas fotos dos participantes e muito deles sei que hoje são da área de dados ou áreas relacionadas, e o melhor, alguns vejo disseminando também a cultura baseada em dados… isso é sinal que o trabalho e dedicação à comunidade compensa e agradeço a todos por terem participado desses eventos e que hoje também fazem sua parte! Muito obrigado.

Segue algumas fotos de alguns desses eventos! (Clique na imagem para ampliar)

Obrigado a todos!

  Alex Souza
mtac_

#QUARENTENADADOS

#quarentenadados foi uma semana de aulas com profissionais renomados na área de dados e disponibilizaram conteúdo gratuito com a comunidade, com o apoio da Caelum, Alura e do DataHackers. Obrigado a pela iniciativa!

Abaixo seguem meus 5 notebooks das 5 aulas e o que contribui em cada um deles.

 

quarentenadados

COMO COMEÇAR NA ÁREA DE DATA SCIENCE?

A área de dados vem crescendo muito (como comentei em um post anterior, desculpe pelas engasgadas, mas foi o primeiro vídeo que criei e estava um pouco nervoso kkk). Lá comentei sobre algumas profissões, umas mais tradicionais e outras relativamente novas. Aqui iremos comentar mais especificamente na área de Data Science.

As mídias muitos comentam que a “profissão do momento” é Data Scientist e isso fez com que o interesse por essa profissão crescesse demais nos últimos anos e com isso surgem várias dúvidas principalmente para aqueles como Eu, que estão iniciando!

Pensando nisso, resolvi elencar algumas das dúvidas que mais escuto e exponho meu pensamento em relação a cada uma delas, vamos lá…

Perguntas (Question)

  • O que preciso saber, quais as skills, pra ser um Cientista de Dados?
  • Preciso saber inglês? Ter uma graduação? Ter um mestrado?
  • Onde encontro materiais pra estudo, cursos e etc?
  • Qual curso devo fazer para me tornar um data scientist?
  • Tem vagas no mercado?
  • Como faço para ficar mais visível e conseguir uma vaga em data science?
  • Como faço pra ganhar R$ 20.000,00, ou mais, por mês como vi em matérias na televisão?

Respostas (Answer)

  • O que preciso saber, quais as skills, pra ser um Cientista de Dados?
    • No meu ponto de vista pode ser resumido em 4 grandes pilares
      • Negócio
        • Ter conhecimento de negócio;
        • Saber escutar e falar;
        • Saber negociar e expor opiniões;
        • Saber oferecer soluções para o negócio.
      • Dados
        • SQL – Consultas em BD (relacionais ou não relacionais);
        • Extração e Tratamento de Dados.
      • Programação
        • Lógica e conhecimento de programação é uma outra habilidade, as linguagens mais utilizadas nessa área é Python e R.
      • Matemática e Estatística
        • Muito importante para criar e saber qual a melhor análise, cálculo à serem feitos, métricas e etc.
  • Preciso saber inglês? Ter uma graduação? Ter um mestrado?
    • Inglês é fundamental
      • as linguagens de programação e os manuais de suas bibliotecas são em inglês;
      • as médias e grandes empresas são multinacionais, então, é um pré-requisito;
      • os melhores materiais, as novidades do setor, são em inglês.
    • As empresas procuram são profissionais que resolvam problemas e pra isso, a experiencia conta muito mais que um diploma
      • Claro que uma graduação ajuda bastante, um mestrado ajuda ainda mais, mas não são pré-requisitos.
  • Onde encontro materiais pra estudo, cursos e etc?
  • Qual curso devo fazer para me tornar um data scientist?
    • Não existe um curso que irá lhe tornar um cientista de dados, existem diversos cursos bons nessa área (alguns informei acima) que irá lhe ajudar na caminhada rumo ao seu objetivo. A dica é faça um curso e absorva o máximo de conteúdo, anote os pontos que precisa melhorar (exemplo: programação, estatística, álgebra linear…), pesquise e estude esses pontos por fora (se preferir, faça cursos específicos dessas áreas);
  • Tem vagas no mercado?
    • Sim, tem muitas vagas no Mercado, tanto para Cientista de Dados quanto para Engenheiro de Dados (o Engenheiro de Dados é o que monta o alicerce para o Cientista de Dados, é uma área que também tá crescendo muito e no meu ver, as empresas com grandes projetos de Inteligência Artificial devem iniciar por essa área, antes de chamar um Cientista de Dados – isso vai variar de empresa pra empresa, dependendo do tamanho dos projetos e de seus objetivos);
    • Observações
      • Mercado tá precisando de Profissionais no Brasil e no Mundo;
      • Vejo um maior uso de data science nas regiões Sul e Sudeste, mas as demais regiões também estão avançando;
      • Muitas vagas no Exterior que permitem home-office (evita o custo de vida do exterior, principalmente nos EUA);
      • Europa com muitas vagas;
      • Como é uma entrevista de um Cientista de Dados?
  • Como faço para ficar mais visível e conseguir uma vaga em data science?
    • Se você ainda não tem, monte um Portfólio de Serviços
      • Onde?
        • no Github
        • em um Blog
      • O que colocar no Portfólio
        • Trabalhos e análises que já realizou relacionados a área
          • pode ser os trabalhos que já fez na universidade
          • trabalhos pessoais
          • Observação
            • procure sempre fazer um projeto do inicio até o final (deploy))
        • Ou seja, mostre seu potencial! Com isso, ficará mais visível para o mercado.
  • Como faço pra ganhar R$ 20.000,00, ou mais, por mês como vi em matérias na televisão?
    • Não se iluda, esse valor não é bem o praticado principalmente aqui no Brasil, claro que tem grandes instituições que pagam esse valor ou até mais, mas são exceções e não regra! Mas a dica é, estude e poderá sim chegar a ganhar esse valor!

Bom pessoal, vou ficando por aqui, foram 7 questões respondidas com base na minha opinião!

Se tiverem mais algumas dúvidas, podem adicionar nos comentários que respondo o quanto antes!

Fico a disposição!
Abraço!

  Alex Souza
mtac_

Área de Dados, por onde começar?

Esse vídeo é uma Palestra que eu iria ministrar em Faculdades e Universidades do Ceará, só que devido a Pandemia do Coronavírus, tive que desmarcar alguns eventos e resolvi disponibilizar aqui!

Deixem seus comentários e caso tenham interesse, posso agendar uma live para tirarmos dúvidas relacionadas a palestra, o que acham? (deixem seus comentários lá no youtube)

Segue link para download da apresentação.

Segue vídeo
inicial

PROJETO DE LEI Nº 21/20 – Uso da Inteligência Artificial

Texto determina que a inteligência artificial deverá respeitar os direitos humanos e os valores democráticos.

O Projeto de Lei 21/20 cria o marco legal do desenvolvimento e uso da Inteligência Artificial (IA) pelo poder público, por empresas, entidades diversas e pessoas físicas. O texto, em tramitação na Câmara dos Deputados, estabelece princípios, direitos, deveres e instrumentos de governança para a IA.

Visualize o Projeto de Lei 21/20

Continuar lendo PROJETO DE LEI Nº 21/20 – Uso da Inteligência Artificial

Aprendendo DATA SCIENCE

Este material apresenta um conjunto de POST´s relacionados a Machine Learning, onde iremos começar estudando: conceitos, cenários e previsões para a Inteligência Artificial (IA), além de alguns conceitos básicos de Estatística. Em seguida iremos mostrar algumas ferramentas que nos auxiliam no dia a dia quando trabalhamos com Machine Learning (Aprendizado de Máquina). Veremos também uma breve descrição sobre Dados e Big Data, passando por Bancos de Dados não Relacionais (NOSQL).

Após essa base, entraremos no assunto principal: Machine Learning, onde será apresentado diversos materiais detalhando algoritmos, técnicas, bibliotecas (librarys) e etc, daremos um foco maior para Algoritmos de Classificação e Natural Language Processing (NLP) e por fim e não menos importante, as Métricas que podem ser aplicadas.

Em seguida, falaremos sobre Ciência de Dados (Data Science), essa área que vem crescendo e tende a crescer cada vez mais… explicação do que é, o que faz um Cientista de Dados (data scientist), ferramentas utilizadas, uma POST com diversos vídeos que mostram as técnicas e ferramentas utilizadas no dia a dia de um Cientista de Dados.

No final, veremos algumas aplicações que utilizam Machine Learning.

É isso, espero que gostem da compilação de post´s, e possa possa ajudar de alguma forma em seus estudos! Esse post será constantemente atualizado e conto com o feedback de todos para que possamos melhorar ainda mais esse material. Se quiserem sugerir artigos, podem sugerir que adiciono aqui, a ideia é ser uma fonte de estudos.

Continuar lendo Aprendendo DATA SCIENCE

GitHub

Em um nível elevado, o GitHub é um site e serviço baseado em nuvem que ajuda os desenvolvedores a armazenar e gerenciar o seu código, rastreando e controlando também as alterações nos seus códigos. Para saber exatamente o que é o GitHub, você precisa conhecer dois princípios interligados que serão detalhados a seguir, após o detalhamento, um vídeo demonstrando o funcionamento do GitHub, não percam:

  • Controle de versão
  • Git
Sintaxe básica de escrita e formatação no GitHub

Continuar lendo GitHub