Quem sou eu

Minha foto
Sou economista, escritor e divulgador de conteúdos sobre economia e pesquisas científicas em geral.

Jupiter Orbit Europa, a lua de Júpiter

Projeto do Edifício de Gravidade Artificial-The Glass-Para Habitação na Lua e Marte

Botão Twitter Seguir

Translate

quinta-feira, 27 de fevereiro de 2020

Observando as estrelas com computadores: o que o aprendizado de máquina pode nos ensinar sobre o cosmos

Caros Leitores;




O Observatório Vera Rubin abrigará a Câmera LSST, que coletará dados sobre 37 bilhões de galáxias e estrelas ao longo de 10 anos. Os cientistas estão desenvolvendo programas de aprendizado de máquina para analisar o fluxo de dados. Crédito: M. Park / Inigo Films / LSST / AURA / NSF


Olhando para o céu noturno em uma área rural, você provavelmente verá a lua brilhando cercada por estrelas. Se você tiver sorte, poderá encontrar a coisa mais visível a olho nu - a galáxia de Andrômeda. É o vizinho mais próximo da nossa galáxia, a Via Láctea. Mas essa é apenas a menor fração do que existe por aí. Quando a câmera do Departamento de Energia (DOE), Legacy Survey of Space and Time (LSST), no Observatório Vera Rubin da National Science Foundation, é ativada em 2022, ela tira fotos de 37 bilhões de galáxias e estrelas ao longo de uma década.

A saída deste enorme telescópio irá inundar os pesquisadores com dados. Nesses 10 anos, a câmera LSST tirará 2.000 fotos para cada pedaço do Southern Sky que ele cobre. Cada imagem pode ter até um milhão de objetos.

"Em termos de escala dos dados, quantidade e complexidade dos dados, eles estão muito além de qualquer um dos conjuntos de dados atuais que temos", disse Rachel Mandelbaum, professora da Carnegie Mellon University e LSST Dark. Porta-voz da Energy Science Collaboration. "Isso abre uma enorme quantidade de espaço para descoberta".
Os cientistas não estão construindo a câmera LSST para tirar fotos bonitas. Eles querem identificar, categorizar e medir objetos celestes que podem revelar informações sobre a própria estrutura do universo. Compreender a energia escura e outros mistérios cosmológicos requer dados sobre supernovas e galáxias. Os pesquisadores podem até encontrar classes de objetos inteiramente novas.
"Haverá alguns objetos que nunca vimos antes, porque esse é o ponto de novas descobertas", disse Renée Hložek, professora assistente de astrofísica da Universidade de Toronto, que trabalha com a LSST Dark Energy Science Collaboration. "Vamos encontrar um monte do que chamamos de esquisitos, ou anomalias".
O grande volume e a estranheza dos dados dificultam a análise. Enquanto um iniciante em uma área pode sair em campo com um especialista local, os cientistas não têm um guia para novas peças do universo. Então, eles estão fazendo os seus próprios. Mais precisamente, eles estão criando muitos guias diferentes que podem ajudá-los a identificar e categorizar esses objetos. Os astrofísicos apoiados pelo DOE Office of Science estão desenvolvendo esses guias na forma de modelos de computador que dependem do  para examinar os dados do LSST. O aprendizado de máquina é um processo em que um programa de computador aprende com o tempo sobre os relacionamentos em um conjunto de dados.
Programas de computador que aprendem
O processamento de dados rapidamente é uma obrigação para os cientistas da Dark Energy Science Collaboration. Os cientistas precisam saber que a câmera está apontando exatamente para o lugar certo e recebendo os dados corretamente a cada vez. Esse processamento rápido também os ajuda a saber se alguma coisa mudou nessa parte do céu desde a última vez em que tiraram fotos. Subtrair a foto atual das anteriores mostra se há sinal de um  ou fenômeno celestial interessante.
Eles também precisam combinar muitas fotos de maneira precisa e utilizável. Este projeto está analisando as profundezas do universo para capturar imagens de algumas das mais fracas estrelas e galáxias. Também tirará fotos em condições atmosféricas abaixo do ideal. Para compensar, os cientistas precisam de programas que combinem imagens para melhorar a clareza.

O aprendizado de máquina pode enfrentar esses desafios, além de lidar com a enorme quantidade de dados. À medida que esses programas analisam mais dados, mais precisos eles se tornam. Assim como uma pessoa aprendendo a identificar uma constelação, ela obtém um melhor julgamento ao longo do tempo.
"Muitos cientistas consideram o aprendizado de máquina a opção mais promissora para classificar fontes com base em medições fotométricas (medições da intensidade da luz)", disse Eve Kovacs, física do Laboratório Nacional de Argonne, DOE.
Mas os programas de aprendizado de máquina precisam se ensinar antes que possam enfrentar uma pilha de novos dados. Existem duas maneiras principais de "treinar" um programa de aprendizado de máquina: sem supervisão e supervisão.
O aprendizado de máquina não supervisionado é como alguém que se ensina sobre estrelas apenas a partir de suas observações noturnas. O programa treina-se em dados não rotulados. Embora o aprendizado de máquina não supervisionado possa agrupar imagens e identificar discrepâncias, ele não pode categorizá-las sem um guia de algum tipo.
O aprendizado de máquina supervisionado é como um novato que depende de um guia. Os pesquisadores alimentam um conjunto massivo de dados rotulados com as classes de cada objeto. Ao examinar os dados repetidamente, o programa aprende a relação entre a observação e os rótulos. Essa técnica é especialmente útil para classificar objetos em grupos conhecidos.
Em alguns casos, os pesquisadores também fornecem ao programa um conjunto específico de recursos para procurar, como brilho, forma ou cor. Eles fornecem orientações sobre a importância de cada recurso ser comparado aos outros. Em outros programas, o programa de aprendizado de máquina descobre os recursos relevantes em si.
No entanto, a precisão do aprendizado de máquina supervisionado depende de um bom conjunto de treinamento, com toda a diversidade e variabilidade de um real. Para fotos da câmera LSST, essa variabilidade pode incluir faixas de satélites que se deslocam pelo céu. A rotulagem também deve ser extremamente precisa.
"Temos que colocar o máximo de física possível nos conjuntos de treinamento", disse Mandelbaum. "Não remove de nós o ônus de entender a física. Apenas a move para uma parte diferente do problema".
Marcadores de milha na estrada espacial
Alguns dos objetos mais interessantes do universo não permanecem por muito tempo. Objetos transitórios parecem muito claros, desaparecem por um período específico e depois ficam escuros. Supernovas - estrelas massivamente explodindo - são um tipo de objeto transitório. Objetos variáveis ​​mudam de brilho ao longo do tempo de maneira consistente. Certos tipos de ambos podem ser "  " , itens que os cientistas podem usar para medir a distância da Terra, como marcadores de milhas em uma interestadual. Essas velas padrão fornecem informações sobre o tamanho e a história do universo.
"Se você observar galáxias suficientes em uma determinada noite, é quase garantido que descobre uma supernova", disse Kovacs.
Para saber se uma supernova será útil como uma vela padrão ou não, os cientistas precisam saber que tipo é. As supernovas do tipo Ia podem ser velas padrão. Assim como o desenho da experiência pode dizer aos observadores de estrelas se eles estão olhando para Marte ou Vênus, um programa de computador pode usar seu treinamento para classificar uma supernova a partir de uma imagem.
"A pequena mosca na pomada em tudo isso é que as supernovas tipo Ia não são exatamente velas padrão. Elas têm uma certa variação", disse Kovacs. "Compreender essa variação ... na verdade está no cerne de fazer tudo isso funcionar."
Kovacs e seus colaboradores criaram um programa que usa as cores das supernovas para classificá-las em categorias. Anteriormente, os cientistas treinavam algoritmos de aprendizado de máquina fazendo com que comparassem o brilho de uma supernova específica ao longo do tempo com um modelo baseado na supernova do tipo Ia. Mas os programas provavelmente classificariam demais supernovas como o Tipo Ia. Sua equipe adotou uma abordagem diferente. Eles identificaram um conjunto de 17 características que caracterizam as curvas de luz (variação temporal da intensidade da luz) das supernovas. Usando um conjunto de treinamento de vários milhares de supernovas simuladas, eles foram capazes de obter classificações com altos níveis de precisão.
Descobrir a que distância os objetos cósmicos estão da Terra é outra área promissora para o aprendizado de máquina. Anteriormente, os cientistas contavam com telescópios espectroscópicos que usam fibra ótica para medir com precisão as distâncias desses objetos. Mas a câmera LSST vai encontrar mais de 1.000 objetos transitórios por noite. É demais para acompanhar o uso dessa técnica. Mandelbaum e sua equipe desenvolveram um programa de aprendizado de máquina que pode estimar essa distância com precisão apenas das fotos. Ele também pode adaptar e incorporar dados espectroscópicos, se estiverem disponíveis.
Mas as supernovas não são os únicos objetos que podem ser usados ​​como velas padrão. De fato, os astrofísicos costumam usar outros objetos para calibrar sua distância. Mandelbaum e sua equipe usaram o aprendizado de máquina para encontrar outras possíveis velas padrãoAo alimentar os dados do programa sobre muitas estrelas variáveis, eles descobriram que ele poderia criar e aplicar recursos que identificam uma boa vela padrão sem a necessidade de classificar a estrela primeiro. Ignorar essa etapa - que exige muitos dados categorizados e rotulados - simplificou o processo. Também ajudou a evitar vieses ou erros de classificação. O programa produziu uma amostra com estrelas que eram tão boas velas padrão quanto as Cefeidas, uma estrela variável útil, mas rara. Havia outro bônus - as estrelas em sua amostra eram geralmente mais brilhantes e fáceis de medir do que as cefeidas.
"O aprendizado de máquina ajuda você a descobrir esses espaços complicados porque os humanos têm dificuldade em pensar em mais de três dimensões", disse Kovacs.
Escolhendo e escolhendo no nível galáctico
Enquanto estrelas individuais podem revelar uma grande quantidade de informações, às vezes você precisa de uma galáxia inteira. Usando uma foto sozinha, é mais fácil descobrir a distância da galáxia hospedeira de uma supernova do que a própria supernova. Mas os cientistas devem escolher a galáxia hospedeira certa. No passado, eles fizeram essa correspondência manualmente. Mas a câmera LSST criará dados demais para os humanos manipularem.
Em um dos projetos de Kovac, a equipe científica desenvolveu um algoritmo que combinava a galáxia hospedeira com a supernova corretamente 90 a 92% do tempo. Não é preciso o suficiente. Mas o aprendizado de máquina veio em socorro . A equipe desenvolveu um  aprendizado de máquina para informar a probabilidade de uma classificação estar certa ou errada. Ele identificou sete a oito por cento da produção original como provavelmente errado. A remoção desses itens dos dados aumentou a precisão e facilitou o acompanhamento manual das fotos complicadas.
Tocando a mente coletiva
Para explorar ainda mais o poder do aprendizado de máquina, dois dos grupos científicos da LSST Camera encontraram uma maneira única de aproveitar a capacidade cerebral dos cientistas - eles fizeram um concurso . Em parceria com o Kaggle, um site para cientistas de dados, eles tiveram como alvo não astrônomos especializados em aprendizado de máquina para desenvolver programas para classificar dados futuros da câmera LSST.
"Se você fala apenas com as pessoas que conhece, perde a diversidade de pensamentos da comunidade em geral", disse Hložek, que liderou a competição. "Queríamos que as pessoas trabalhassem juntas para agrupar seus modelos e seus dados".
Eles queriam particularmente que os programas selecionassem tipos de objetos que os astrofísicos podem não ter visto antes. Eles deram ao grupo três milhões de objetos para classificar em 15 categorias, com o 15º sendo 'eu nunca vi isso antes'.
"Queremos nos preparar para abrir esse tipo de trabalho", disse Hložek. "Quais são as maneiras pelas quais a estranheza pode se manifestar?"
Mais de 1.300 concorrentes em 1.000 equipes participaram do desafio, que terminou em dezembro de 2018. Agora, os pesquisadores da LSST Camera estão classificando os códigos para combiná-los no melhor conjunto possível de programas.
Toda essa atividade está acontecendo anos antes de a câmera LSST ser ligada. Os programas de aprendizado de máquina certamente serão revelados ainda mais quando os dados começarem a fluir. Embora os computadores não possam olhar maravilhados para as estrelas, eles fornecerão cada vez mais informações sobre os  que nos inspiram tanta admiração.
Explorar mais


Mais informações: Para mais informações, visite  www.energy.gov/science


Fonte: Phys News / por Shannon Brescher Shea,  /27/02/2020 


 Obrigado pela sua visita e volte sempre!                      HélioR.M.Cabral (Economista, Escritor e Divulgador de conteúdos da Astronomia, Astrofísica, Astrobiologia e Climatologia).

Membro da Society for Science and the Public (SSP) e assinante de conteúdos científicos da NASA (National Aeronautics and Space Administration) e ESA (European Space Agency).

Participa do projeto S`Cool Ground Observation (Observações de Nuvens) que é integrado ao Projeto CERES (Clouds and Earth´s Radiant Energy System) administrado pela NASA.A partir de 2019, tornou-se membro da Sociedade Astronômica Brasileira (SAB), como astrônomo amador.

Participa também do projeto The Globe Program / NASA Globe Cloud, um Programa de Ciência e Educação Worldwide, que também tem o objetivo de monitorar o Clima em toda a Terra. Este projeto é patrocinado pela NASA e National Science Fundation (NSF), e apoiado pela National Oceanic and Atmospheric Administration (NOAA) e U.S Department of State.

Nenhum comentário:

Postar um comentário