Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Cosmologia observacional usando an´ alise, Notas de estudo de Química

Cosmologia

Tipologia: Notas de estudo

2010

Compartilhado em 19/09/2010

diogenes-junior-12
diogenes-junior-12 🇧🇷

4.9

(7)

298 documentos

Pré-visualização parcial do texto

Baixe Cosmologia observacional usando an´ alise e outras Notas de estudo em PDF para Química, somente na Docsity! COSMOLOGIA OBSERVACIONAL USANDO ANÁLISE BAYESIANA Ramón Giostri Campos Mestrado em F́ısica Universidade Federal do Esṕırito Santo Vitória - ES, 2008 COSMOLOGIA OBSERVACIONAL USANDO ANÁLISE BAYESIANA Ramón Giostri Campos Dissertação de Mestrado apresentada ao Pro- grama de Pós-graduação em F́ısica, da Uni- versidade Federal do Esṕırito Santo, como parte dos requisitos necessários à obtenção do t́ıtulo de Mestre em Ciências (F́ısica) Orientador: Olivier Piguet Universidade Federal do Esṕırito Santo Vitória - ES, 2008 Agradecimentos Por mais estranho que possa parecer, eu colocarei meus agradecimentos em ordem cronológica, já que não sou capaz de lista-lós em ordem de importância. Agradeço especialmente ao meu pai, por me mostrar que só se vai longe com trabalho duro. Agradeço ao prof. Eduardo Tonini, o seu exemplo fez com que eu escolhesse a área de f́ısica. Ao prof. Ennio Candotti, que me mostrou, ainda no prinćıpio da minha graduação, que ser f́ısico está além do mero trabalho com equações e experimentos, trata-se de observar atentamente e criticamente o mundo ao nosso redor. Agradeço especialmente o Ka-Tet que começou em 2002, amigos que não valem nada e divertidamente loucos. Enfim a parte caótica de minha segunda famı́lia. Agradeço especialmente a minha irmã Haney, apesar de toda a dor de cabeça que me dá, é sempre soĺıcita, compreensiva e adorável. Ao meu irmão Renan, pelo companheirismo e bom humor. Agradeço a minha famı́lia, por ter fé nas minhas escolhas e ter orado por mim. Particularmente a minha avó Dereci, por orar o suficiente por nós dois. Agradeço especialmente a meus professores ruins, por me mostrarem o que não devo fazer. Ao Bob Kane, criador do Batman, personagem que me mostrou que existe um poder maior que super força, super velocidade ou telepatia. O poder de nunca desistir. Ao Dragão Negro, que em um de seus devaneios filosóficos, disse “Não existe eu não consigo, existe eu não quero!”. Não apenas uma frase, mais uma filosofia de vida. Já que falei de filosofia de vida, agradeço ao Frank Duff, personagem de “Menina de Ouro”, que vive gritando na minha cabeça: “Descanse quando morrer!”. Agradeço a CAPES, pela bolsa concedida. v Agradeço ao projeto Pronex 2006, pelo fomento concedido em diversos momentos desse trabalho. Agradeço muito especialmente meus amigos Paulo e André, por me apoiarem e terem meu apoio, nas mais diversas e inusitadas empresas. Igualmente agradeço a parte quase sensata e semi racional da minha segunda famı́lia, Marcinha, Alice, Dayane e Andréia. Cada uma a seu jeito sempre me fizeram sorrir. Agradeço a todos os amigos que prometi uma butecada (ou uma visita) e nunca cumpri a promessa! Espero ter tempo para cumpri-las um dia. Agradeço também os meus vizinhos e amigos, que sempre acreditaram que eu não era apenas mais um rapaz latino americano. Agradeço muito especialmente ao professor Olivier Piguet, por acreditar em mim e no meu trabalho. Agradeço muito especialmente ao professor Roberto Colistete Jr., pelas horas e horas de tempo desprendidas a mim, pelas longas e exaustivas discussões acerca de tudo que se pode imaginar, poĺıtica, smartphones, computadores, cosmologia e estat́ıstica. E por insistir que “um aluno deve superar seu professor!”, algo deveras assustador dito por um perfeccionista. E desculpo-me com os que não acreditavam que eu fosse um cara sério, pelo menos no que diz respeito a trabalho, acho que vocês estavam enganados. vi Eṕıgrafe “É um erro capital teorizar antes de se ter todas as evidências.” Sherlock Holmes vii x Sumário Dedicatória ii Dedicatória iv Agradecimentos v Eṕıgrafe vii Resumo viii Abstract ix Sumário xiii Lista de Tabelas xvii Lista de Figuras xx 1 Introdução 1 2 Modelagem Estat́ıstica-Computacional 5 2.1 Estat́ıstica Bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.1.1 Introdução Histórica . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.1.2 Método Indutivo e Método Dedutivo em Estat́ıstica . . . . . . . . . 6 2.1.3 Lógica estendida e o teorema de Bayes . . . . . . . . . . . . . . . . . 8 2.1.4 Montagem da Verossimilhança . . . . . . . . . . . . . . . . . . . . . 12 2.1.5 Escolha dos a Priori . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.2 Ferramentas Bayesianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.2.1 Marginalização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.2.2 Estimação de Parâmetros . . . . . . . . . . . . . . . . . . . . . . . . 15 xi 2.2.3 Parâmetros Perturbadores . . . . . . . . . . . . . . . . . . . . . . . . 16 2.2.4 Teste de Hipóteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.2.5 Comparação de Modelos . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.3 Aspectos Computacionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.3.1 Estrutura de BETOC . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.3.2 Filosofia de BETOC . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 3 Cosmologia 31 3.1 Hipóteses de Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.1.1 Prinćıpio Cosmológico . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.1.2 Métrica de Fundo para o Universo . . . . . . . . . . . . . . . . . . . 32 3.1.3 Desvio para o Vermelho . . . . . . . . . . . . . . . . . . . . . . . . . 32 3.1.4 A Lei de Hubble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 3.2 Conteúdo do Universo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.3 Equação de Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.4 Universo Dinâmico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 4 Supernovas Tipo I a 41 4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.2 Observável . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.2.1 Supernovas do tipo Ia . . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.2.2 Módulo de distância . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 4.3 Estimador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.3.1 Distância de Luminosidade . . . . . . . . . . . . . . . . . . . . . . . 44 4.3.2 Introdução do Modelo Cosmológico Teórico . . . . . . . . . . . . . . 45 4.4 Probabilidade a Posteriori das Supernovas Gold . . . . . . . . . . . . . . . 45 4.4.1 Verossimilhança . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.4.2 Probabilidades a Priori . . . . . . . . . . . . . . . . . . . . . . . . . 46 4.5 Análise dos Modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 4.5.1 Pontos Comuns a Todos os Modelos . . . . . . . . . . . . . . . . . . 46 4.5.2 Constante Cosmológica - ΛCDM . . . . . . . . . . . . . . . . . . . . 48 4.5.3 Gás de Chaplygin - GC . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.5.4 Equação de Estado Constante . . . . . . . . . . . . . . . . . . . . . . 52 xii Lista de Tabelas 2.1 Representa as definições de probabilidade nos contexto clássico e Bayesiano . . . . . . . 6 2.2 Representa o tempo gasto um teste do software BETOC, na coluna Teste usamos a mesma notação da Representação Esquemática do BETOC (figura 2.5), o tempo é medido em segundos e χ2ObsData é o tempo da forma mais rápida de cálculo, não da mais elegante. O modelo de teste foi o ΛCDM com todos os parâmetros livres testado com supernovas. Os testes foram realizados em um computador Intel Core 2 Duo 6600 2.4 GHz, 2.0 GB RAM DDR2 667 MHz, WinXP SP2 . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.1 Representa a medição do H0, desde o trabalho inicial do próprio Hubble, até observações bastante atualizadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 4.1 Estimativas dos modelos cosmológicos teóricos da famı́lia gás de Chaplygin, usando super- novas do tipo Ia Gold. As incertezas são dadas pela região de credibilidade 95.4%. χ2N é o melhor ajuste de χ2 dividido pelo número de graus de liberdade. O domı́nio do melhor ajuste pode ser encontrado na tabela B.1 do apêndice B. H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0 (fator de escala hoje). . . . . . . . . . 50 4.2 Estimativas e domı́nio do melhor ajuste para a famı́lia w(z) = w0. As incertezas são dadas pela região de credibilidade de 95.4%. χN é o melhor ajuste de χ dividido pelo número de graus de liberdade. H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0 (fator de escala hoje). . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 xv 5.1 Estimativas do modelo cosmológico teórico ΛCDM , usando fgas com 42 aglomerados de galáxias (para ΛCDM com k=0 inclusive), a combinação fgas com 42 aglomerados de galáxias com SNeIa e fgas com 26 aglomerados de galáxias. As incertezas são dadas pela região de credibilidade de 95.4%. χN é o melhor ajuste de χ dividido pelo número de graus de liberdade. O domı́nio do melhor ajuste pode ser encontrado na tabela B.2 do apêndice B. H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0 (fator de escala hoje) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 5.2 Estimativas do modelo cosmológico teórico gás de Chaplygin usando fgas. As incertezas são dadas pela região de credibilidade de 95.4%. χ2N é o melhor ajuste de χ dividido pelo número de graus de liberdade. O domı́nio do melhor ajuste pode ser encontrado na tabela B.3 do apêndice B. H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0 (fator de escala hoje) . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 5.3 Estimativas do modelo cosmológico teórico gás de Chaplygin usando fgas combinado a SNeIa. As incertezas são dadas pela região de credibilidade de 95.4%. χ2N é o melhor ajuste de χ dividido pelo número de graus de liberdade. O domı́nio do melhor ajuste pode ser encontrado na tabela B.4 do apêndice B. H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0 (fator de escala hoje) . . . . . . . . . . . . . . 71 5.4 Estimativas do modelo cosmológico teórico w(z) = w0 usando fgas e a combinação fgas com SNeIa. As incertezas são dadas pela região de credibilidade de 95.4%. χN é o melhor ajuste de χ dividido pelo número de graus de liberdade. O domı́nio do melhor ajuste pode ser encontrado na tabela B.5 do apêndice B. H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0 (fator de escala hoje) . . . . . . . . . . . . . . 74 5.5 Estimativas e domı́nio do melhor ajuste para o modelo cosmológico teórico w(z) = w0 + w1 z z+1 . As incertezas são dadas pela região de credibilidade de 95.4%. χN é o melhor ajuste de χ dividido pelo número de graus de liberdade. H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0 (fator de escala hoje). . . . . . . . . . . 77 B.1 Domı́nio do melhor ajuste para o modelo cosmológico teórico de gás de Chapigyn, usando SNeIa. H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0 (fator de escala hoje). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 B.2 Domı́nio do melhor ajuste para o modelo cosmológico teórico ΛCDM , usando fgas com 42 aglomerados de galáxias (para ΛCDM com k=0 inclusive), a combinação fgas com 42 aglomerados de galáxias com SNeIa e fgas com 26 aglomerados de galáxias. H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0 (fator de escala hoje). . 94 xvi B.3 Domı́nio do melhor ajuste para o modelo cosmológico teórico de gás de Chapigyn, usando fgas. H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0 (fator de escala hoje). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 B.4 Domı́nio do melhor ajuste para o modelo cosmológico teórico de gás de Chapigyn, usando a combinação fgas com SNeIa. H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0 (fator de escala hoje). . . . . . . . . . . . . . . . . . . . 96 B.5 Domı́nio do melhor ajuste para o modelo cosmológico teórico w(z) = w0, usando fgas e a combinação fgas com SNeIa. H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0 (fator de escala hoje). . . . . . . . . . . . . . . . . . . . 97 B.6 Fator de Bayes relativos dos modelos ΛCDM , GC, GC com Ωm0 = 0, GC com k=0, w(z) = w0, w(z) = w0 com k=0, w(z) = w0 com o a priori BAO, w(z) = w0 + w1 z z+1 com o a priori BAO, usando SNeIa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 B.7 Fator de Bayes relativos dos modelos ΛCDM , GC, GC com Ωm0 = 0, GC com k=0, w(z) = w0, w(z) = w0 com k=0, w(z) = w0+w1 z z+1 com com k=0, usando fgas combinado a SNeIa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 D.1 Aqui H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0. . 102 xvii 5.2 Gráfico 2D dos parâmetros cosmológico ΩΛ e Ωm0 na figura a. ΩΛ e Ωm = Ωm0 + Ωb0 na figura b. Ambos no modelo ΛCDM . . . . . . . . . . . . . . . . . . . . . . . . . . 65 5.3 Gráfico 1D do parâmetro cosmológico Ωm0, no modelo de gás de Chaplygin. Os dados são fgas + SNeIa em preto, para SNeIa em laranja, para fgas em verde com traços-ponto. E o tracejado azul é o intervalo de confiança de 95.4% referente a curva preta . . . . . . . 67 5.4 Visão gráfica da melhora nas estimativas dos parâmetros Ωb e Ωc0 , no modelo gás de Chaplygin. Para SNeIa (castanho) e fgas (azul claro) temos a representação dos ńıveis de credibilidade 68.2% e 95.4%. Para a combinação dos dados temos a representação de 68.2% (vermelho), 95.4% (azul) e 99.7% (verde). . . . . . . . . . . . . . . . . . . . . 69 5.5 Gráfico 2D dos parâmetros cosmológico w0 e Ωm0 na figura a. w0 e Ωm = Ωm0 + Ωb0 na figura b. Ambos no modelo w(z) = w0. . . . . . . . . . . . . . . . . . . . . . . . . 73 5.6 Gráfico 1D do parâmetro cosmológico w1, no modelo w(z) = w0 + w1 zz+1 . Representamos os intervalos de confiança de 68.2% (vermelho), 95.4% (azul) e 99.7% (verde). . . . . . . 75 C.1 Probabilidade unidimensional dos 6 parâmetros intŕınsecos presentes na modelagem do fgas. O modelo de ensaio é o ΛCDM. . . . . . . . . . . . . . . . . . . . . . . . . . 99 D.1 Visualização da probabilidade bidimensional de w0 e Ωm0, no modelo cosmológico w(z) = w0. Para SNeIa puro temos os ńıveis de credibilidade 68.2%, 95.4%, 99.7% em casta- nho. Para SNeIa com o a priori BAO temos a representação de 1σ em vermelho, 68.2% (vermelho), 95.4% (azul) e 99.7% (verde). . . . . . . . . . . . . . . . . . . . . . . . 103 xx Caṕıtulo 1 Introdução A F́ısica é a ciência que trata dos componentes fundamentais do Universo, as forças que eles exercem, e os resultados destas forças. O termo vem do grego φνσις (physike), que significa natureza, pois nos seus primórdios ela estudava indistintamente muitos aspectos do mundo natural, ela era conhecimento calcado na observação. Hoje apesar de dividirmos a f́ısica em diversas partes, sua origem não é esquecida. Toda teoria que seja de fato f́ısica, está sujeita a testes observacionais. A mecânica celeste pós-Newtoniana é descrita pela Relatividade Geral (RG), que por sua vez tem uma equação mestre, a equação de Einstein de 1915. Na época de sua criação descrevia um universo estático, pois não haviam dados que comprovassem qualquer outra forma de universo. Tal feito podia ser descrito na Equação de Einstein por meio da inserção de uma constante, um artif́ıcio meramente matemático, chamado por Einstein de Constante Cosmológica. Entretanto surgiram dados na década seguinte, que culminaram com um trabalho de Hubble e Humason[1][2], onde é apresenta a lei de Hubble e afirma que, a velocidade de recessão de uma determinada galáxia é proporcional à sua distância em relação à Terra, mostrando dessa forma que o universo está em expansão. Frente a essas novas descobertas, Einstein revogou o uso da constante cosmológica. Essa foi a primeira vez em que a nova teoria de gravitação foi largamente influenciada por observações, mais não foi a única, destacaremos dois outros momentos. Primeiramente Fritz Zwicky em 1933, verificou que existe uma anomalia na dispersão das velocidades radiais de algumas galáxias pertencentes ao aglomerado de Coma. Tais anomalias basicamente indicavam que deve existir muito mais matéria no aglomerado do que é posśıvel detectar. Posteriormente, verificaram-se outras anomalias em outras escalas 1 2 CAPÍTULO 1. INTRODUÇÃO cosmológicas, explicáveis com a adição de massa ao sistema. Por não emitir radiação eletro- magnética, essa matéria foi chamada de matéria escura. Dados os ind́ıcios observacionais, um modelo cosmológico que vise descrever fielmente o universo obrigatoriamente deveria conter essa matéria escura. O segundo momento é ainda mais surpreendente, as observações de supernovas apre- sentadas entre 1997 e 1998[3][4], indicaram que o universo expande-se aceleradamente. Para reproduzir esse resultado no contexto de Relatividade Geral é necessário introduzir uma matéria exótica no universo, cuja principal caracteŕıstica é possuir pressão negativa. Histo- ricamente, a primeira solução encontrada, foi ressuscitar a constante cosmológica agora sob o nome de energia escura. Porém apesar da constante cosmológica ser a solução padrão para a cosmologia atual, não é a única solução posśıvel para esse elemento exótico do universo. Resumindo os fatos, as observações indicam quem nosso universo, quando descrito pela Relatividade Geral, deve ser composto não apenas por matéria que é posśıvel detectar diretamente. E em face a essa ignorância sobre o universo, surgiram diversos modelos cosmológicos distintos que se propões a descrever um universo provido de matéria escura e energia escura. E a decisão sobre qual modelo descreve mais fielmente nosso universo, pode ser obtida por análises estat́ısticas dos modelos cosmológicos em confronto com dados observacionais. Aqui entramos em cena, usando a sólida e bem fundamentada estat́ıstica Bayesiana e uma ferramenta computacional por nós desenvolvida. Testamos quatro modelos cosmológi- cos interessantes para a comunidade cient́ıfica, à luz de dois dados observacionais (amostra gold de supernovas Ia e a fração entre gás e massa de aglomerados de galáxias). Testamos a consistência dos próprios dados observacionais utilizados e ainda mostramos como podemos associar dados observacionais distintos no intuito de fazer predições mais acuradas. E para realizar esse labor procederemos no presente texto da seguinte forma: Caṕıtulo 2 - Exploraremos assuntos novos neste caṕıtulo, estat́ıstica Bayesiana interpre- tada como um sistema de lógica difusa e modelagem computacional, visando posteri- ormente aplicar essas ferramentas, na análise de modelos cosmológicos teóricos. Caṕıtulo 3 - Aqui abordaremos um assunto antigo, revisaremos a cosmologia vigente e mostraremos os elementos cosmológicos importantes para nossa modelagem f́ısica- estat́ıstica-computacional e nossos futuros resultados. Caṕıtulo 4 - Nesta parte faremos a modelagem e a simulação dos modelos cosmológicos Caṕıtulo 2 Modelagem Estat́ıstica-Computacional Neste caṕıtulo, mostraremos de forma objetiva, as ferramentas que subsidiam nosso trabalho. No que tange a estat́ıstica Bayesiana, essa é extensa, logo nos ateremos apenas aos tópicos que forem pertinentes a nosso trabalho atual. Muitas aplicações da estat́ıstica Bayesiana, podem ser conferidas no livro Bayesian Logical Data Analysis for the Physical Sciences[7], que é nossa principal referência. Por outro lado, a modelagem computacional, usando um software próprio escrito na linguagem do software Mathematica[8], caracteriza um resultado formidável de nosso trabalho. Porém não deve ser explorado a fundo no presente texto, pois o tornaria extremamento enfadonho, portanto apenas mostraremos a estrutura de nosso software de forma pictórica. Toda a documentação está dispońıvel no próprio software que é gratuito para download1[9]. 2.1 Estat́ıstica Bayesiana 2.1.1 Introdução Histórica Possivelmente a estat́ıstica Bayesiana, nasceu a partir dos questionamentos de James Bernoulli (1713), ao notar a diferença entre a lógica dedutiva utilizada na matemática, na análise de jogos de azar e a lógica indutiva empregada na maioria dos problemas do dia a dia. Para ele, a questão era como podemos usar a lógica dedutiva, bem conhecida desde Aristóteles, para nos ajudar a resolver problemas que exigissem racioćınio indutivo. A resposta a Bernoulli veio em um trabalho do Reverendo Thomas Bayes (1763), publicado 1Obedecendo as leis de direitos autorais 5 6 CAPÍTULO 2. MODELAGEM ESTATÍSTICA-COMPUTACIONAL postumamente. No entanto, a formulação atual dessas idéias veio com Pierre Simon Laplace (1774), que por volta de 1812, redescobriu por conta própria a idéia de Bayes e as utilizando em diversas áreas do conhecimento[10], como medicina, f́ısica e até jurisprudência. A t́ıtulo de exemplo, Laplace utilizou a teoria de probabilidades Bayesianas para estimar a massa de Saturno, utilizando a informação orbital de diversos observatórios e as leis f́ısicas, seu resultado foi tão bom que em mais de 150 anos de observações posteriores, só modificaram o valor estimado por Laplace em 0,63%. Apesar dos inúmeros sucessos obtidos por Laplace, os grandes matemáticos de seu tempo não achavam que fosse posśıvel essa teoria desenvolver-se sobre uma base matemática sólida. Entretanto no século passado, essa teoria foi reavivada por Jeffreys[11] e posterior- mente reinterpretada como uma extensão da lógica Aristotélica[12]. Dito com a linguagem bem simplista da lógica Booleana, as hipóteses posśıveis deixariam de ser verdadeiro ou falso (lógica Booleana) e passam a um mundo cont́ınuo (lógica Bayesiana), no qual cada hipótese tem um grau de verdade. Todas as operações da lógica são aplicáveis nesse novo contexto e formam um o sólido alicerce (lógica Aristotélica) para a teoria de Bayes, algo que os matemáticos do tempo de Laplace não foram capazes de ver. 2.1.2 Método Indutivo e Método Dedutivo em Estat́ıstica As diferenças entre a estat́ıstica clássica (ou freqüêntista) e a estat́ıstica Bayesiana, já começam na definição de probabilidade e evidentemente no uso da mesma. Formalismo Definição Clássica ou p(A) é a Freqüência relativa com que o evento A ocorre em uma repetição Frequêntista infinita de experimentos idênticos. “A” é uma variável aleatória. p(A|B) é um número real que mede a plausibilidade da proposição/hipótese A, Bayesiano dado (condicionado a) que seja verdadeira a informação representada pela proposição B. “A” é uma proposição lógica qualquer. Tabela 2.1: Representa as definições de probabilidade nos contexto clássico e Bayesiano A interpretação da probabilidade como uma frequência relativa de infinitos experimentos esbarra em problemas conceituais sérios. Entretanto o problema maior da estat́ıstica clás- 2.1. ESTATÍSTICA BAYESIANA 7 sica e a não separação dos fatos e valores. Esse comportamento não ocorre na estat́ıstica Bayesiana, onde fatos (dados) e valores (subjetivos) são bem delimitados. Os diagramas abaixo mostram com clareza o que desejamos evidenciar: Modelo Experimental  oo_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ Dados da Amostra // Racioćınio Indutivo // Inferência Estat́ıstica    Figura 2.1: Diagrama Clássico Modelo Experimental  oo_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ Dados da Amostra  Teorema de Bayes // Racioćınio Dedutivo // Inferência Estat́ıstica        Distribuição a priori OO Figura 2.2: Diagrama Bayesiano A explicação dos diagramas é bem esclarecedora, passa pela diferença que existe no pensa- mento dedutivo e no pensamento indutivo. Na lógica dedutiva, dada uma causa, é posśıvel predizer suas conseqüências. Esse é o tipo de lógica que se aplica na matemática, para se construir resultados complexos a partir de um conjunto limitado de axiomas. Por ou- tro lado, o pensamento indutivo observa as conseqüências e tenta predizer as causas mais prováveis. 10 CAPÍTULO 2. MODELAGEM ESTATÍSTICA-COMPUTACIONAL • p(D|Hi, I), é a probabilidade dos dados D (verossimilhança), se Hi e I são verdadeiros. • p(D|I) = ∑i p(Hi|I)p(D|Hi, I), pode ser interpretada como uma constante de nor- malização. • p(Hi|D, I), é a probabilidade a posteriori das hipóteses. Interpretando o teorema de Bayes, chegamos a seguinte conclusão, inserimos nossas hipó- teses prévias (Hi) e medimos o seu grau de verdade (p(Hi|I)), em seguida revisamos esse grau de verdade à luz dos dados (p(D|Hi, I)) usando o teorema de Bayes(2.3), gerando novos graus de verdade das hipóteses agora corrigidos(p(Hi|D, I)). É deveras curioso que a interpretação do teorema de Bayes dessa forma torna-o um modelo matemático para o processo de aprendizado com a experiência. Espaço Cont́ınuo Até aqui, lidamos com um espaço discreto de hipóteses. Porém se nossas hipóteses forem acerca de quantidades cont́ınuas, como massas, distâncias e outras quantidades f́ısicas, devemos propor hipóteses cont́ınuas. O espaço discreto ainda acarreta dificuldades naturais decorrente dos somatórios. A passagem a um limite cont́ınuo, é feita naturalmente sem qualquer perda de generalidade, nos trazendo apenas benef́ıcios. Essa passagem é feita da seguinte forma: Seja uma proposição qualquer H, acerca de um parâmetro que desejamos investigar e seja W uma proposição acerca do valor numérico de H estar em um intervalo [a, b]. A operação lógica que delimita essa operação é a operação “ou”, pois qualquer dos valores do intervalo é um valor válido. Então o que buscamos é a probabilidade da soma de todos os valores compreendidos no intervalo [a, b]: p(a < H < b|I) = p( b ∑ i=a Hi|I) . (2.4) O que desejamos em (2.4) é descobrir como proceder com o somatório. Para tanto usaremos 2.1. ESTATÍSTICA BAYESIANA 11 as operações lógicas. p(A + B|I) = 1 − p(A + B|I) = 1 − p(A,B|I) = 1 − p(A|I)p(B|A, I) = 1 − p(A|I)[1 − p(B|A, I)] = 1 − p(A|I) − p(A|I)p(B|A, I) = p(A|I) + p(A,B|I) = p(A|I) + p(B|I)p(B|A, I)) = p(A|I) + p(B|I)[1 − p(A|B, I)) = p(A|I) + p(B|I) − p(B|I)p(A|B, I) = p(A|I) + p(B|I) − p(A,B|I) . (2.5) Até aqui temos o resultado geral da regra da soma estendida, um resultado muito útil e poderoso. Todavia, temos uma passagem adicional para o nosso caso particular onde necessariamente A e B não ocorrem simultaneamente p(A,B|I)=0, logo: p(A + B|I) = p(A|I) + p(B|I) , (2.6) então vemos claramente que (2.4), associado a (2.6) nos fornece o seguinte resultado: p(a < H < b|I) = b ∑ i=a p(Hi|I) , (2.7) em um caso limite no qual existem infinitos pontos (limite cont́ınuo) entre a e b, os graus de verdade de H, serão medidos por p(H|I)dH, aqui p(H|I) é uma função de H chamada de função densidade de probabilidade, definida a partir dos conceitos de derivada: p(H|I) ≡ lim δh→0 p(h ≤ H < h + δh|I) δh . (2.8) Logo nossa proposição W, acerca do valor numérico de H estar em um intervalo [a, b], tem grau de verdade igual a: p(W |I) = ∫ b a p(H|I)dH , (2.9) evidentemente, para o caso de múltiplas hipóteses simultâneas, obedece a regra do produto, naturalmente recai nos conceitos de derivadas e integrais múltiplas: p(X,Y |I) = lim δx,δy→0 p(x ≤ X < x + δx, y ≤ Y < y + δy|I) δxδy , (2.10) p(WX ,WY |I) = ∫ △WX△WY p(X,Y |I)dXdY . (2.11) 12 CAPÍTULO 2. MODELAGEM ESTATÍSTICA-COMPUTACIONAL 2.1.4 Montagem da Verossimilhança A verossimilhança (em inglês likelihood) por se tratar de uma probabilidade, tem por obrigação ser real e positiva definida, por se tratar do elemento de ligação com os dados medidos, deve necessariamente conter as observações. Para a idéia básica para uma verossimilhança complexa, é tentar de quantificar os desvios entre os valores medidos experimentalmente (observáveis) e os valores preditos teoricamente (estimador). Essa quantificação pode ser feita por qualquer função matemática para quantificar desvios. Supondo que todas as observações são independentes, vemos que uma boa função matemática que descreve esses desvios é a função Gaussiana, vejamos sua modelagem. Seja um Di, uma determinada medida/observação, σ0i os erros sistemáticos da i-ésima observação de D. Definimos o estimador f(Hj|M, I). E dado a veracidade das proposições a priori(I) e do modelo teórico M. Medimos a verdade da medida Di (p(Di|Hj,M, I)) como: p(Di|Hj ,M, I) = Exp { −1 2 (f(Hj|M, I) − Di)2 σ20i } . (2.12) Agora caso tenhamos um conjunto de dados D, composto de diversos Di’s independentes, a probabilidade do conjunto deve respeitar a regra do produto. p(D|Hj,M, I) = p(D1,D2, . . . ,Dn|Hj ,M, I) = p(D1|Hj,M, I)p(D2|Hj,M, I) . . . p(Dn|Hj,M, I) = n ∏ i=1 Exp { −1 2 (f(Hj|M, I) − Di)2 σ20i } = Exp { −1 2 n ∑ i=1 (f(Hj|M, I) − Di)2 σ20i } , (2.13) geralmente, apenas por economia de notação, chamamos todo o argumento da exponencial de (2.13) de χ2v, assim a verossimilhança é escrita como p(D|Hj,M, I) = e− 1 2 χ2v , necessari- amente essa é uma probabilidade não normalizada, pois o processo de normalização pode ser longo, além de desnecessária, pois não influencia no resultado final. 2.1.5 Escolha dos a Priori A escolha da probabilidade a priori(p(Hi|I)), possui regras simples, a primeira é que todo a priori deve ser normalizado, essa regra é advinda da regra da soma básica (2.1). A segunda regra é que ele deve possuir todas as informações relevantes de nosso modelo antes de verificarmos os dados, limites hipotéticos por exemplo. 2.2. FERRAMENTAS BAYESIANAS 15 Estendendo essa idéia para o caso das proposições w e A serem cont́ınuas, temos a definição acima reescrita em termos das funções densidades de probabilidade: p(w|D, I) = ∫ p(w,A|D, I)dA , (2.21) onde p(w|D, I) é chamada de função densidade de probabilidade marginal a posteriori de w. Este é um resultado fundamental dentro de nossa teoria, tendo em vista que muitos problemas são solucionados mediante marginalização. 2.2.2 Estimação de Parâmetros Frequentemente, a parametrização de um modelo M possui mais de um parâmetro. Sendo a probabilidade a posteriori, o resultado fundamental obtido na estat́ıstica Bayesiana, esta deve ser trabalhada afim de nos mostrar resultados interessantes acerca dos parâmetros de um determinado modelo M. Tomemos primeiramente uma densidade de probabilidade a posteriori n-dimensional, p(H1, . . . ,Hn|M,D, I), esta tem Hn proposições que devem ser verdadeiras, condicionados a veracidade dos a prioris I, dos dados D e do próprio modelo M. Desejamos investigar apenas o que tange um único parâmetro Hi, para tanto devemos eliminar todos os outros parâmetros via marginalização, logo serão realizadas n-1 integrais, deixando de fora apenas o Hi: p(Hi|M,D, I) = ∫ 1 ∫ 2 . . . ∫ n p(H1,H2, . . . ,Hn|M,D, I)dH1dH2 . . . . (2.22) A função densidade de probabilidade a posteriori acumulada que é gerada, descreve apenas os graus de verdade da proposição Hi, e de posse dessa função podemos usa-la de diversas formas: • Valor Mais Provável - Os valores mais prováveis são obtidos com o estudo de pontos extremos da p(Hi|M,D, I). • Valor Médio - É obtido da seguinte forma < Hi >= ∫ H ′ip(H ′ i|M,D, I)dH ′i , aqui a integral é em todo o espaço do parâmetro Hi. • Região de Credibilidade - A região de credibilidade para uma função normalizada será C = ∫ R p(H ′ i|M,D, I)dH ′i (C é por exemplo 0.95, 95% de confiança). O cálculo dos limites da região de credibilidade (R) não é trivial e envolve a solução numérica da integral diversas vezes. Curiosamente essa ferramenta é equivalente ao intervalo de confiança da estat́ıstica clássica. 16 CAPÍTULO 2. MODELAGEM ESTATÍSTICA-COMPUTACIONAL 2.2.3 Parâmetros Perturbadores Historicamente, o nome“Parâmetros Perturbadores”é originário da estat́ıstica freqüên- tista, pois a metodologia geral da estat́ıstica clássica não os trata a contento, portanto são uma “pertubação” na inferência freqüêntista. Podemos citar nosso próprio trabalho como exemplo, na parametrização dos modelos de raios-x existem distinções claras entre parâmetros cosmológicos e parâmetros de calibra- ção do modelo. Evidentemente os parâmetros de calibração são menos interessantes que os parâmetros cosmológicos, portanto são tratados como parâmetros perturbadores. Começamos essa demonstração com a nossa densidade de probabilidade a posteriori n-dimensional, análoga a definida em 2.2.2, porém essa possui um subconjunto de propo- sições mais relevantes (Hl) e essas estudaremos em separado de outras proposições menos relevantes (Pm), p(H1,H2, . . . ,Hl, P1, P2, . . . Pm|M,D, I), evidentemente n=l+m. A eliminação de um parâmetros perturbador, passa primeiro pelo tratamento do mesmo como um parâmetro qualquer sem distinção. Obtida a densidade de probabilidade a posteriori, basta marginalizar os parâmetros perturbadores: p(H1, . . . ,Hn|M,D, I) = ∫ 1 ∫ 2 . . . ∫ m p(H1, . . . ,Hn, P1, . . . Pm|M,D, I)dP1dP2 . . . . (2.23) O uso da marginalização na eliminação de parâmetros perturbadores é uma das maiores vantagens técnicas da inferência Bayesiana em relação a inferência freqüêntista padrão, por permitir o tratamento de modelos com elevado número de parâmetros e os mais diferentes comportamentos. 2.2.4 Teste de Hipóteses O teste de hipótese, é uma proposição (W) acerca do valor numérico de outras propo- sições(H’s) cont́ınuas. Boa parte do que foi discutido em 2.1.3, pode ser aplicado ao teste de hipóteses. Portanto, partindo da equação (2.9) e de duas modalidades iniciais de hipóteses unidimensionais, vejamos a que conclusões chegaremos: 1. W → H < C, onde C é um valor numérico e o ńıvel de verdade será: p(W |D, I) = ∫ H<C p(H|D, I)dH . (2.24) Se p(H|I) é a função densidade de probabilidade a posteriori normalizada, não existe qualquer segredo nesta técnica e evidentemente ela funciona para H > C e H1 +H2 < C, apenas tomando o cuidado de integrar na região correta. 2.2. FERRAMENTAS BAYESIANAS 17 2. W → H 6= C. O problema está justamente em delimitar a região correta de integra- ção. Pois temos um ponto e (2.9) necessita de dois pontos por ser unidimensional. Ao passo que (2.11) necessita de um conjunto de pontos por ser multidimensional. Para solucionar nosso problema, devemos entender a proposição W por completo, ela diz qual as chances de H 6= C, ou seja quais valores de H são mais prováveis que o valor fixo C, o gráfico a seguir é esclarecedor: Portanto devemos encontrar qual valor C C¢ C C¢ Hi FD P Hipótese Hi¹C Figura 2.4: Função densidade de probabilidade a posteriori (FDP) da proposição H , a parte escura é a região a ser integrada e sua área é numericamente igual a grau de verdade da proposição W. C’, equiprovável a C, p(C’|D,I)=p(C|D,I). Para tanto devemos encontrar os zeros da equação p(H|D, I) − p(C|D, I) = 0, feito isso basta integrar no intervalo: p(W |D, I) = ∫ C′ C p(H|D, I)dH . (2.25) Para o caso de W → (H1 6= C1,H2 6= C2), ou seja uma proposição multidimensional, seguimos a mesma idéia: p(W |I) = ∫ R p(H1,H2|D, I)dH1dH2 , (2.26) onde R é a região delimitada por todos os valores de H1 e H2 mais prováveis que a C1 e C2, p(H1,H2|D, I) ≥ p(C1, C2|D, I). 2.2.5 Comparação de Modelos Em nosso trabalho comparamos modelos de duas formas. A primeira pontual, que venha ser a maximização da densidade de probabilidade a posteriori e a segunda global conhecida como Fator de Bayes. 20 CAPÍTULO 2. MODELAGEM ESTATÍSTICA-COMPUTACIONAL que usando a equação (2.27), teremos: Oij = p(Mi|I) p(Mj|I) p(D|Mi, I) p(D|Mj , I) , (2.32) onde o quociente dos a prioris de vantagem (chamado de razão de vantagem a priori), é igual a unidade p(Mi|I)p(Mj |I) = 1, visto que a a priori os modelos são equiprováveis. Todavia, o quociente das probabilidades globais (razão de probabilidade global) nos fornecerá as infor- mações acerca da vantagem ou desvantagem do modelo Mi em relação ao Mj , chamamos esse quociente de fator de Bayes: Bij = p(D|Mi, I) p(D|Mj , I) . (2.33) Vemos então, que o fator de Bayes é numericamente igual a razão de vantagem do modelo Mi em relação ao modelo Mj , sendo este último a quantificação do quanto o modelo Mi é mais provável que o modelo Mj. 2.3 Aspectos Computacionais Introdução Como vimos na seção anterior, a teoria Bayesiana é elegante e matematicamente consistente. Porém dado o elevado número de integrais a serem feitas ela necessariamente está ligada a técnicas computacionais. Entretanto, a integração é apenas um dos problemas que podem ser encontrados, e nas próximas páginas mostraremos como o nosso software, faz uso de diversos paradigmas de programação, lidando de forma integrada e elegante com esses problemas, sejam eles oriundos da inferência Bayesiana ou provenientes de outras fontes, como técnicas de visualização ou mesmo o cálculo da função densidade de probabilidade a posteriori n-dimensional. 2.3.1 Estrutura de BETOC BETOC é uma abreviação para o software“BayEsian Tools for Observational Cosmo- logy”. Escrito na Linguagem de programação Mathematica3, BETOC é uma ferramenta polivalente na modelagem f́ısico-computacional que visa integrar Estat́ıstica Bayesiana e Cosmologia Observacional. Atualmente possui três variantes de dados bem testados, su- pernovas tipo Ia do conjunto Gold (BETOCS[17]), raios-X da fração de massa e gás de 3Wolfram Research - www.wolfram.com/mathematica/ 2.3. ASPECTOS COMPUTACIONAIS 21 aglomerados de galáxias (BETOCX[18]) e um h́ıbrido das anteriores (BETOCSX). Sua es- trutura básica é distribúıda em células, cada célula possui sub-células, e nessas temos o código propriamente dito, todo ele documentado. Vejamos o seguinte diagrama, que é a representação esquemática do software BETOC:    Init  %%yy    Definitions // **     χ2ObsData      BayesToolsLib tt    PDFnDimCalc  &&xx &&    MaxPDFnDim     3DimPDF     OneDimIntPar     OutputFile    2DimPDF 33 //   OneDimPDF OO Figura 2.5: Representação Esquemática do BETOC Explicaremos a seguir o diagrama4, traçando um paralelo sempre que posśıvel com as seções pertinentes da modelagem estat́ıstica. Inicialização - Init É um preâmbulo no qual são definidos os pacotes necessários para o funcionamento do software, definido o diretório de trabalho, colhida informações iniciais de tempo e memória utilizada e desabilitada inúmeras mensagens (Off[mensagem]) de verificação do Mathema- tica (isso é importante para não sobrecarregar o Frontend do Mathematica). Definições - Definitions Essa é a célula mais mutante de todo o software. Nela se define o número de parâme- tros independentes tratados, cada nome de variável, todas formas dos arquivos de sáıda, é inserido o modelo cosmológico teórico, inserida a dispersão teórica, as proposições a priori, 4Apenas a caixa OutputFile não será explicado por se tratar meramente dos arquivos salvos pelo software 22 CAPÍTULO 2. MODELAGEM ESTATÍSTICA-COMPUTACIONAL as distribuições a priori diferente do a priori uniforme e as quantidades dependentes dos parâmetros do modelo teórico. Aqui também começamos a entender a estratégia de integração que será utilizada futuramente nas marginalizações, pois definimos o número de subdivisões de cada parâ- metro independente. Esse número de subdivisões é um dos pontos chave da nossa técnica de integração numérica. Outra curiosidade sobre essas subdivisões é que elas revelam as extensões operacionais da análise, pois a multiplicação de todas as subdivisões, nos fornece o número total de pontos analisados em cada modelo. Este em geral é da ordem de milhões para os modelos/dados mais simples e de alguns bilhões de pontos para os modelos/dados mais selvagens. Cálculo do χ2 para os Dados - χ2ObsData É fato que nem sempre a forma mais elegante e leǵıvel de implementar um código com- putacional, é a forma mais eficiente de resolver o problema proposto. Uma boa estratégia se faz necessária nesse caso. Esta célula conta com diversos paradigmas de programação, que viabilizarão o cálculo da função densidade de probabilidade n-dimensional de forma rápida e bem testada5. São três filosofias de programação concatenadas, visando o cálculo do produto maior da análise Bayesiana, esse código pode ser conferido no Apêndice A. Além disso, este é o local onde fazemos a chamada dos dados observacionais. Vemos o valor de cada grandeza medida, inclusive graficamente. Por conta dessas duas caracteŕıs- ticas, essa é uma célula que possui ampla dependência do dado observacional utilizado. Biblioteca de Ferramentas Bayesianas - BayesToolsLib Contém a parte mais importante e estática do software. Definimos, documentamos e protegemos todas as funções de constrúıdas para manipulação de dados, marginalização de probabilidades, rotinas de visualização, maximização de probabilidade e análise estat́ıstica. Essa é a célula mais genérica de todo o software, possui uma extensa aplicabilidade e todas as idéias contidas aqui são independentes de modelos teóricos, dados ou área do conhecimento. Não prolongaremos a discussão das funções inseridas nessa célula, pois as discutiremos nas células posteriores, onde as funções definidas aqui serão efetivamente usadas. 5Essencialmente verifica se o cálculo da χ2 na forma mais otimizada é igual ao da forma mais leǵıvel e segura 2.3. ASPECTOS COMPUTACIONAIS 25 (a) Gráfico 3D dos parâmetros cosmológi- cos densidade de matéria bariônica (Ωb0), densidade de matéria escura fria (Ωm0) e densidade de energia escura(ΩΛ), usando gás colorido. Do azul para o vermelho é o aumento da probabilidade. (b) Gráfico 2D de uma fatia de ńıvel dos parâmetros cosmológicos densidade de ma- téria bariônica (Ωb0) e densidade de ener- gia escura(ΩΛ) no modelo ΛCDM , em preto a região de maior probabilidade. A densidade de matéria escura fria (Ωm0) é variada de forma discreta, possibilitando uma análise visual do deslocamento da re- gião de maior probabilidade com a variação de Ωm0. Figura 2.6: Em ambos os gráficos o modelo cosmológico utilizado é o ΛCDM Análise Bidimensional - 2DimPDF É análoga a célula anterior só que em duas dimensões. Necessita de pouqúıssima in- tervenção do usuário e é capaz de gerar quase que instantaneamente os gráficos de contorno, ver figura 2.7-a. Esses gráficos funcionam como um filtro grosso para a delimitação dos a prioris do modelo teórico. Aqui mais informações podem ser obtidas usando o cálculo/visualização da região de credibilidade bidimensional (figura 2.7-b), pontos de máximo de probabilidade marginal bidimensional e teste de hipóteses para dois parâmetros simultâneos. 26 CAPÍTULO 2. MODELAGEM ESTATÍSTICA-COMPUTACIONAL (a) Densidade de probabilidade, em vermelho a região de maior probabilidade. (b) Densidade de probabilidade com intervalos de credibilidade de 68.2% (vermelho), 95.4% (azul) e 99.7% (verde). Figura 2.7: Em ambos os gráficos o modelo cosmológico utilizado é o ΛCDM Análise Unidimensional - OneDimPDF Aqui fazemos toda a estimação de parâmetros 2.2.2, teste de hipóteses, ńıveis de cre- dibilidade, localização dos máximos probabilidade marginal de cada parâmetro do modelo cosmológico, geramos e exportamos gráficos. Calculamos a probabilidade global do modelo M, peça central na comparação de modelos via fator de Bayes 2.2.5. Fazemos uma análise rigorosa dos parâmetros de perturbadores, parâmetros depen- dentes calculados previamente e H0, ao usarmos a probabilidade desses parâmetros gerada em 2.3.1. É posśıvel ainda analisar, o comportamento dos parâmetros dependentes calcu- lados nesse momento. Todos esses parâmetros adicionais possuem os mesmos privilégios dos parâmetros do modelo cosmológico, no que tange o cálculo/visualização (figura 2.8) dos ńıveis de credibilidade, teste de hipóteses e etc. As funções definidas na seção 2.3.1, não possuem qualquer preconceito quanto a origens dos parâmetros, desde que ele tenha uma probabilidade definida. 2.3. ASPECTOS COMPUTACIONAIS 27 60 61 62 63 64 65 66 67 H0 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 p PDF for LCDM with Wbh 2 and HST priors Figura 2.8: Gráfico da probabilidade 1D do parâmetro cosmológico H0, no modelo ΛCDM e com os dado observacional SNeIa. O ponto preto é o ponto onde a probabilidade marginal de H0 é máxima e as as curvas nas cores vermelha, azul e verde, são respectivamente os intervalos de credibilidade de 68.2% (vermelho), 95.4% (azul) e 99.7% (verde). 2.3.2 Filosofia de BETOC A Filosofia do BETOC é baseada na diversidade oferecida pela linguagem de fundo, o Mathematica. Este por se tratar de uma ferramenta polivalente e bem integrada, oferece a BETOC um universo de possibilidades do ponto de vista de programação. Um todo coeso no qual todas as partes interagem harmonicamente. De cada escolha de procedimento tentamos extrair o máximo. Por exemplo, ao se optar por um espaço amostral com subdivisões não adaptativas, ganhou-se uma forma de estimar parâmetros que foram marginalizados. Uma forma aproximada, mais dinâmica e eficiente. Outro exemplo, é usar dentro de uma única função computacional complexa diversos paradigmas de programação, por cada paradigma ser mais eficiente em determinada situa- ção. Na seção 2.3.1 anunciamos uma função computacional complexa, implementada com programação baseada em listas, estrutural, funcional e procedural, nas formas interpretada e compilada. Os ganhos de tempo e funcionalidade, foram tão surpreendentes que são um resultado importante do nosso trabalho. Tais ganhos podem ser conferidos nas tabelas e gráficos abaixo: 30 CAPÍTULO 2. MODELAGEM ESTATÍSTICA-COMPUTACIONAL Por outro lado, um usuário que queira explorar outros pontos dentro do software, encontra muitas possibilidades. Seja a implementação de outras estratégias de integração numérica, implementação de novos paradigmas de programação, o uso do famoso Monte- Carlo com Cadeias de Markov (em inglês Markov Chain Monte-Carlo MCMC), Mathlink com C++ ou programação em paralelo são apenas alguns dos exemplos mais óbvios. Cada nova idéia possui vantagens e desvantagens, que devem ser levadas em consideração antes de sua total implementação. Caṕıtulo 3 Cosmologia Em uma visão bastante simplista a cosmologia em sua essência busca uma equação que descreva a dinâmica do universo, um modelo cosmológico, que nada mais seria que algo análogo a equação de movimento em mecânica. Buscamos tanto em mecânica quanto em cosmologia, uma equação que descreva com fidelidade um sistema f́ısico, suas componentes e principalmente buscamos predizer algo do sistema com essa equação obtida. 3.1 Hipóteses de Trabalho O tratamento matemático dado a cosmologia se assemelha ao da mecânica, pois se na mecânica anaĺıtica partindo de algumas hipóteses iniciais, usamos um procedimento sistêmico e chegamos nas equações diferenciais de movimento. Em cosmologia também se pode usar essa abordagem. Seguindo a sóbria descrição contida no livro Cosmology de P. Coles[20], na cosmologia padrão as hipóteses de trabalho são: O prinćıpio cosmológico, a lei de Hubble, o desvio para o vermelho, o conteúdo do universo e a equação de Einstein. 3.1.1 Prinćıpio Cosmológico A distribuição de massa e radiação do Universo observável é homogênea e isotrópica em larga escala. Esse é o mais sólido das hipóteses de trabalho, por possuir uma forte base observacional. Entretanto essa hipótese pode ser contestada[20][21], porém cosmologias alternativas não são nosso enfoque atual. Logo não duvidando da veracidade do que aqui foi descrito, essa hipótese tem os desdobramentos importantes para nossa discussão. 31 32 CAPÍTULO 3. COSMOLOGIA 3.1.2 Métrica de Fundo para o Universo A métrica de fundo mais comumente utilizada, possui contribuições de vários perso- nagens da f́ısica do século XX, é a métrica Friedmann-Lemaitre-Robertson-Walker (FLRW), sua dedução na época foi calcada exclusivamente no prinćıpio cosmológico e em considera- ções geométricas[22]. O resultado final foi: ds2 = dt2 − a(t)2[ 1 (1 + kr2) dr2 + r2 ( dθ2 + sen2θdϕ2 ) ] . (3.1) Aqui k é o parâmetro de curvatura do espaço na métrica FLRW, que pode assumir valores positivos ou 0 ou negativos, respectivamente para um universo com seção espacial fechada, plana, aberta. E a(t) é o fator de escala, sendo t o tempo cósmico. É conveniente escrever a métrica FLRW na forma normalizada: ds2 = dt2 − a(t)2[dρ2 + f2k (ρ) ( dθ2 + sen2θdϕ2 ) ] . (3.2) Onde f+(ρ) = sen(ρ), f0(ρ) = ρ, f−(ρ) = senh(ρ). 3.1.3 Desvio para o Vermelho No prinćıpio do século XX, Vesto Slipher, realizou a medição da velocidade de ne- bulosas e aglomerado de estrelas. Vesto mostrou que esses objetos movimentavam-se mais rápido que qualquer outro objeto celeste conhecido e revelou que existia uma diferença en- tre a freqüência da radiação medida pelo observador na Terra(λ0) e o que se esperava ser emitido da fonte (λe), em face ao material qúımico que compõe a fonte. A única explicação posśıvel para o desvio da freqüência medida, é provocado por efeito Doppler, oriundo do movimento entre a fonte e o observador. E o desvio espectral devido a esse efeito pode ser mensurado da seguinte forma: z = λ0 − λe λe . (3.3) Desejamos escrever a expressão anterior em quantidades presentes na métrica. Portanto, consideremos um observador na origem do sistema de coordenadas e uma onda eletromag- nética, proveniente de um observável distantes, viajando até o observador. Como a luz segue uma geodésica nula, temos: dt2 − a2(t) dr 2 (1 − kr2) = 0. . (3.4) Integrando na distância entre o raio emitido e o recebido, e no tempo correspondente temos: ∫ t0 t1 dt a(t) = ∫ r1 0 dr (1 − kr2) 12 . (3.5) 3.2. CONTEÚDO DO UNIVERSO 35 Data Fonte Observável H0( km Mpc.s) 1931 Hubble & Humason[1][2] Galáxias 550 1960-70 Sandage[21] Galáxias (50,130) 2001 HST Project supernovas 72±8 2006 Chandra X-ray Center Raios-X de aglomerado de galáxias 77±15% 2006 WMAP team Radiação cósmica de fundo 73±3 Tabela 3.1: Representa a medição do H0, desde o trabalho inicial do próprio Hubble, até observações bastante atualizadas. 3.2 Conteúdo do Universo Na descrição do conteúdo do universo, idealizaremos um universo composto por vários fluidos perfeitos, independentes, não interagentes e desprovidos de viscosidade. Nesses termos o tensor momento-energia descrito por um observador instantâneo (uµ = (1, 0, 0, 0)) que, assim como o fluido, se move apenas devido a expansão do universo, será caracterizado da seguinte forma em termos das densidades (ρ) e pressões (p) dos fluidos: T µν = (ρ + p)uµuν − pgµν . (3.19) Segue da lei de conservação da energia (T µν;ν)=0, que a parte temporal dessa equação resulta em: ρ̇ + 3 ȧ a (ρ + p) = 0 . (3.20) Tendo em vista que consideramos aqui fluidos ideais independentes e não interagentes, ρ = ∑ i ρi, podemos reescrever (3.20), agora para cada componente separadamente. ρ̇i + 3 ȧ a (ρi + pi) , (3.21) Definimos que correlaciona a pressão e a densidade de cada fluido, podendo essa equação inclusive ser dependente do tempo. A ela chamamos de equação de estado. wi = pi ρi . (3.22) Evidentemente, diferentes equações de estado nos fornecem diferentes fluidos e por conse- guinte modelos cosmológicos distintos, mas ainda sim sujeitos aos mesmos testes observa- cionais e que almejam explicar os mesmos fenômenos. A t́ıtulo de exemplo, alguns componentes posśıveis do universo e suas equações de estado. Ordinários: 36 CAPÍTULO 3. COSMOLOGIA • Matéria escura e bariônica: w = 0 • Radiação: w = 13 Exóticos (candidatos a energia escura): • Constante Cosmológica[23]: w = −1 • Gás de Chaplygin[24, 25, 26, 27]: w(a) = − Ā Ā+(1−Ā)a−6 • Equação de estado variável expandida em série[28]: w(a) =∑∞i=0 wiai Os componentes ordinários podem coexistir no universo em maior ou menor quantidade, de- pendendo da idade do universo analisado. Porém os exóticos são todos candidatos posśıveis ao quinto elemento do universo, a energia escura. É um dos objetivos de cosmologia obser- vacional, estimar as quantidades de matéria ordinária que compõem o universo e descobrir um bom candidato a energia escura. Usando a equação de estado (3.22) em (3.21) temos: ρ̇i + 3ρi ȧ a (1 + wi(a)) = 0 . (3.23) Em face a esse resultado, nada mais natural que resolver a equação diferencial acima e encontrar as densidades em termos do fator de escala, ou mais comumente em termos do desvio para o vermelho: ρi(z) = ρ0e R z 0 3 1+wi(z ′) 1+z′ dz′ . (3.24) Alguns exemplos ilustrativos: Ordinários: • Matéria escura, bariônica: ρm = ρm0(1 + z)3 • Radiação: ρr = ρr0(1 + z)4 Exóticos: • Constante Cosmológica: ρΛ(z) = ρΛ • Gás de Chaplygin: ρc(z) = ρc0 √ A + (1 − A)(1 + z)6 • Equação de estado constante w(z) = w0[6, 29, 28]: ρx(z) = ρx0(1 + z)3(1+w0) • Equação de estado variável de Linder[29, 28, 30, 31]: ρx(z) = ρx0(1+z)3(1+w0+w1)e−w1 3z (1+z) 3.3. EQUAÇÃO DE EINSTEIN 37 O modelo cosmológico provido de Gás de Chaplygin (GC), é um modelo que visa a uni- ficação da matéria e energia escura. Além disso GC possui um caráter mutante conforme a fase do universo, apresentando um comportamento t́ıpico de matéria ordinária quando o universo era mais jovem (z ≫ 1) e comportando-se como energia escura no universo atual (z ≈ 1). A partir do GC criou-se toda uma famı́lia de modelos unificadores chamados de Quartessência[26], em geral todos os modelos dessa famı́lia possuem um parâmetro em comum Ā, limitado superiormente em −1. No nosso caso particular Gás de Chaplygin tradicional Ā relaciona-se com a pressão e a densidade da seguinte forma p = − Āρ . A equação de estado constante é o resultado da equação de estado variável expandida em séries do fator de escala, com a série truncada no termo constante (w0). E a equação de estado variável de Linder, proposta anteriormente por CChevallier e Polarski[32], é oriunda da parametrização w(a) = w0 + w1(1 − a). 3.3 Equação de Einstein Outra hipótese de trabalho é a equação de Einstein, Gµν = Rµν − 1 2 gµνR = 8πGTµν , (3.25) onde Gµν é o tensor de Einstein, Rµν é o tensor de Ricci, R o escalar de Ricci, Tµν o tensor momento, gµν é a métrica de fundo e G a constate gravitacional. Caso a métrica de fundo seja a FLRW, a equação de Einstein é a equação que des- creve a evolução temporal do fator de escala do universo (a(t)). Como Tµν foi descrito anteriormente, devemos escrevendo o lado esquerdo da equação de Einstein em termos das componentes da métrica FLRW, temos: R00 = −3 ä a , (3.26) Rij = − [ ä a + 2 ȧ2 a2 + 2k a2 ] gij , (3.27) R0j = 0 , (3.28) R = −6 [ ä a + ȧ2 a2 + k a2 ] , (3.29) Juntando essas informações as obtidas na definição de Tµν , podemos descrever a dinâmica do Universo.. 40 CAPÍTULO 3. COSMOLOGIA Caṕıtulo 4 Supernovas Tipo I a 4.1 Introdução Desse momento em diante, exploraremos os experimentos e simulações com super- novas. Trabalhamos com a amostra Gold[5] de Supernovas Ia, essa amostra foi coletada de diversos experimentos e compilado pelo grupo de Riess et al, grupo que historicamente predisse que o universo expande-se aceleradamente, ver caṕıtulo 1. Seguimos como referên- cia, um trabalho de 2006 do próprio Riess et al[5] que conta com 182 supernovas. Vejamos agora os detalhes pertinentes para nosso trabalho. 4.2 Observável 4.2.1 Supernovas do tipo Ia A supernova ocorre na fase final da evolução de estrelas com massa superior a 1.4 massas solares. Uma supernova pode aumentar a luminosidade da estrela que a gerou em até 1010 vezes a luminosidade do sol. Rapidamente atinge seu brilho máximo e este decresce lentamente durante alguns meses. Boa parte desse tempo a intensidade luminosa da supernova rivaliza com a luminosidade de galáxias. No nosso caso particular das supernovas tipo Ia (SNeIa), está tem sua origem em sistemas binários de estrelas, cujas massas são da ordem da massa solar. Para entender o processo que gera uma supernova tipo Ia, consideremos a t́ıtulo de exemplo uma estrela cuja massa seja da ordem de uma massa solar. Em linha gerais uma estrela é um corpo celeste luminoso formado de plasma. Graças a sua elevada massa, a pressão em seu interior é suficiente para realizar o processo de fusão 41 42 CAPÍTULO 4. SUPERNOVAS TIPO I A nuclear, transformando moléculas de hidrogênio em hélio. A energia liberada pela fusão nuclear mantem a estabilidade da estrela. O final da fase evolutiva de uma estrela se dá quanto a maior parte do hidrogênio já foi convertido em hélio e nesse estágio evolutivo o da estrela núcleo da começa a contrair-se pela ação gravitacional, suas camadas externar são expandidas e a estrela torna-se o que chamamos de gigante vermelha. Quando o núcleo da gigante vermelha atinge certo limite de contração, a pressão torna-se suficiente para fundir hélio em elementos mais pesados como carbono e oxigênio, nesse estágio evolutivo, a estrela desprende suas camas mais externas e torna-se uma anã branca. Agora suponhamos um sistema binário, formado por estrelas cujas massas sejam da ordem de uma massa solar. Uma delas já atingiu o estágio de anã branca e a companheira encontra-se no estágio de gigante vermelha. A camada exterior da gigante vermelha é atráıda gravitacionalmente pela anã branca, que ao absorver a massa da companheira atinge a massa de 1.4 massas solares e explode. A essa explosão chamamos de supernova do tipo Ia (SNeIa). As supernova tipo Ia são especiais pois possuem caracteŕısticas de luminosidade muito semelhantes e mediante o tratamento adequado cada SNeIa é uma vela padrão. E como vimos, buscamos medidas astronômicas padronizadas para fazermos nossas análises estat́ıs- ticas. Da luminosidade das SNeIa que chega até nós, podemos retirar as seguintes informa- ções pertinentes, µ0, σµ0 e z, sendo esses respectivamente, o módulo de distância, a dispersão do módulo de distância e desvio para o vermelho. Sobre a natureza dessas medidas, vale a pena nos aprofundarmos apenas no que venha a ser o módulo de distância que é nosso observável estat́ıstico. Sobre as outras medidas, basta dizer que o desvio para o vermelho foi discutido anteriormente na seção3.1.3 e a dispersão do módulo de distância é a incerteza da medida propriamente dita. 4.2.2 Módulo de distância Escalas de Magnitudes : A mais de 2000 anos, a astronomia óptica cataloga o brilho das estrelas. Sabemos que a escala de fluxo luminoso captada pelo olho humano, pode ser descrita usando logaritmos dos fluxos de radiação luminosa, da mesma forma como é feito para a escala sonora. Então, o que fazemos é uma escala de magnitudes relativas. Na astronomia contemporânea contamos com modernos telescópios ópticos, 4.4. PROBABILIDADE A POSTERIORI DAS SUPERNOVAS GOLD 45 4.3.2 Introdução do Modelo Cosmológico Teórico A conexão do estimador com o modelo cosmológico teórico é feita examinando a integral temporal em (4.7): η = ∫ t0 t dt′ a(t′) = ∫ a0 a da′ ȧ′a′ = ∫ a0 a da′ H(a′)a′2 , (4.10) fazendo z + 1 = a0a , temos dz = a0 a2 da, assim: η = ∫ z 0 a0 dz′ H(z′) , (4.11) onde H(z) é o parâmetro de Hubble descrito na seção 3.4 pela pela equação de Friedmann. E a forma final do estimador é obtida ao se substituir (4.9)(4.11) em (4.4), aqui já colocaremos no formato de trabalho, com a dependência das densidades relativas (Ω) e o fator de escala hoje (a0) é feito igual a 1: µt0 = 5Log ( (1 + z) √ |Ωk| fk [ √ |Ωk| ∫ z 0 dz′ H(z′) ] ) + 25 . (4.12) 4.4 Probabilidade a Posteriori das Supernovas Gold Como foi dito anteriormente, para chegarmos a probabilidade a posteriori, multipli- camos a verossimilhança pela probabilidade a priori. Para a probabilidade a priori abso- lutamente desconhecida, todos os valores são igualmente prováveis, logo a probabilidade a priori não influência na forma da probabilidade a posteriori. Relembrado isso, comecemos a montagem da probabilidade a posteriori. 4.4.1 Verossimilhança Como Riess et al supões que todas as supernovas são independentes, uma boa curva para medir os desvios entre estimador e observável é a curva Gaussiana. O argumento da expressão estat́ıstica (2.12) pode ser escrito usando o módulo de distância da seguinte forma: χ2v = ∑ i ( µt0i(Ωb,Ωm0,Ωx0, . . . ,H0, zi) − µ0i σµ0 )2 , (4.13) onde µt0i(Ωb,Ωm0,Ωx0, . . . ,H0, zi) é o estimador, µ0i é o módulo de distância da i-ésima supernova e σµ0 a dispersão do módulo de distância da i-ésima supernova. 46 CAPÍTULO 4. SUPERNOVAS TIPO I A 4.4.2 Probabilidades a Priori Na elaboração da probabilidade a posteriori, Riess et al acrescenta dois a prioris não triviais. Esses são o a priori da nucleosśıntese [34] descrito como Ωb0h 2 0 = (0.0214±0.0020) e o a priori HST[35] para h0 = (0.72± 0.08)km/(s Mpc), ambos Gaussianos, que em nossa modelagem tornam-se: p(Ωb0, h0|I) = kΩb0h0e  − 1 2 “ h0−0.72 0.08 ”2 ff e ( − 1 2 „ Ωb0h 2 0−0.0214 0.0020 «2 ) , (4.14) onde é a contante de normalização do a priori p(Ωb0, h0|I), definida como kΩb0h0 = ( ∫ ΩbMax ΩbM in ∫ h0Max h0Min (p(Ωb0 A associação de 3 fatos, todo a priori é normalizado, todo a priori uniforme obedece ao prinćıpio da razão insuficiente e o aqui particularmente só temos a prioris uniformes ou Gaussianos, justificaria um argumento único1 para descrição da probabilidade a posteriori, subterfúgio usual da estat́ıstica χ2. Todavia essa forma de expressão deixa a desejar, pois não evidência os limites dos a prioris uniformes e as constantes de normalização dos a prioris Gaussianos, peças importantes na comparação de modelos e na fundamentação matemática dessa análise estat́ıstica. Portanto a forma final da probabilidade a posteriori será: p(Ωb,Ωm0, . . . , h0|D, I) = ( ∏ j 1 △Hj )e− 1 2 χ2vkΩb0h0e  − 1 2 “ h0−0.72 0.08 ”2 ff e ( − 1 2 „ Ωb0h 2 0−0.0214 0.0020 «2 ) , (4.15) onde Hj são os limites dos a prioris uniformes de todos parâmetros que os possuem, kΩb0h0 é a constante de normalização do a priori p(Ωb0, h0|I) e D neste caso são as hipóteses feitas acerca das supernovas. 4.5 Análise dos Modelos 4.5.1 Pontos Comuns a Todos os Modelos A análise de cada modelo envolveu os seguintes parâmetros cosmológicos indepen- dentes: Ωb0, Ωm0, ΩX0 e H0, respectivamente, as densidades relativas de matéria bariônica hoje, matéria escura fria hoje, energia escura hoje e constante de Hubble hoje. Os seguintes parâmetros cosmológicos dependentes foram analisados: Ωk0, t0, q0 e ai, respetivamente, o saldo energético para termos curvatura nula, idade do universo, parâmetro de desaceleração hoje e ponto de transição do universo desacelerado para acelerado. Tipicamente definidos 1χ2 = P i “ µt 0i(zi)−µ0i σµ0 ”2 + ` H0−72 8 ´2 + „ Ωb0( H0 100 )2−0.0214 0.08 «2 4.5. ANÁLISE DOS MODELOS 47 da seguinte forma: t0 ∝ ∫ ∞ 0 dz (1 + z)H(z) , (4.16) q0 = − H ′[t] H[t]2 − 1 , (4.17) a′[t] = a[t]H[t] = 0 , (4.18) nesta ultima o objetivo é encontar os valores ai, se tornam a derivada temporal de a[t] um ponto extremo. Testamos também as seguintes hipóteses: p(Ωk0 = 0) probabilidade do universo não ter curvatura espacial, p(Ωk0 < 0) probabilidade do universo ter curvatura espacial positiva, p(q0 < 0) probabilidade do universo ser acelerado hoje, p(a1 < 1) proba- bilidade do ponto de transição do universo desacelerado para acelerado estar num fator de escala anterior ao atual. Para comparar diretamente os modelos estudados, usamos duas forma que são: Fazer o melhor ajuste posśıvel dos parâmetros independentes, minimizando o argumento da exponencial Gaussiana junto com o argumento dos a prioris Gaussianos (χ2min) e calcular probabilidade global do i-ésimo modelo analisado (Global Likelihood-Li), está última quantidade é fundamental na comparação entre modelos via fator de Bayes. 50 CAPÍTULO 4. SUPERNOVAS TIPO I A SNeIa GC: GC : GC : GC : k = 0, livre k = 0 Ωm0 = 0 Ωm0 = 0 χ2 157.50 157.90 157.50 157.90 χ2N 0.8898 0.8871 0.8848 0.8821 Ā 0.884+0.116−0.079 0.872 +0.128 −0.074 0.820 +0.066 −0.074 0.825 +0.057 −0.074 Ωk0 −0.22+0.72−0.70 0 −0.06+0.48−0.46 0 Ωm0 0.00 +0.42 −0.00 0.00 +0.27 −0.00 0 0 Ωc0 0.99 +0.39 −0.44 0.91 +0.05 −0.24 1.04 +0.43 −0.51 0.95 +0.010 −0.010 Ωb0 0.052 +0.011 −0.011 0.053 +0.011 −0.010 0.052 +0.011 −0.010 0.053 +0.011 −0.010 H0 63.69 +2.26 −2.26 63.12 +1.76 −1.80 63.12 +1.76 −1.80 63.45 +1.76 −1.78 t0 14.04 +0.94 −0.55 14.13 +0.65 −0.52 14.01 +0.51 −0.48 14.05 +0.51 −0.47 q0 −0.716+0.347−0.302 −0.597+0.150−0.130 −0.742+0.394−0.307 −0.676+0.114−0.084 ai 0.664 +0.087 −0.111 0.708 +0.052 −0.079 0.707 +0.059 −0.050 0.710 +0.049 −0.050 p(Ωk0 < 0) 79.92% − 62.01% − p(Ωk0 = 0) 38.88% − 78.93% − p(Ā 6= 1) 81.33% 95.50% 100% 100% p(q0 < 0) 99.98% 100% 100% 100% p(ai < 1) 99.99% 100% 100% 100% Tabela 4.1: Estimativas dos modelos cosmológicos teóricos da famı́lia gás de Chaplygin, usando supernovas do tipo Ia Gold. As incertezas são dadas pela região de credibilidade 95.4%. χ2N é o melhor ajuste de χ 2 dividido pelo número de graus de liberdade. O domı́nio do melhor ajuste pode ser encontrado na tabela B.1 do apêndice B. H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0 (fator de escala hoje). Analisando a tabela 4.1 as conclusões foram deveras animadoras, haja visto que o GC neste contexto unifica matéria e energia escura com ou sem restrições acerca da seção espacial do universo. Tais resultados já haviam sido verificados em um artigo anterior com o conjunto prévio de 157 supernovas Gold[36]. Comparando as estimativas obtidas na análise do GC:livre com as obtidas fixando Ωm0 = 0 vemos que em geral, as estimativas dos parâmetros não são fortemente afetadas pelas restrições. Vemos que existem pontos de discordância. Nas duas análises em que é posśıvel se estimar a seção espacial, notamos que em ambos os casos, o valor de melhor ajuste dos 4.5. ANÁLISE DOS MODELOS 51 parâmetros predisse Ωk0 < 0. E ainda a probabilidade p(Ωk0 < 0) é maior que a de p(Ωk0 = 0). O que nos leva a crer que o universo possui curvatura espacial positiva no contexto de supernovas. Logo, neste contexto fixar a seção espacial plana pode ser uma má idéia em prinćıpio. Por fim observemos o teste de melhor ajuste na primeira linha da tabela 4.1, vemos que existe um empate entre GC:livre e o GC: Ωm0 = 0. Todavia devemos atentar para a segunda linha da tabela 4.1, aqui o teste feito é o de melhor ajuste dividido pelo “Número de graus de liberdade”, vemos GC:Ωm0 = 0 é o que melhor se ajusta aos dados, logo é o mais competitivo. Aqui vemos pela primeira vez um resultado duvidoso gerado pelos testes de minimização do χ2. O fator de Bayes por outro lado mostra de forma consistente, ver tabela B.6, o que já suspeitávamos, GC:Ωm0 = 0 é mais competitivo que GC:Livre e ΛCDM , associando isso com o fato das estimativas entre GC:Ωm0 = 0 e GC:livre serem semelhantes, provando que Ωm0 é um parâmetro desnecessário no contexto da famı́lia GC analisada com SNeIa. 52 CAPÍTULO 4. SUPERNOVAS TIPO I A 4.5.4 Equação de Estado Constante Este modelo é caraterizado pelo parâmetro w0 e ΛCDM é obtido a partir da equação w(z) = w0 se w0 = −1. Aqui testamos o modelo sem restrições, denotado por w0:livre e o modelo sob a tradicional restrição k=0 acerca da seção espacial do universo (w0 : k = 0). Testamos as seguintes hipóteses particulares acerca deste modelo: p(w0 6= −1) chance do parâmetro w0 não recair em seu valor que reproduz ΛCDM , p(w0 ≤ −13) chance do parâmetro w0 assumir apenas valores que não geraria uma expansão no universo primordial. Em linhas gerais essa hipótese pode ser estendida para qualquer modelo de energia escura, bastando que a equação de estado que caracteriza a energia escura respeite o seguinte limite[28]. lim z→0 w(z) ≤ −1 3 , (4.19) Seguem os resultados e conclusões não triviais: Em seu célebre artigo[5] Riess et al relata, que existe uma degenerescência grande nos modelos em que a equação de estado da energia escura é expandida em séries do fator de escala2. Verificamos esse fato verificamos para o modelo w0:livre, já que foram impressionantes os valores dispersão obtidos para o parâmetro de caracterização do modelo w0. Essa enorme dispersão se reflete inclusive nos parâmetros dependentes. Entretanto, ao se fixar k=0 a degenerescência diminui substancialmente, ver figura 4.1. Desse comportamento do parâmetro w0 podemos tirar duas boas conclusões, sendo que a primeira trial: os modelos famı́lia w(z) = w0 é melhor comportando quando fixamos k=0. A segunda conclusão, não tão óbvia: Em análise estat́ıstica fixar parâmetros pode levar a resultados tendenciosos e por vezes errôneos. Sobre as hipóteses espećıficas da famı́lia w(z) = w0, vimos que elas não foram problemáticas. Verificamos que a probabilidade p(w0 6= −1) foi 76.19% de certeza para o caso de w0:livre e 80.23% para o caso w0 : k = 0. As probabilidades p(w0 ≤ −13) foram próximos a 100% nos dois modelos da famı́lia w(z) = w0. Tais medidas não foram afetadas pela grande dispersão do w0 e mostram que o modelos não é problemático no que tange essas hipóteses. Outras revelações foram acerca do parâmetro Ωk0 e Ωx0 no modelo w0 : livre. No domı́nio de obtenção do melhor ajuste (χ2Min) o valor de é Ωk0 = −0.27 e o de Ωx0 = 0.77, porém suas próprias estimativas são bem diferentes, Ωk0 tem menos de 1% de chance de 2w(a) = P∞ i=0 wia i Caṕıtulo 5 Observações em Raios-X de Aglomerados de Galáxias 5.1 Introdução Observações da razão gás massa em aglomerado de galáxias (fgas) em 2004 confir- maram a expansão acelerada do universo. Seguimos a metodologia descita na referência [6] que conta com 42 aglomerados de galáxias obtidos pelo satélite Chandra entre 1999 e 2005. Com uma abordagem independente reproduzimos os resultados da referência. Investigamos diversos outros modelos cosmológicos teóricos, à luz da análise Bayesiana desenvolvemos a análise combinada desses resultados com os de supernovas. Vejamos agora os detalhes pertinentes dessa parte do trabalho. 5.2 Observável 5.2.1 Aglomerados de Galáxias Sabemos que toda a informação proveniente do espaço chega a nós por meio de radi- ação, seja qual for a freqüência. Para que essa radiação seja interpretada, deve existir uma calibração do instrumento de medição. Em se tratando dos aglomerados de galáxias, esses são fontes luminosas de potência (Lx) na faixa de 10 43 − 1046 ergs , sua forma predominante de emissão é pelo efeito bremsstrahlung térmico, suas massas estão entre 1014M⊙−1015M⊙ e suas temperaturas(kBT ) na faixa de 1-10 KeV. A modelagem de emissão de raios-x são essencialmente hidro-termodinâmica[33], dis- cutiremos brevemente os pormenores dos modelos de emissão, afim de derivar nosso obser- 55 56CAPÍTULO 5. OBSERVAÇÕES EM RAIOS-X DE AGLOMERADOS DE GALÁXIAS vável, a razão entre a massa de gás e a massa total do aglomerado, fgas = Mgas Mtotal . Aglomerado de Galáxias como Medida Padrão Para Allen et al, um aglomerado de galáxia deve atender as seguintes caracteŕısticas para poder ser usado como uma reguá padrão[6]: • Deve possuir simetria esférica. • Possuir temperatura superior a 5keV (Aglomerado quente). • Potência Luminosa superior a 1046 ergs . • Suas linhas de emissão, devido ao efeito bremsstrahlung térmico, devem ser linhas de hidrogênio e hélio prioritariamente. Essas suposições são necessárias para que o aglomerado de galáxias seja melhor apro- ximado de um sistema f́ısico em equiĺıbrio hidrodinâmico. Modelagem do Aglomerado de Galáxias No que segue discorreremos sobre a modelagem hidro-termodinâmica dos algomerados de galáxias. Partindo da equação do equiĺıbrio hidrostático, temos: ∇P = −ρ∇Φ , (5.1) onde em ρ é a densidade de massa do aglomerado. Notemos que devido a simetria esférica a equação (5.1) torna-se: 1 ρ dP dr = −GM(r) r2 . (5.2) Usando que a pressão é dada por P = nkBT = ρkBT <m> , resulta na equação de descrição da massa total do aglomerado envolvida por uma área esférica de raio r é: M(r) = − kBTr 2 G < m > ( dlnρ dr + dlnT dr ) . (5.3) Essa é a equação central para a descrição do modelo de emissão de raios-X de aglomerados de galáxias pois com ela correlacionamos o perfil de massa do aglomerado com a temperatura. Definimos a densidade usada em (5.3) usando a descrição proposta por Navarro, Frenk e White[?]: ρ(r) = ρs (r/rs)(1 + r/rs)2 . (5.4) 5.3. ESTIMADOR 57 Aqui ρs pode ser escrito em termos da densidade cŕıtica[37], que foi anteriormente definida (3.33): ρs = 200 3 ρcr(z) c3 ln(1 + c) − c1+c , (5.5) onde c = r200rs é o fator de concentração, r200 designa o raio de virial e rs o raio de escala. Usando o mapeamento de massa no aglomera (M(r)) é posśıvel definir teoricamente a temperatura (5.3) como função da massa observada (T(M(r))). Que quando associado ao mapeamento da temperaturas observadas no aglomerado (Tobs(r)), é posśıvel realizar uma massante simulação estat́ıstica. χ2 = ∑ ( Tobs(r) − T (M(r)) σobs )2 . (5.6) Por meio de técnicas de minimização do χ2 obtemos o valor do fgas para cada aglomerado de galáxia. Obtemos também o raio de escala rs = r2500, que é chamado por Allen et al de raio canônico dos aglomerados de galáxias, que corresponde ao raio em que o aglomerado atinge uma densidade de 2500 vezes a densidade cŕıtica do universo. Cabe ressaltar que uma arbitrariedade é necessária para a realização deste feito. Tal arbitrariedade é a adoção de um modelo de referência, algo necessário para definir as dimensões do aglomerado e posteriormente conectar a Mtotal e Mgas. Nas simulações mais recentes da nossa bibliografia, o modelo de referência é ΛCDM com H0 = 70 km sMpc k = 0 e 30% de matéria não relativista hoje (Ωm0 + Ωb0 = 0.3). 5.3 Estimador 5.3.1 Visão Geral Até o ano de 2007, Allen et al usavam uma formulação menos realista[29] que a atual[6] para descrever a fração de gás. Essa formulação agregava apenas a correção devido ao modelo cosmológico previamente escolhido, que naquelas (na ocasião o SCDM) e um fator de erro sistemático motivado pela simulação estat́ıstica (b - fator de viés). De acordo com esse método a fração de gás é teoricamente descrita por: fSCDMgas = b (1 + 0.19 √ H0 100 ) Ωb0 Ωmef [ DSCDMA (z) DA(z) ]1.5 , (5.7) onde Ωb0 e h são parâmetros cosmológicos já descritos anteriormente, Ωmef é a densidade efetiva de matéria não relativista hoje1 e DA é a distância de diâmetro angular, que será 1Para os modelos tratados aqui definimos Ωmef = Ωb0 + Ωm0, a não ser para o gás de Chaplygin onde Ωmef = Ωb0 + Ωm0 + Ωc0 p 1 + Ā 60CAPÍTULO 5. OBSERVAÇÕES EM RAIOS-X DE AGLOMERADOS DE GALÁXIAS e o raio canônico do aglomerado, rc = 2M 2 total   ∑ i6=j mimj rij   −1 . (5.21) Com isso podemos reescrever as equações de (5.18) como: Ecin = Mtotal 2 〈v2〉; Epot = − GM2total rc , (5.22) onde vemos pelo teorema do virial que Mtotal ∝ rc. Logo ao exigirmos que θ << 1, podemos aproximar S, definida em (5.10), ao raio canônico do aglomerado DA ≈ S ≈ rc, portanto temos Mtotal ∝ DA. Vemos por fim que fração entre gás e massa de aglomerados de galáxias medido em um ângulo θ é: fgas = Mgas Mtotal ∝ DlD0.5A ∝ D1.5A . (5.23) 5.3.2 Parâmetros Intŕınsecos Aqui apresentaremos a motivação para a inclusão de cada parâmetro intŕınseco à modelagem do fgas, bem como sua probabilidade a priori. Estas probabilidades por sua vez não possuem grandes variações mediante mudanças de modelo cosmológico teórico. Esses parâmetros são considerados parâmetros perturbadores no contexto da análise estat́ıstica e receberam o tratamento estat́ıstico pertinente (ver seção 2.2.3). Os gráficos da probabilidade a posteriori marginal desses parâmetros encontram-se no apêndice C. Fator de Redução O fator de redução é escrito como uma série em z truncada b(z) = b0(1 + αbz) e vem decrementar a fração de bários em escala universal, quando comparada à fração de bárions medida no raio canônico do aglomerado (r2500). Essa correção, é uma conseqüência natural da história termodinâmica do gás e suas estimativas a priori foram obtidas mediante simulações e tem os seguintes valores 0.65 < b0 < 1.0 e −0.1 < αb < 0.1, ambos a prioris uniformes. Fração de Bárions em Estrelas O fator fração de bárions em estrelas s(z) = s0(1 + αsz), é algo análogo ao fator de redução por possuir as mesmas ráızes operacionais. Porém ele é um fator que incrementa 5.3. ESTIMADOR 61 a fração de bárions, corrigindo-a pela fração de bárions em estrelas, visto que cerca de 3% da massa do aglomerado é proveniente das estrelas. As simulações revelaram os seguintes a prioris s0 = 0.16 ± 0.05 (Gaussiano) e −0.2 < αs < 0.2 (uniforme). Fator de Correção Angular O fator de correção angular A é inserido, pois o ângulo subtendido no processo de medição do fgas depende do modelo cosmológico avaliado: A = ( θΛCDM2500 θ2500 )η ≈ ( H(z)DA(z) [H(z)DA(z)]ΛCDM )η . (5.24) Vejamos em detalhes como se chega a esse resultado. Sabemos que θ2500 é o ângulo cor- respondente ao raio canônico definido por Allen et al[6] como aglomerado atinge uma densidade de 2500 vezes a densidade cŕıtica do universo e a massa contida nesse raio é, M2500 = 4πr32500 3 2500ρcr . Como vimos na seção 5.3.1, segundo o teorema do Virial temos que, M2500 ∝ r2500 e sabemos que a densidade cŕıtica é dada por ρcr = 3H(z) 2 8πG (3.33). Te- mos então r2500 ∝ H(z)−1, logo o ângulo θ2500 pode ser escrito em termos do desvio para o vermelho e do modelo cosmológico da seguinte forma: θ2500 = r2500 DA(z) ∝ (H(z)DA(z))−1 , (5.25) o parâmetro adicional η é o declive do observável (f(r/r2500)) dentro da região do raio canônico e no modelo de referência. Esse parâmetro possui a priori Gaussiano estimado em η = 0.214 ± 0.022. No trabalho de Allen et al[6], são feitas ainda duas observações acerca do fator de correção angular. A primeira observação é que o fator A, de fato é muito próximo de 1 e sua inclusão influencia pouco nos resultados obtidos. A segunda é que por simplicidade pode-se fixar o valor central da Gaussiana de η, sem grandes prejúızos para a análise e gerando resultados mais realistas do que simplismente fixando A=1. Como visamos reproduzir e complementar a nossa referência da melhor forma posśıvel, trabalhamos como Allen et al sugerem, usando A expĺıcito, mas não usando η como um parâmetro adicional. A precisão da reprodução dos resultados pode ser verificada no gráfico 5.1. Fator de Pressão não térmica Esse fator possui suas origens em discussões acerca do movimento subsônico dentro do aglomerado. Tais discussões levaram Nagai[38] a fazer simulações hidrodinâmicas de aglomerados de galáxias e Allen et al fazem uso dessas simulações para justificar esse fator 62CAPÍTULO 5. OBSERVAÇÕES EM RAIOS-X DE AGLOMERADOS DE GALÁXIAS de correção que representa a pressão não térmica suportada no aglomerado. As estimativas a priori são 1.0 < γ < 1.1 uniforme. Constante de Calibração Este último fator trata da constante que vem quantificar as incertezas residuais pro- venientes da calibração dos instrumentos de medida e da modelagem dos raios-X (mapea- mentos descritos em 5.2.1). Seu a priori é Gaussiano tal que K = 1.0 ± 0.1. 5.4 Probabilidade a Posteriori da Fração de Gás e Mass Usando Raios-X de Aglomerados de Galáxias 5.4.1 Verossimilhança e a Prioris Os passos para a construção dessa probabilidade a posteriori, em nada diferem do que vimos no caso das supernovas. Para a verossimilhança temos: χ2v = ∑ i ( f tgas(Ωb,Ωm0,Ωx0, . . . ,H0,K . . . , zi) − fgas σfgas )2 . (5.26) Entretanto a lista de a priori não triviais (todos são Gaussianos) é ligeiramente maior: • Nucleosśıntese e HST - p(Ωb0, h0|I) = kΩb0h0e  − 1 2 “ h0−0.72 0.08 ”2 ff e ( − 1 2 „ Ωb0h 2 0−0.0214 0.0020 «2 ) . • Constante de bárions em estrelas - p(s0|I) = ks0e  − 1 2 “ s0−0.16 0.05 ”2 ff . • Fração de Calibração - p(K|I) = kKe n − 1 2( K−1.0 0.1 ) 2 o . Logo a probabilidade a posteriori será escrita como: p(Ωb,Ωm0,Ωx0, . . . ,H0,K, s0, . . . |D, I) = ( ∏ j 1 △Hj )( ∏ i kHie  − 1 2 “ Hi−Hp σ ”2 ff )p(Ωb0, h0|I)e− 1 2 χ2v , (5.27) onde Hj são os limites dos a prioris uniformes de todos parâmetros que os possuem, Hi é referente a todos os parâmetros que possuem a prioris Gaussianos, {Hp, σ} são respec- tivamente o valor de pico e a dispersão dos a prioris Gaussianos e D, neste caso, são as hipóteses feitas acerca de fgas. Por fim os parâmetros intŕınsecos, que são tratados como parâmetros perturbadores dentro da análise Bayesiana, são marginalizados como foi descrito na seção 2.2.3. Isso nos 5.5. ANÁLISE DOS MODELOS 65 0 0.2 0.4 0.6 0.8 1 1.2 1.4 WL 0 0.5 1 1.5 2 2.5 3 p PDF for LCDM using SNeIa and X-ray fgas Figura 5.1: Gráfico 1D da probabilidade do parâmetro cosmológico ΩΛ, no modelo ΛCDM . Os dados usado são fgas + SNeIa em preto, para SNeIa em laranja, para fgas em verde com traços-ponto. A curva verde cheia é a estimativa obtida por Allen et al em seu artigo. E o tracejado azul é o intervalo de confiança de 95.4% referente a curva preta. 0.1 0.2 0.3 0.4 0.5 0.6 0.7 Wm0 0.2 0.4 0.6 0.8 1 1.2 1.4 WL PDF for LCDM using SNeIa and X-ray fgas (a) Resultado de BETOC. Para SNeIa (cinza) e fgas (lilas) temos a representação dos ńıveis de credibilidade 68.2% e 95.4%. Para a combinação dos dados temos a representação de 68.2% (ver- melho), 95.4% (azul) e 99.7% (verde). (b) Imagem dispońıvel em http://xoc.stanford.edu. Nela temos a re- presentação dos ńıveis de credibilidade 68.2% e 95.4%. Figura 5.2: Gráfico 2D dos parâmetros cosmológico ΩΛ e Ωm0 na figura a. ΩΛ e Ωm = Ωm0 + Ωb0 na figura b. Ambos no modelo ΛCDM . 66CAPÍTULO 5. OBSERVAÇÕES EM RAIOS-X DE AGLOMERADOS DE GALÁXIAS ΛCDM 42 aglomerados, 42 aglomerados 26 aglomerados 182 SNeIa + k = 0 42 aglomerados χ2 41.483 41.364 24.483 201.14 χ2N 1.2571 1.2927 1.1658 0.9399 Ωk0 0 −0.19+0.49−0.39 −0.17+0.46−0.42 −0.18+0.34−0.30 ΩΛ 0.73 +0.08 −0.12 0.88 +0.35 −0.44 0.97 +0.36 −0.49 0.81 +0.23 −0.25 Ωm0 0.22 +0.11 −0.08 0.24 +0.12 −0.09 0.21 +0.08 −0.06 0.31 +0.10 −0.10 Ωb 0.039 +0.027 −0.015 0.041 +0.030 −0.016 0.040 +0.030 −0.015 0.054 +0.007 −0.007 Ωmef 0.27 +0.11 −0.09 0.28 +0.14 −0.09 0.25 +0.09 −0.08 0.36 +0.10 −0.10 H0 71.71 +14.93 −16.42 70.00 +15.88 −15.97 70.00 +16.20 −16.05 63.73 +1.98 −1.79 t0 13.61 +3.71 −2.53 14.39 +4.57 −3.41 15.18 +5.30 −3.69 15.05 +0.63 −0.57 q0 −0.600+0.176−0.128 −0.706+0.415−0.361 −0.860+0.516−0.326 −0.623+0.220−0.213 ai 0.583 +0.094 −0.098 0.546 +0.142 −0.083 0.513 +0.129 −0.081 0.597 +0.069 −0.043 p(Ωk0 < 0) − 74.34% 79.62% 84.31% p(Ωk0 = 0) − 46.20% 31.98% 29.85% p(q0 < 0) 100% 99.90 99.85% 100% Tabela 5.1: Estimativas do modelo cosmológico teórico ΛCDM , usando fgas com 42 aglomerados de galáxias (para ΛCDM com k=0 inclusive), a combinação fgas com 42 aglomerados de galáxias com SNeIa e fgas com 26 aglomerados de galáxias. As incertezas são dadas pela região de credibilidade de 95.4%. χN é o melhor ajuste de χ dividido pelo número de graus de liberdade. O domı́nio do melhor ajuste pode ser encontrado na tabela B.2 do apêndice B. H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0 (fator de escala hoje) Um resultado curioso que obtivemos foi nosso χ2min = 41.364, melhor ajustado aos dados que no artigo original de Allen et al χ2min = 41.9. Provavelmente isso deve ser resultado de uma rotina de minimização do χ2 mais eficiente. Como dissemos, esse modelo foi usado como projeto piloto para análise conjunta de supernovas gold e fgas. Esse procedimento fornecer estimativas mais precisas acerca dos parâmetros Hi, podemos averiguadar graficamente isso na figura 5.2. A diminuição da disperção foi comum a todos os parâmetros na análise conjunta, porém o exemplo mais claro é a estimativa de H0, notamos a significativa mudança na sua disperção, ver última colunas tabela 5.1. A grande dispersão de H0 nas outras colunas, é uma caracteŕıstica do observável. Algo sistemático para todos os modelos cosmológicos como veremos doravante e já esperado. Vimos anteriormente na seção 3.1.4 tabela 3.1, que 5.5. ANÁLISE DOS MODELOS 67 a constante de Hubble hoje, medida utilizando raios-x de aglomerados de galáxias possui cerca o valor de 77 ± 15%. Esse valor do observável, associado ao a priori HST, nos fornece uma estimativa ao redor do pico do HST, porém muito disperso. Como vimos tal dispersão desaparece sem qualquer arbitrariedade, bastando utilizarmos as supernovas gold em conjunto com o fgas. 5.5.2 Gás de Chaplygin - GC Aqui nossa investigação segue a mesma linha realizada com supernovas. Investigamos o modelo de gás de Chaplygin livre (GC:livre), estudamos que acarreta fixar k=0 (GC : k = 0) e/ou Ωm0 = 0 (GC : Ωm0 = 0 e GC : k = 0,Ωm0 = 0) Verificamos novamente a caracteŕıstica unificadora do GC, pois Ωm0 = 0 tem grande chance de ocorrer. Porém notamos um desvio perturbador em GC : k = 0. Esse problema torna-se mais evidente ao se fazer a análise conjunta dos fgas e supernovas, pois neste caso o valor mais provável é Ωm0 = 0.13, passa a ser 0.13. Em face a esse novo cenário, tornou- se pertinente testar a seguinte hipótese p(Ωm0 = 0|k = 0). Os resultados mostram que na análise do fgas, p(Ωm0 = 0|k = 0) tem uma chance de 65.15% de ocorrer, porém a análise conjunta fornece um resultado de 18.10%, que consideramos demasiadamente baixo. Em face a isso, conclúımos que fixar a seção espacial faz com que o GC viole sua caracteŕıstica principal, a quartessência (ver figura 5.3). Logo GC com k=0 é um modelo conceitualmente ruim, nessa análise por melhor que seja seu ajuste ou seu fator de Bayes relativo a outros modelos. Por outro lado esses resultados também são um indicativo de que caso k seja realmente zero, os modelos tipo GC visando a unificação, são conceitualmente ruins. 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 Wm0 0 1 2 3 4 5 p PDF for CGM using SNeIa and X-ray fgas with Wk0=0 (a) GC: k=0. Fixando k=0 existe a tendência de violação da quartessência. 0 0.1 0.2 0.3 0.4 0.5 0.6 Wm0 0 1 2 3 4 5 6 p PDF for CGM using SNeIa and X-ray fgas (b) GC livre. Quartessência é verificada. Figura 5.3: Gráfico 1D do parâmetro cosmológico Ωm0, no modelo de gás de Chaplygin. Os dados são fgas + SNeIa em preto, para SNeIa em laranja, para fgas em verde com traços-ponto. E o tracejado azul é o intervalo de confiança de 95.4% referente a curva preta 70CAPÍTULO 5. OBSERVAÇÕES EM RAIOS-X DE AGLOMERADOS DE GALÁXIAS X-ray fgas GC : GC : GC : GC : k = 0, livre k = 0 Ωm0 = 0 Ωm0 = 0 χ2 41.351 41.528 41.400 42.077 χ2N 1.4259 1.3843 1.3800 1.3573 Ā 0.991+0.009−0.184 0.980 +0.020 −0.093 0.918 +0.055 −0.162 0.928 +0.044 −0.080 Ωk0 0.10 +0.46 −0.48 0 0.20 +0.36 −0.36 0 Ωc0 0.78 +0.35 −0.44 0.90 +0.09 −0.20 0.80 +0.33 −0.38 0.96 +0.02 −0.03 Ωm0 0.00 +0.26 −0.00 0.03 +0.20 −0.03 0 0 Ωb0 0.042 +0.028 −0.016 0.044 +0.027 −0.016 0.040 +0.029 −0.015 0.044 +0.029 −0.017 H0 70.64 +15.04 −16.94 70.00 +14.97 −17.02 71.00 +14.95 −17.05 69.49 +15.10 −16.32 t0 13.42 +4.43 −3.00 14.00 +3.97 −2.69 13.50 +4.09 −3.00 14.09 +4.16 −2.55 q0 −0.668+0.497−0.343 −0.748+0.232−0.131 −0.631+0.410−0.362 −0.829+0.132−0.075 ai 0.603 +0.189 −0.121 0.605 +0.094 −0.089 0.638 +0.145 −0.109 0.611 +0.084 −0.082 p(Ā 6= 1) 16.92% 73.01% 100% 100% p(Ωk0 < 0) 33.59% − 14.90% − p(Ωk0 = 0) 67.80% − 31.70% − p(Ωm0 = 0) 100% 65.15% − − p(q0 < 0) 99.55% 100% 5.03σ 100% Tabela 5.2: Estimativas do modelo cosmológico teórico gás de Chaplygin usando fgas. As incertezas são dadas pela região de credibilidade de 95.4%. χ2N é o melhor ajuste de χ dividido pelo número de graus de liberdade. O domı́nio do melhor ajuste pode ser encontrado na tabela B.3 do apêndice B. H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0 (fator de escala hoje) 5.5. ANÁLISE DOS MODELOS 71 SNeIa + GC : GC : GC : GC : k = 0, X-ray fgas livre k = 0 Ωm0 = 0 Ωm0 = 0 χ2 201.14 201.74 201.49 201.89 χ2N 0.94431 0.94270 0.94154 0.93904 Ā 1.000+0.000−0.240 0.962 +0.038 −0.111 0.858 +0.051 −0.068 0.860 +0.042 −0.051 Ωk0 0.08 +0.30 −0.37 0 0.13 +0.24 −0.21 0 Ωc0 0.75 +0.24 −0.24 0.79 +0.18 −0.11 0.81 +0.23 −0.25 0.95 +0.01 −0.01 Ωm0 0.00 +0.29 −0.00 0.14 +0.12 −0.14 0 0 Ωb0 0.054 +0.008 −0.007 0.054 +0.008 −0.007 0.054 +0.007 −0.007 0.054 +0.007 −0.007 H0 63.53 +1.94 −1.81 63.90 +1.56 −1.69 63.65 +1.86 −1.86 64.30 +1.58 −1.54 t0 14.42 +0.86 −0.50 14.44 +0.73 −0.51 14.35 +0.52 −0.45 14.34 +0.48 −0.46 q0 −0.579+0.213−0.212 −0.657+0.168−0.100 −0.600+0.220−0.208 −0.719+0.078−0.065 ai 0.670 +0.075 −0.090 0.670 +0.054 −0.069 0.676 +0.067 −0.041 0.679 +0.043 −0.042 p(Ā 6= 1) 0% 72.77% 100% 100% p(Ωk0 < 0) 32.05% − 10.94% − p(Ωk0 = 0) 61.55% − 22.80% − p(Ωm0 = 0) 100% 18.10% − − p(q0 < 0) 100% 100% 100% 100% Tabela 5.3: Estimativas do modelo cosmológico teórico gás de Chaplygin usando fgas combinado a SNeIa. As incertezas são dadas pela região de credibilidade de 95.4%. χ2N é o melhor ajuste de χ dividido pelo número de graus de liberdade. O domı́nio do melhor ajuste pode ser encontrado na tabela B.4 do apêndice B. H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0 (fator de escala hoje) 5.5.3 Equação de Estado Constante Nessa análise verificamos que existe grande dispersão para as estimativas de w0 : livre nas análises separadas de supernovas e fgas, porém na análise conjunta essa dispersão diminui a cerca de um quinto do que era nas análises isoladas. Com isso, podemos concluir que dados observacionais distintos e isolados devem gerar resultado dotados de grande dispersão para w0 : livre, porém dados em conjunto podem gerar bons resultados, podemos visualizar isso graficamente na figura 5.5-a2. Na comparação de modelos, ao contrário do que ocorria em supernovas, aqui o modelo 2Em seu artigo original Allen mostra um gráfico (figura 5.5-b) da estimativa de w0 usando Radiação Cósmica de Fundo, supernovas e fgas, separadamente são degeneradas, porém combinadas não são. 72CAPÍTULO 5. OBSERVAÇÕES EM RAIOS-X DE AGLOMERADOS DE GALÁXIAS de equação de estado constante de fato ajusta-se melhor aos dados que os modelos de gás de Chaplygin e ΛCDM sob qualquer contexto. Fato que não faz dessa famı́lia de modelos necessariamente competitiva. O cálculo do fator de Bayes, ver tabela B.7, mostra valores assombrosamente ruins os w0 : livre e w0 : k = 0, quando comparados às outras famı́lias de modelos. A grande degenerescência no parâmetro caracteŕıstico da famı́lia de modelos w0 tem uma influência amarga sobre o parâmtro de desaceleração do universo q0. Notamos isso cla- ramente no caso fgas e anteriormente com supernovas. Tal problema obviamente desaparece com a diminuição da dispersão na análise combinada. Muito provavelmente isso se deve a forma como w0 é disposto na equação de cada parâmetro dependente. Tal comportamento não é visto para o parâmetro dependente ai, ponto de transição do universo desacelerado para acelerado. O restante das conclusões foi muito similar as obtidas com o uso de supernovas, apenas obtivemos valores menos dispersos na análise combinada supernovas e fgas. Algo notável foi o fato de que obtivemos resultados que concordam com a literatura de referência, reafirmando a qualidade de nosso trabalho e aumentando a idoneidade de nosso software. Tomando-se o devido cuidado na comparação do nosso gráfico com o original, a figura 5.5 nos mostra visualmente o que foi dito no parágrafo anterior. 5.5. ANÁLISE DOS MODELOS 75 D. Por outro lado com os raios-x fgas, os resultados tornam-se analisáveis. Entretanto surpreendentemente a utilização de supernovas em conjunto com fgas mostra algumas pa- tologias, veja a figura 5.6. Note que regiões de credibilidade de 68% é atingida rapidamente para SNeIa-fgas, a região de 95.4% sofre uma ligeira melhora (△w1 = 30.33 no fgas e △w1 = 28.29 no conjunto SNeIa-fgas), mas a região de 99.7% é atingida mais tardiamente. Apesar desse resultado esquisito, acreditamos que a análise conjunta de dados é o caminho a ser seguindo para quebrar a degenerescência sobre o parâmetro w1. Em seu artigo origi- nal, Allen et al usam Radiação Cósmica de Fundo para lidar com a degenerescência de um modelo similar a este3 sem fixar a k=0. A análise conjunta de radiação cósmica adicionada com fgas e SNeIa, mostrou-se eficiente na quebra da degenerescência do modelo, algo que a fixação de k=0 não foi capaz de resolver. Uma lição adicional pode ser retirada daqui: Por mais que um observável indique uma boa restrição a um parâmetro, por estima-ló bem4, o observável cosmológico tem muito mais a oferecer que uma mera restrição, pois cria v́ınculos mais consistentes sobre todos os parâmetros do modelo analisado. -30 -20 -10 0 10 w1 0 0.01 0.02 0.03 0.04 0.05 0.06 p PDF for EOS wHzL=w0+ w1 z €€€€€€€€€€€€ 1 + z with Wk0=0 (a) Com fgas, atingimos rapidamente 95.4% (azul) e 99.7% (verde). -50 -40 -30 -20 -10 0 10 w1 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 p PDF for EOS wHzL=w0+ w1 z €€€€€€€€€€€€ 1 + z with Wk0=0 (b) Com fgas combinado a SNeIa, 3σ é atingido para valores mais negativos de w1. A estimativa de w1 é problemática Figura 5.6: Gráfico 1D do parâmetro cosmológico w1, no modelo w(z) = w0 + w1 zz+1 . Representamos os intervalos de confiança de 68.2% (vermelho), 95.4% (azul) e 99.7% (verde). Outro resultado dessa análise diz respeito aos parâmetros dependentes, t0, q0 e ai, que não sofrem a influência da grande dispersão do parâmetro w1. Para q0 o motivo é a ausência de w1, este não participa da composição do parâmetro desaceleração do universo hoje. Para t0 e ai, w1 faz parte do argumento de uma exponencial e tem valores muito negativos, fazendo o conjunto ir a zero rapidamente, ver nas equações abaixo. 3Trata-se do modelo de Linder com ponto de transição (zt) arbitrário w(z) = w0zt+wz z+zt 4SNeIa estima bem Ωb = 0.05, no fgas Ωm0 dispersa-se pouco e na radiação cósmica de fundo k próximo de zero. 76CAPÍTULO 5. OBSERVAÇÕES EM RAIOS-X DE AGLOMERADOS DE GALÁXIAS Idade do universo hoje t0, no modelo de w(z) = w0 + w1z z+1 : k = 0: t0 ∝ ∫ ∞ 0 dz (1 + z) √ (Ωm0b0)(1 + z)3 + (1 − Ωm0b0)(1 + z)3(1+w0+w1)exp { −3w1z1+z } (5.32) onde Ωm0b0 = Ωm0 + Ωb0. Parâmetro de desaceleração hoje q0, no modelo w(z) = w0 + w1z z+1 : k = 0: q0 = 1 2 (1 + 3w0(1 − Ωm0 − Ωb0)) (5.33) Ponto de transição ai, no modelo de w(z) = w0 + w1z z+1 : k = 0: Ωm0b0 − (1 − Ωm0b0)exp−3w1(1 − ai)a−3(w0+w1)i (1 − 3(w0 + w1 − w1ai)) = 0 (5.34) devemos encontrar os valores de ai que satisfazem a equação acima e isso só pode ser resolvido numericamente. Por fim os resultados oriundos da comparação de modelos via melhor ajuste do χ2min. Está análise revela que este é o melhor modelo até o momento. Evidentemente esse não é um resultado idôneo, por ser uma análise local que não leva em conta a grave degenerescência do modelo. A interpretação correta deste resultado, de forma isolada, é que o modelo melhor ajustado aos dados é este, porém o método de χ2min não revela o custo desse ajuste. Quando vemos o contexto global, vemos que o custo pelo ajuste é uma tremenda dispersão sobre os parâmetros que definem o modelo (w0, w1). O que de fato torna o modelo ruim. Por outro lado segundo o fator de Bayes essa é a famı́lia de modelos mais problemática dentre as que lidamos, ver nas tabelas B.6 e B.7. Chegando a ser 50 mil vezes menos competitiva que ΛCDM . Visando vincular melhor os parâmetros do modelo, aqui também fizemos experimentos com as oscilações acústicas de bárions, aos moldes do artigo de Riess et al [5]. Tais resultados podem ser conferidas no apêndice D. 5.5. ANÁLISE DOS MODELOS 77 w(z) = w0 + w1z z+1 : k = 0 Xrayfgas + SNeIa Xrayfgas Hi Melhor Ajuste Estimativa Melhor Ajuste Estimativa χ2 200.67 - 41.34 - χ2N 0.9421 - 1.334 - Ωm0 0.2102 0.33 +0.16 −0.13 0.1787 0.28 +0.14 −0.11 Ωb 0.052 0.01 +0.01 −0.01 0.0414 0.04 +0.03 −0.02 Ωx0 73.78 0.62 +0.17 −0.14 0.7799 0.67 +0.12 −0.16 w0 −1.314 −1.35+1.86−1.17 −0.7447 −0.72+2.25−1.94 w1 2.499 2.67 +4.16 −24.13 −0.3552 −3.00+10.28−20.15 H0 64.19 64.00 +2.79 −2.68 71.89 68.00 +17.13 −15.84 t0 12.98 14.25 +1.12 −2.54 14.07 13.94 +4.13 −3.61 q0 −0.9547 −0.85+1.64−1.09 −0.3712 0.08+1.73−2.34 ai 0.7260 0.74 +0.04 −0.14 0.4841 0.63 +0.19 −0.19 p(w0 + w1 < −13) - 54.13% - 84.98% p(w0 6= −1, w1 6= 0) - 45.09% - 32.97% p(q0 < 0) - 87.21% - 60.89% p(ai < 1) - 100% - 99.96% Tabela 5.5: Estimativas e domı́nio do melhor ajuste para o modelo cosmológico teórico w(z) = w0+w1 zz+1 . As incertezas são dadas pela região de credibilidade de 95.4%. χN é o melhor ajuste de χ dividido pelo número de graus de liberdade. H0, t0, ai têm respectivamente as seguintes unidades, km/Mpc.s, Giga anos e a0 (fator de escala hoje).
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved