Estimação Média Espectral Em Movimento


12.1: Estimando a densidade espectral Discutimos anteriormente o periodograma, um arquivo de função que exibe informações sobre os componentes periódicos de uma série temporal. Qualquer série de tempo pode ser expressa como uma soma de coseno e ondas senoas oscilando nas freqüências fundamentais (harmônicas) jn. Com j 1, 2, n 2. O periodograma fornece informações sobre os pontos fortes relativos das várias frequências para explicar a variação nas séries temporais. O periodograma é uma amostra de estimativa de uma função de população chamada densidade espectral, que é uma caracterização de domínio de freqüência de uma série de tempo estacionária de população. A densidade espectral é uma representação de domínio de freqüência de uma série de tempo que está diretamente relacionada à representação do domínio do tempo de autocovariância. Essencialmente, a densidade espectral e a função de autocovariância contêm a mesma informação, mas expressam de maneiras diferentes. Nota de revisão. A autocovariância é o numerador da autocorrelação. A autocorrelação é a autocovariância dividida pela variância. Suponha que (h) seja a função de autocovariância de um processo estacionário e que f () seja a densidade espectral para o mesmo processo. Na notação da frase anterior, h tempo de atraso e freqüência. A autocovariância e a densidade espectral têm as seguintes relações: na linguagem do cálculo avançado, a autocovariância ea densidade espectral são pares de transformação de Fourier. Não nos preocuparemos com o cálculo da situação. Bem, concentre-se na estimativa da densidade espectral da caracterização do domínio da frequência de uma série. As equações de transformação de Fourier só são dadas aqui para estabelecer que existe uma ligação direta entre a representação do domínio do tempo e a representação do domínio de freqüência de uma série. Matematicamente, a densidade espectral é definida para freqüências negativas e positivas. No entanto, devido à simetria da função e seu padrão de repetição para freqüências fora do intervalo de 12 a 12, precisamos apenas estar preocupados com freqüências entre 0 e 12. A densidade espectral total integrada é igual a variância da série. Assim, a densidade espectral dentro de um intervalo particular de freqüências pode ser vista como a quantidade da variância explicada por essas freqüências. Métodos para estimar a densidade espectral O periodograma bruto é uma amostra aproximada da densidade espectral da população. A estimativa é áspera, em parte, porque usamos apenas freqüências harmônicas fundamentais discretas para o periodograma, enquanto que a densidade espectral é definida em um continuum de freqüências. Uma possível melhoria na estimativa do periodograma da densidade espectral é suavizá-la usando médias móveis centradas. Um alisamento adicional pode ser criado usando métodos afilados que pesam as extremidades (no tempo) da série menos do que o centro dos dados. Bem, não cubra a redução dessa lição. As partes interessadas podem ver a Seção 4.5 no livro e várias fontes da Internet. Uma abordagem alternativa para alisar o periodograma é uma abordagem de estimação paramétrica com base no fato de que qualquer série temporária estacionária pode ser aproximada por um modelo AR de alguma ordem (embora possa ser uma ordem elevada). Nesta abordagem, é encontrado um modelo de AR adequado e, em seguida, a densidade espectral é estimada como a densidade espectral para esse modelo de AR estimado. Método de suavização (estimativa não paramétrica da densidade espectral) O método usual para suavizar um periodograma tem um nome tão sofisticado que parece difícil. Na verdade, é apenas um procedimento de média móvel centrado com algumas possíveis modificações. Para uma série de tempo, o kernel Daniell com o parâmetro m é uma média móvel centrada que cria um valor suavizado no tempo t pela média de todos os valores entre os tempos t m e t m (inclusive). Por exemplo, a fórmula de suavização para um kernel Daniell com m 2 é In R, os coeficientes de ponderação para um kernel Daniell com m 2 podem ser gerados com o kernel do comando (daniell, 2). O resultado é coef-2 0,2 ​​coef-1 0,2 coef 0 0,2 coef 1 0,2 coef 2 0,2 ​​Os índices para coef se referem à diferença de tempo do centro da média no tempo t. Assim, a fórmula de suavização nesta instância é qual é a mesma fórmula dada acima. O kernel Daniell modificado é tal que os dois pontos finais na média recebem metade do peso que os pontos interiores fazem. Para um kernel de Daniell modificado com m 2, o alisamento é In R, o kernel de comando (modified. daniell, 2) listará os coeficientes de ponderação que acabamos de usar. O kernel Daniell ou o kernel Daniell modificado podem ser complicados (repetidos) para que o alisamento seja aplicado novamente aos valores suavizados. Isso produz um alisamento mais extenso pela média em um intervalo de tempo mais amplo. Por exemplo, para repetir um kernel Daniell com m 2 nos valores suavizados que resultaram de um kernel Daniell com m 2, a fórmula seria Esta é a média dos valores suavizados dentro de dois períodos de tempo t. Em qualquer direção. Em R, o kernel de comando (daniell, c (2,2)) fornecerá os coeficientes que seriam aplicados como pesos na média dos valores de dados originais para um núcleo de Daniell enrolado com m 2 em ambos os lisos. O resultado é kernel gt (daniell, c (2,2)) coef-4 0,04 coef-3 0,08 coef-2 0,12 coef-1 0,16 coef 0,20 coef 1 0,16 coef 2 0,12 coef 3 0,08 coef 4 0,04 Isso gera o alisamento Fórmula Uma convolução do método modificado em que os pontos finais tem menos peso também é possível. O kernel de comando (modified. daniell, c (2,2)) fornece esses coeficientes: coef-4 0,01563 coef-3 0,06250 coef-2 0,122500 coef-1 0,188750 coef 0 0,21875 coef 1 0,188750 coef 2 0,122500 coef 3 0,06250 coef 4 0,01563 Assim, os valores do centro são ponderados ligeiramente mais fortemente do que no kernel Daniell não modificado. Quando alisamos um periodograma, estamos suavizando um intervalo de freqüência em vez de um intervalo de tempo. Lembre-se de que o periodograma é determinado nas frequências fundamentais j jn para j 1, 2,, n 2. Deixe I (j) indicar o valor do periodograma na frequência j jn. Quando usamos um kernel Daniell com o parâmetro m para suavizar um periodograma, o valor suavizado (hat (omegaj)) é uma média ponderada de valores de periodograma para freqüências na faixa (j-m) n para (jm) n. Existem valores de freqüência fundamental de L 2 m 1 na faixa (j-m) n para (jm) n. O intervalo de valores utilizados para suavização. A largura de banda para o periodograma suavizado é definida como A largura de banda é uma medida da largura do (s) intervalo (s) de freqüência usado para suavizar o periodograma. Quando os pesos desiguais são usados ​​no alisamento, a definição da largura de banda é modificada. Denote o valor do periodograma suavizado em j jn como som (omegaj) soma hk que eu deixei (omegaj frac direita). Os h k são os pesos possivelmente desiguais usados ​​no alisamento. A fórmula de largura de banda é então modificada para Na verdade, esta fórmula funciona para pesos iguais também. A largura de banda deve ser suficiente para suavizar nossa estimativa, mas se usarmos uma largura de banda que é muito grande, bem suavemente o periodograma e perca ver picos importantes. Na prática, geralmente leva alguma experimentação para encontrar a largura de banda que dá um alisamento adequado. A largura de banda é predominantemente controlada pelo número de valores que estão em média no alisamento. Em outras palavras, o parâmetro m para o kernel Daniell e se o kernel é complicado (repetido) afetam a largura de banda. Nota: A largura de banda R relata com suas parcelas que não correspondem aos valores que seriam calculados usando as fórmulas acima. Veja a nota de rodapé na p. 197 de seu texto para uma explicação. Averagamentos que movem o periodograma com um kernel Daniell podem ser realizados em R usando uma seqüência de dois comandos. O primeiro define um kernel Daniell e o segundo cria o período periodístico suavizado. Como exemplo, suponha que a série observada seja chamada de x e desejamos suavizar o periodograma usando um kernel de Daniell com m 4. Os comandos são k kernel (daniell, 4) spec. pgram (x, k, taper0, log no) O primeiro comando cria os coeficientes de ponderação necessários para o suavização e os armazena em um vetor chamado k. (É arbitrário chamá-lo de k. Pode ser chamado qualquer coisa.) O segundo comando pede uma estimativa de densidade espectral baseada no periodograma para a série x. Usando os coeficientes de ponderação armazenados em k, sem inclinação, e o enredo será em uma escala normal, não uma escala de registro. Se uma convolução for desejada, o comando kernel pode ser modificado para algo como k kernel (daniell, c (4,4)). Existem duas formas possíveis de obter um kernel modificado de Daniell. Você pode alterar o comando kernel para se referir ao formatado. daniell em vez de daniell ou pode ignorar usando o comando kernel e usar um parâmetro spans no comando spec. pgram. O parâmetro spans dá o comprimento (2 m 1) do kernel Daniell modificado desejado. Por exemplo, um kernel de Daniell modificado com m 4 tem comprimento L 2 m 1 9 para que possamos usar o comando spec. pgram (x, spans9, taper 0, logno) Duas passagens de um kernel de Daniell modificado com m 4 em cada passagem Pode ser feito usando spec. pgram (x, spansc (9,9), taper 0, logno) Exemplo. Este exemplo usará a série de recrutamento de peixe que é usada em vários lugares do texto, incluindo vários lugares no capítulo 4. A série consiste em 453 valores mensais de uma medida de uma população de peixes em um local do hemisfério sul. Os dados estão no arquivo recruit. dat. O periodograma bruto pode ser criado usando o comando (ou pode ser criado usando o método fornecido na Lição 6). Spec. pgram (x, taper0, logno) Observe que no comando que acabamos de dar, omitimos o parâmetro que dá pesos para suavização. O periodograma bruto segue: O próximo gráfico é um periodograma alisado usando um kernel Daniell com m 4. Note que um efeito do alisamento é que o pico dominante na versão não suavizada é agora o segundo pico mais alto. Isso aconteceu porque o pico é tão bem definido na versão não suavizada que, quando a média com alguns valores circundantes, a altura é reduzida. O próximo gráfico é um periodograma alisado usando duas passagens de um kernel de Daniell com m 4 em cada passagem. Observe como é ainda mais suavizado do que anteriormente. Para saber onde os dois picos dominantes estão localizados, atribua um nome à saída spec. pgram e então você pode listá-lo. Por exemplo, specvalues ​​spec. pgram (x, k, taper0, logno) specvalues ​​Você pode peneirar a saída para encontrar as freqüências nas quais os picos ocorrem. As frequências e as estimativas da densidade espectral são listadas separadamente, mas na mesma ordem. Identifique as densidades espectrales máximas e depois encontre as freqüências correspondentes. Aqui, o primeiro pico está em uma freqüência .0229. O período (número de meses) associado a este ciclo 1.0229 43,7 meses, ou cerca de 44 meses. O segundo pico ocorre a uma frequência de 0,083333. O período associado 1.08333 12 meses. O primeiro pico está associado a um efeito climático El Nino. O segundo é o efeito sazonal usual de 12 meses. Esses dois comandos colocam linhas pontilhadas verticais no gráfico de densidade espectral (estimado) nas localizações aproximadas das densidades de pico. Abline (v144, ltydotted) abline (v112, lty pontilhada) Heres o enredo resultante: Weve alisou o suficiente, mas para fins de demonstração, o próximo gráfico é o resultado de spec. pgram (x, spansc (13,13), taper0, logno ) Isso usa duas passagens de um kernel de Daniell modificado com comprimento L 13 (então m 6) cada vez. O enredo é um pouco mais suave, mas não muito. Os picos, por sinal, estão exatamente nos mesmos lugares que na trama imediatamente acima. É definitivamente possível suavizar muito. Suponha que devemos usar um kernel de Daniell modificado de comprimento total 73 (m 36). O comando é spec. pgram (x, spans73, taper0, logno). O resultado segue. Os picos desapareceram Estimativa paramétrica da densidade espectral O método de suavização da estimativa da densidade espectral é chamado de método não paramétrico porque ele não usa nenhum modelo paramétrico para o processo da série temporal subjacente. Um método alternativo é um método paramétrico que implica encontrar o melhor modelo de AR apropriado para a série e depois traçar a densidade espectral desse modelo. Este método é suportado por um teorema que diz que a densidade espectral de qualquer processo de série temporal pode ser aproximada pela densidade espectral de um modelo AR (de alguma ordem, possivelmente alta). Em R, a estimativa paramétrica da densidade espectral é feita com facilidade com a função de comando spec. ar. Um comando como spec. ar (x, logno) fará com que R faça todo o trabalho. Mais uma vez, para identificar picos, podemos atribuir um nome aos resultados da spec. ar fazendo algo como specvaluesspec. ar (x, log no). Para o exemplo de recrutamento de peixe, o seguinte enredo é o resultado. Observe que a densidade plotada é a de um modelo AR (13). Podemos certamente encontrar modelos ARIMA mais parcimoniosos para esses dados. Utilizamos apenas a densidade espectral desse modelo para aproximar a densidade espectral da série observada. O aspecto da densidade espectral estimada é aproximadamente o mesmo que antes. O pico estimado de El Nino está localizado em um local ligeiramente diferente, a freqüência é de cerca de 0,024 para um ciclo de cerca de 1,024 cerca de 42 meses. Uma série deve ser desconsiderada antes de uma análise espectral. Uma tendência causará uma densidade espectral tão dominante a baixa freqüência que outros picos não serão vistos. Por padrão, o spec. pgram do comando R executa um desdobramento usando um modelo de tendência linear. Ou seja, a densidade espectral é estimada usando os resíduos de uma regressão feita onde os dados observados da variável y e a variável x t. Se um tipo diferente de tendência estiver presente, um quadrático, por exemplo, então uma regressão polinomial pode ser usada para desconsiderar os dados antes da densidade espectral estimada ser explorada. Note, no entanto, que o comando R spec. ar. No entanto, não executa uma destruição por padrão. Aplicação de Smoothers para Dados Brutos Observe que os devanadores descritos aqui também podem ser aplicados a dados brutos. O kernel Daniell e suas modificações são apenas mexerizadores móveis médios (ou média móvel ponderada). Métodos de estimativa do espectro NavigationPower (Advanced Signal Processing Toolkit) Um espectro de potência descreve a distribuição de energia de uma série temporal no domínio da freqüência. A energia é uma quantidade de valor real, de modo que o espectro de potência não contém informações de fase. Como uma série de tempo pode conter componentes de sinal periódicos não periódicos ou assíncronos, o espectro de potência de uma série temporal normalmente é considerado uma função contínua da freqüência. Quando você usa uma série de compartimentos de freqüência discreta para representar a freqüência contínua, o valor em um compartimento de freqüência específico é proporcional ao intervalo de freqüência. Para remover a dependência do tamanho do intervalo de frequência, você pode normalizar o espectro de potência para produzir a densidade espectral de potência (PSD), que é o espectro de potência dividido pelo tamanho do intervalo de freqüência. O PSD mede a potência do sinal por unidade de largura de banda para uma série temporal em V 2 Hz, o que implicitamente pressupõe que o PSD representa um sinal em volts que conduzem uma carga de 1 ohm. Se o PSD estiver representado em um decibel (dB), a unidade correspondente para o PSD é dB ref Vsqrt (Hz). Se você quiser usar outras unidades para o PSD estimado de uma série temporal, você precisa dimensionar a unidade da série temporal em unidades de engenharia apropriadas (UE). Depois de escalar a unidade da série temporal, você pode obter a unidade correspondente para o valor linear PSD e o valor dB PSD como EU 2 Hz e dB ref EUsqrt (Hz), respectivamente. Use a Escala TSA para EU VI para dimensionar a unidade para uma série temporal para a UE apropriada. Os métodos de estimação do PSD são classificados da seguinte forma: Métodos paramétricos 8212. Esses métodos são baseados em modelos paramétricos de séries temporais, como modelos AR, modelos de média móvel (MA) e modelos de média móvel auto-repentina (ARMA). Portanto, os métodos paramétricos também são conhecidos como métodos baseados em modelos. Para estimar o PSD de uma série temporal com métodos paramétricos, você precisa primeiro obter os parâmetros do modelo da série temporal. Você deve criar um modelo apropriado que reflete corretamente o comportamento do sistema que gera as séries temporais de outra forma, o PSD estimado pode não ser confiável. O método de classificação de sinal múltiplo (MUSIC) também é um método de estimativa espectral baseado em modelo. Métodos não paramétricos 8212. Esses métodos, que incluem o método do periodograma. Método Welch. E método Capon. São baseados na discreta transformada de Fourier. Você não precisa obter os parâmetros da série temporal antes de usar esses métodos. A limitação primária de métodos não paramétricos é que a computação usa janela de dados. Resultando em distorção dos PSDs resultantes devido a efeitos de janela. O principal benefício dos métodos não paramétricos é a robustez8212. Os PSD estimados não contêm picos de freqüência espúrios. Em contrapartida, os métodos paramétricos não utilizam janelas de dados. Os métodos paramétricos assumem que um sinal se ajusta a um modelo específico. Os PSD estimados podem conter picos de frequência espúrios se o modelo assumido estiver errado. Os PSDs estimados com métodos paramétricos são menos tendenciosos e possuem uma variação menor do que os PSDs estimados com métodos não paramétricos se o modelo assumido estiver correto. No entanto, as magnitudes de PSDs estimadas com métodos paramétricos geralmente são incorretas. Nota Durante a análise espectral, você pode medir as medidas de espectro sucessivas para reduzir a variação da estimativa e melhorar a precisão da medição. Use o TSD PSD médio VI para calcular o espectro estimado de forma contínua.

Comments

Popular Posts