Lar Finanças Pessoais Aplicando Análise de Componentes Principais a Analisadores Preditivos - dummies

Aplicando Análise de Componentes Principais a Analisadores Preditivos - dummies

Vídeo: O que é FMEA - Análise dos Modos e efeitos de Falha! 2025

Vídeo: O que é FMEA - Análise dos Modos e efeitos de Falha! 2025
Anonim

A análise de componentes principais (PCA) é uma técnica valiosa que é amplamente utilizada em análises preditivas e ciência dos dados. Estuda um conjunto de dados para aprender as variáveis ​​mais relevantes responsáveis ​​pela maior variação nesse conjunto de dados. O PCA é usado principalmente como técnica de redução de dados.

Ao construir modelos preditivos, talvez seja necessário reduzir o número de recursos que descrevem seu conjunto de dados. É muito útil reduzir esta alta dimensionalidade dos dados através de técnicas de aproximação, nas quais o PCA se destaca. Os dados aproximados resumem todas as variações importantes dos dados originais.

Por exemplo, o conjunto de dados de ações sobre estoques pode incluir preços de ações, máximos diários e baixos, volumes de negociação, médias móveis de 200 dias, rácios de preço a ganho, força relativa para outros mercados, taxas de juros e força das moedas.

Encontrar as variáveis ​​preditivas mais importantes é o núcleo da construção de um modelo preditivo. A maneira como muitos o fizeram é usando uma abordagem de força bruta. A idéia é começar com tantas variáveis ​​relevantes como você pode, e então usar uma abordagem de funil para eliminar recursos que não têm impacto ou nenhum valor preditivo.

A inteligência e a visão são trazidas a este método, envolvendo os interessados ​​das empresas, porque eles têm algumas dúvidas sobre quais variáveis ​​terão o maior impacto na análise. A experiência dos cientistas de dados envolvidos no projeto também é importante para saber quais variáveis ​​e quais algoritmos usar para um tipo específico de dados ou um problema específico do domínio.

Para ajudar com o processo, os cientistas de dados empregam muitas ferramentas de análise preditiva que tornam mais fácil e rápido executar múltiplas permutações e análises em um conjunto de dados para medir o impacto de cada variável nesse conjunto de dados.

Sabendo que há uma grande quantidade de dados para trabalhar, você pode usar a PCA para obter ajuda.

Reduzir o número de variáveis ​​que você vê é um motivo suficiente para usar PCA. Além disso, ao usar o PCA, você se protege automaticamente de superar o modelo.

Certamente, você poderia encontrar correlação entre dados meteorológicos em um determinado país e o desempenho de seu mercado de ações. Ou com a cor dos sapatos de uma pessoa e a rota que ele leva para o escritório e a performance de seu portfólio para esse dia. Entretanto, incluir essas variáveis ​​em um modelo preditivo é mais do que apenas uma superposição, é enganosa e leva a falsas previsões.

PCA usa uma abordagem matematicamente válida para determinar o subconjunto do seu conjunto de dados que inclui os recursos mais importantes; Ao construir seu modelo nesse conjunto de dados menores, você terá um modelo que tenha valor preditivo para o conjunto de dados geral, maior que você está trabalhando. Em suma, a PCA deve ajudá-lo a entender suas variáveis ​​identificando o subconjunto de variáveis ​​responsáveis ​​pela maior variação com seu conjunto de dados original. Isso ajuda você a detectar a redundância. Isso ajuda você a descobrir que dois (ou mais variáveis) estão dizendo o mesmo.

Além disso, a análise de componentes principais leva seu conjunto de dados multidimensional e produz um novo conjunto de dados cujas variáveis ​​são representativas da linearidade das variáveis ​​no conjunto de dados original. Além disso, o conjunto de dados emitido tem variáveis ​​individualmente não correlacionadas e sua variação é ordenada pelos principais componentes, onde o primeiro é o maior, e assim por diante. Nesse sentido, a PCA também pode ser considerada como uma técnica para a construção de recursos.

Ao empregar PCA ou outras técnicas similares que ajudam a reduzir a dimensionalidade do conjunto de dados que você está lidando, você sempre deve ter cuidado para não afetar o desempenho do modelo negativamente. Reduzir o tamanho dos dados não deve ocorrer à custa de impactar negativamente o desempenho (a precisão do modelo preditivo). Pegue com segurança e gerencie seu conjunto de dados com cuidado.

A crescente complexidade de um modelo não se traduz em maior qualidade no resultado.

Para preservar o desempenho do modelo, você precisará avaliar cuidadosamente a eficácia de cada variável, medindo sua utilidade na modelagem do modelo final.

Sabendo que o PCA pode ser especialmente útil quando as variáveis ​​estão altamente correlacionadas dentro de um dado conjunto de dados, então ter um conjunto de dados com variáveis ​​preditivas não correlacionadas só pode complicar a tarefa de reduzir a dimensionalidade de dados multivariados. Muitas outras técnicas podem ser usadas aqui, além do PCA, como seleção de recurso direto e eliminação de recursos para trás.

PCA não é uma bala mágica que irá resolver todos os problemas com dados multidimensionais. Seu sucesso é altamente dependente dos dados com os quais você está trabalhando. A variação estatística pode não se alinhar com variáveis ​​com os valores mais preditivos, embora seja seguro trabalhar com essas aproximações.

Aplicando Análise de Componentes Principais a Analisadores Preditivos - dummies

Escolha dos editores

A Igreja Católica nos séculos XIV e XV - manequins

A Igreja Católica nos séculos XIV e XV - manequins

Enquanto o Papa Inocêncio III (1198-1216) ) sintetizou o zênite do poder e influência papal, o Papa Bonifácio VIII (1294-1303) personificou um dos pontificados mais complicados, misteriosos e às vezes contraditórios da Igreja. O rei Filipe IV da França e Bonifácio tornaram-se inimigos amargos no começo. Seu relacionamento piorou ao longo do tempo, e em 1303, Philip enviou mercenários ...

Catolicismo All-In-One For Dummies Cheat Sheet - dummies

Catolicismo All-In-One For Dummies Cheat Sheet - dummies

Enquanto diz as orações do Rosário, os católicos meditam sobre os chamados Mistérios Alegres, luminosos, dolorosos e gloriosos do Rosário. Mas dizer que os mistérios não são realmente mistérios, porque cada chamado mistério se refere a uma passagem diferente na vida de Cristo ou Maria, sua mãe. Cada década (um Nosso ...

10 Católicos famosos - manequins

10 Católicos famosos - manequins

Aqui está uma lista de dez dos católicos mais famosos, começando com os mais famosos. Mas tome cuidado: apenas ser batizado católico não significa que uma pessoa seja uma boa católica. A Igreja Católica acredita que um bom católico é aquele que regularmente e fielmente pratica sua fé todos os dias de sua vida. Uma pessoa ...

Escolha dos editores

Como girar objetos de desenho no PowerPoint 2007 - dummies

Como girar objetos de desenho no PowerPoint 2007 - dummies

O PowerPoint rotate handle permite que você dê os desenhos seus slides são inclinados. Com a alça de rotação do PowerPoint, você pode girar um objeto para qualquer ângulo arbitrário apenas arrastando-o com o mouse. O identificador de rotação é o identificador verde que aparece quando você seleciona um objeto que pode ser girado. A rotação ...

Como executar um programa através de uma hiperligação no PowerPoint 2013 - dummies

Como executar um programa através de uma hiperligação no PowerPoint 2013 - dummies

Uma hiperligação do PowerPoint pode também executar qualquer programa dentro de uma apresentação. Por exemplo, você pode criar uma apresentação que explica como comercializar um novo programa de computador e, em seguida, criar um hiperlink para o mesmo programa para que você possa demonstrar como esse programa realmente funciona. Quando você sair desse programa, você retorna para o seu ...

Como reorganizar slides na exibição do classificador de slides do PowerPoint 2016 - dummies

Como reorganizar slides na exibição do classificador de slides do PowerPoint 2016 - dummies

Exibição normal no PowerPoint 2016 is a visão em que você normalmente trabalha para editar seus slides, mover as coisas, adicionar texto ou gráficos, e assim por diante. No entanto, a Visão Normal tem uma limitação séria: não dá uma imagem muito importante da sua apresentação. Você pode ver os detalhes de apenas um slide em um ...

Escolha dos editores

Gerentes de comunidade on-line são multitarefas - manequins

Gerentes de comunidade on-line são multitarefas - manequins

Não só você tem que usar muitos chapéus como uma comunidade on-line gerente, mas às vezes você também sente que está vestindo todos eles ao mesmo tempo. Em qualquer dia, você pode esperar ter pelo menos meia dúzia de janelas do computador abertas ao mesmo tempo. Você pode ter ...

Community Manager: como representar a marca - dummies

Community Manager: como representar a marca - dummies

Como a representação mais pública do seu A marca, você, o gerente da comunidade online, é a pessoa a quem todos estarão buscando comentários, perguntas, sugestões e até propostas de negócios. Ao atuar como porta-voz da marca, você tem muitos itens a considerar: políticas sobre divulgação, transparência e o que divulgar ao público: Às vezes ...

Gerentes de comunidade on-line devem encontrar humor em situações difíceis - manequins

Gerentes de comunidade on-line devem encontrar humor em situações difíceis - manequins

Não todas as crises que enfrenta como on-line O gerente da comunidade tem que ser silencioso ou super sério. Você encontrará que as pessoas apreciam marcas que mostram um lado humano. Se você pode tratar a negatividade com humor e não insultar a inteligência de sua comunidade, você não só controlará os danos, mas também poderá atrair uma série de novos ...