Lar Mídia social Como NaturallySpeaking Aprende a Reconhecer os computadores de fala - dummies

Como NaturallySpeaking Aprende a Reconhecer os computadores de fala - dummies

Vídeo: Windows Speech Recognition - Reconhecimento de voz do Windows 7 2024

Vídeo: Windows Speech Recognition - Reconhecimento de voz do Windows 7 2024
Anonim

Os computadores são muito inteligentes quando se trata de coisas que exercem o cérebro como jogar xadrez e preencher Retornos fiscais, para que você possa pensar que eles seriam whizzes em atividades "simples" como reconhecer rostos ou entender a fala.

Mas depois de cerca de 50 anos de tentar fazer os computadores fazer essas coisas simples, os programadores chegaram à conclusão de que uma habilidade não é simples, só porque os humanos dominam isso facilmente. Na verdade, nossos cérebros e olhos e ouvidos estão cheios de equipamentos sofisticados de detecção e processamento que ainda correm em torno de qualquer coisa que possamos projetar em silício e metal.

Nós, humanos, pensamos que é simples entender o discurso porque todo o trabalho realmente árduo é feito antes de nos tornar conscientes disso. Para nós, parece que as palavras inglesas apenas se estaltam em nossas cabeças assim que as pessoas abrem a boca. A natureza inconsciente (ou pré-consciente) do processo torna-se duplamente difícil para os programadores de computadores imitarem.

Para ter uma idéia de por que os computadores têm tantos problemas com a fala, pense em algo que são muito bons em reconhecer e entender: números de telefone de toque. Esses blips e bloops nas linhas telefônicas são muito mais significativos para os computadores do que para as pessoas. Várias características importantes tornam o telefone um idioma fácil para os computadores, listados abaixo. O inglês, por outro lado, é completamente diferente.

  • O "vocabulário" do tom de toque tem apenas 12 "palavras" nele. Depois de conhecer os tons dos dez dígitos mais * e #, você está dentro. O inglês, por outro lado, tem centenas de milhares de palavras.

  • Nenhuma das palavras soa igual. No telefone com toque, o tom "1" é distintamente diferente do tom "7". Mas o inglês tem homônimos, como o novo e o gnu, e homônimos próximos, como melhor e casar com ela. Às vezes, as frases inteiras são semelhantes: "Os filhos levantam carne" e "Os raios do sol se encontram", por exemplo.

  • Todos os "alto-falantes" do idioma dizem as palavras da mesma maneira. Pressione o botão 5 em qualquer telefone, e você recebe exatamente o mesmo tom. Mas um homem idoso e uma menina de 10 anos usam tons muito diferentes quando falam; e as pessoas da Grã-Bretanha, do Canadá e dos Estados Unidos pronunciam as mesmas palavras inglesas de maneiras muito diferentes.

  • Contexto não tem sentido. Para o telefone, um 1 é um 1 é um 1. Como você interpreta o tom não depende do número anterior ou do próximo número. Mas em inglês escrito, o contexto é tudo. Faz sentido "ir a Nova York."Mas faz muito menos sentido" ir dois Nova York "ou" ir também Nova York ". "

Como NaturallySpeaking Aprende a Reconhecer os computadores de fala - dummies

Escolha dos editores

Filmando fotos em situações especiais com Canon Rebel Série T3 Câmeras - manequins

Filmando fotos em situações especiais com Canon Rebel Série T3 Câmeras - manequins

ÀS vezes haverá não há problema em tirar o seu Canon Rebel T3 ou T3i fora e tirar fotos com configurações automáticas. A maior parte do tempo, você pode fazer com alguns ajustes simples. Alguns assuntos e situações de filmagem apresentam alguns desafios adicionais que exigem combinações de configurações mais complicadas. ...

Escolha dos editores

Obtendo o WordPress. org Software - dummies

Obtendo o WordPress. org Software - dummies

Depois de classificar seu host e domínio do site, você deve baixar e extrair os arquivos do WordPress pela WordPress. org e colocá-los no seu computador. Escolha um lugar que você lembrará, como um diretório de Documentos ou Download. Siga estas etapas: aponte seu navegador para o WordPress. org. A página principal do WordPress aparece. Clique em ...

Google AdSense para Bloggers de Mom - dummies

Google AdSense para Bloggers de Mom - dummies

Google O AdSense não é uma rede de anúncios orientada para a mãe, nem é A melhor opção de publicidade para a maioria dos blogs da mãe. Há certamente exceções a isso, especialmente se você blogar sobre produtos ou marcas. Todos os blogueiros que exibem publicidade devem ter um provedor de anúncios de backup - e o AdSense é uma ótima solução para essa necessidade. AdSense aprova ...

Relatório de conteúdo principal do google Analytics - dummies

Relatório de conteúdo principal do google Analytics - dummies

O relatório Top Content é um dos relatórios mais importantes no Google Analytics. Este relatório mostra as postagens mais populares no blog da sua mãe. Seu conteúdo popular dá uma visão do porquê seus leitores chegam até você. Os tópicos dessas postagens indicam o que as pessoas gostam, mesmo quando não comentam. Para visualizar ...

Escolha dos editores

Como fazer uma imagem disparar um link - as manequins

Como fazer uma imagem disparar um link - as manequins

Usam imagens para navegação . Eles são mais bonitos que os links de texto simples, e você pode adicionar a forma e a função na sua página com um elemento. Para criar uma imagem que desencadeia um link, você substitui um elemento no lugar do texto ao qual você ancoraria seu link. Esta marcação liga o texto: ...

Como abrir links em novos Windows ou Tabs com HTML5 - dummies

Como abrir links em novos Windows ou Tabs com HTML5 - dummies

O A web funciona porque você pode vincular páginas em seu site para páginas nos sites de outras pessoas usando um elemento de âncora simples. Quando você liga para o site de outra pessoa, você envia usuários para longe de seu próprio site. Para manter os usuários no seu site, HTML pode abrir a página vinculada em uma nova janela ...

Como criar tabelas em HTML5 - dummies

Como criar tabelas em HTML5 - dummies

O recipiente de marcação primária para tabelas em HTML é a tabela elemento. Ou seja, você usa a tag de abertura para denotar o início de uma tabela e você adiciona a tag de fechamento para encerrá-la. Além disso, os blocos de construção básicos para dados de tabela em HTML são a linha da tabela ( ) e os dados da tabela ...