terça-feira, 5 de maio de 2015

Como a NSA converte palavras faladas em texto pesquisável!


Como a NSA converte palavras faladas em texto pesquisável!
Como a NSA converte palavras faladas em texto pesquisável!

Os computadores são ouvidos. A maioria das pessoas não imaginam que e-mails e outras comunicações digitais que outrora consideravam privadas pode agora tornar-se parte de um registro permanente.

Mas mesmo quando eles usam cada vez mais aplicativos que entendem o que eles dizem, a maioria das pessoas não percebem que as palavras que eles falam não são mais tão privadas.

Documentos ultra-secretos do arquivo do ex-empreiteiro NSA Edward Snowden mostram que a Agência de Segurança Nacional pode agora reconhecer automaticamente o conteúdo dentro de chamadas de telefone através da criação de transcrições fonéticas ásperas e representações que podem ser facilmente pesquisados ​​e armazenadas.

Os documentos mostram que analistas da NSA comemoram o desenvolvimento do que eles chamavam de "Google por voz" há quase uma década.

Embora a transcrição de conversação natural, aparentemente, continua a ser o "Santo Graal" da Comunidade de Inteligência, os documentos descrever o uso extensivo de pesquisas com palavras-chave, bem como programas de computador concebido para analisar e "extrair" o conteúdo das conversas de voz, e até mesmo usar algoritmos sofisticados para sinalizar conversas de interesse.

Os documentos incluem exemplos vivos do uso de reconhecimento de fala em zonas de guerra como o Iraque e o Afeganistão, assim como na América Latina. Mas eles deixam claro exatamente como amplamente a agência de espionagem usa esta habilidade, especialmente em programas que captam quantidades consideráveis ​​de conversas, que incluem as pessoas que vivem ou são cidadãos dos Estados Unidos e do mundo.

Espionar sobre as chamadas telefônicas internacionais sempre foi um grampo de vigilância da NSA, mas a exigência de que uma pessoa real faz a escuta significava que foi efetivamente limitado a uma pequena porcentagem do total do tráfego. Ao alavancar avanços em reconhecimento automático de fala, a NSA entrou na era da escuta granel.

A Lei da Liberdade - o projeto de reforma de vigilância que o Congresso está debatendo - não aborda o assunto de forma alguma. A lei iria terminar com um programa da NSA que não coleta conteúdo de voz: coleta a granel dados telefônicos domésticos.

Documentos publicados com este artigo:

RT10 Overview (Junho de 2006)
Para os média Mining, o futuro é agora! (01 de agosto de 2006)
Para os média Mining, o futuro é agora! (Conclusão) (07 de agosto de 2006)
Lidar com um 'tsunami' de Interceptação (29 de agosto de 2006)
Em breve! Uma ferramenta que permite não linguistas para Analisar-TV Estrangeiros programas de notícias (23 de outubro de 2008)
Avaliação SIRDCC Speech Technology WG da tecnologia atual STT (7 de dezembro de 2009)
Guia da classificação de Tecnologia da Linguagem Humana (HLT) Modelos (18 de maio de 2011)
Encontrar Nuggets - rapidamente - em um monte de Coleção Voz, do México ao Afeganistão (25 de maio de 2011)
Como é a Linguagem Humana (HLT) Progredindo? (26 de Setembro de 2011)
"Orçamento Negro" - FY 2013 Congressional Budget Justificativa/Programa Nacional de Inteligência, p. 262 (fevereiro de 2012)
"Orçamento Negro." - FY 2013 Congressional Budget Justificativa/Programa Nacional de Inteligência, pp 360-364 (Fevereiro de 2012)



Você tem um blog? Você quer colocar as análises de MichellHilton.com em seu blog/site? Ajude-nos a ajudar você. Envie um e-mail para MichellHilton@Outlook.com.

Assine nossa newsletter

Visão 2030