Este artigo serve como base inicial para a criação de recursos de reconhecimento de voz no Linux, com recursos
disponíveis na WEB e com melhor qualidade de voz.
Claro que não temos aqui um processo profissional, mas pode servir como um bom início neste tipo de recurso.
Os resultados podem ser alterados por diversos fatores:
Qualidade do microfone;
Ruídos do ambiente;
Processamento e desempenho do computador;
Terrivelmente influenciado e determinado qualidade da internet;
Sotaques, maneirismos, e qualidade da fala que for usada na captura;
Tamanho das palavras;
Palavras que estejam disponíveis no dicionário de tradução do Google - Ex.: Pindamonhangaba.
Mesmo em celulares com boa detecção de voz, o maior causador de dificuldades na identificação das palavras, é a fala do usuário. Por isso, a fala
correta e perfeitamente pronunciada, pode gerar resultados muito mais satisfatórios.
Para aqueles que desejam integrar em seus aplicativos este tipo de recurso, confiram no SDK do Android, estas ferramentas na fonte citada acima e
suas licenças.
[2] Comentário enviado por levi linux em 02/04/2012 - 19:33h
Caro adrianoh2, meus parabéns, seu artigo está bastante didático, bem escrito e percebe-se que fez uma pesquisa minuciosa, além disso o tema é bastante original.
Favoritado!
[5] Comentário enviado por adrianoh2 em 03/04/2012 - 01:07h
Opa galera.. espero ter contribuído para o VOL, e para quem interessar.
Obrigado pela apreciação! :) - Um incentivo a mais para contribuir outras vezes....
[12] Comentário enviado por tarcisiojorge em 17/04/2012 - 08:32h
Me desculpa mais sou novo no Linux.
Como eu instalo o rec?
Tentei pelo comando # apt-get install rec
Qual é o comando via apt–get correto?
Acho que estou comendo bola.
OBS: estou usando o Debian 5,0 com o navegador web 2.22.3
[13] Comentário enviado por adrianoh2 em 17/04/2012 - 12:03h
Olá
O rec faz parte de um pacote de aplicativos.
Primeiramente será importante saber se o seu DEBIAN, está com os repositórios adicionados para estas aplicações.
Caso não esteja você terá que pesquisar aqui no vol como fazer.
Então tente assim:
sudo apt-get install sox
Caso instale este pacote, blz, teste o script novamente.
Caso não funcione, ai será necessário adicionar repositórios não oficiais para o DEBIAN.
Ou seja, você terá que adicionar repositórios do ubuntu por exemplo para instalar isso.
[14] Comentário enviado por tarcisiojorge em 19/04/2012 - 09:36h
Instalei o pacote que você me falou via apt get, e executei o arquivo.
Ao executar o arquivo apareceu este erro:
rec WARN formats: can’t set sample rate 16000; using 48000
Mude a Linha do rec para:
rec -r 48000 -t alsa default /tmp/recording.flac silence 1 0.1 5% 5 1.0 5%
E o erro sumiu, mas acho que tem algum problema, pois quando eu falo nunca aparece o que eu falei EX: eu falei esquerda e apareceu shows. Já verifique a qualidade do som do microfone e acho que esta boa, estou te enviando o arquivo de som gravado no seu e-mail para você verificar.
Será que eu tenho que mudar alguma coisa nesta linha de comando também?
x=$(wget -q -U "Mozilla/5.0" --post-file /tmp/recording.flac --header="Content-Type: audio/x-flac; rate=16000" -O -
"http://www.google.com/speech-api/v1/recognize?lang=pt-BR&client=chromium"|cut -d\" -f12)
Por que nesta linha você indica “Mozilla/5.0”?
É o seu navegador? Pois o meu navegador é o web 2.22.3 tenho que mudar esta linha, ou isto não tem nada a ver.
Outra pergunta esta linha tem rate=16000, na linha do rec eu mudei de 16000 para 48000 por causa do erro que mencionei. Eu devo mudar esta linha também, pois quando eu mudo esta linha para 48000, não aparece palavra nenhuma.
Você tem alguma dica?
Obrigado.
[15] Comentário enviado por adrianoh2 em 19/04/2012 - 13:38h
Olá tarcisiojorge
Alguns problemas:
1. Sua distro é Debian, e possivelmente a versão STABLE, que só contém pacotes considerados seguros.
Isso significa que boa parte dos aplicativos são antigos, considerados somente os que não contém nenhuma parte de testes ou realmente seguras.
Sendo assim, fica muito difícil saber o que funciona e não funciona no seu sistema. pois pacotes podem estar antigos nos repositórios.
Você precisa instalar todos os pacotes diretamente do fonte com as versões mais atualizadas. Exemplo é o REC, que você não possui todos os recursos.
2. A frequência que você colocou no REC, faz a fala ficar mais rápida quando tocada, e com isso impossível de ser detectada pelo Google Voice.
Mudar a freqüência não significa resolver o problema e sim mudar porque seu sistema possuiu restrições na versão que você instalou do REC.
3. Seu navegador precisa ser compatível com o Mozilla. O iceweasel, ou versão original do Debian, precisa ser alterado para poder funcionar corretamente.
Neste caso, recomendo instalar o firefox, novamente do fonte e a versão mais atual. Mozilla é o identificador que o navegador é variante do Firefox, e que pode ser detectado pelo Google.
Não adianta mudar a linha, não vai funcionar, se funciona ai é por sua conta e risco, teste, pois eu não fiz desta maneira.
4. Recomendo uma versão do ubuntu para que você possa testar, ou ainda uma versão live em um pen drive. Use versões ou variações do Debian que possuem repositórios atualizados com mais frequência, e tem versões mais novos dos softwares. Se você não tem experiência com Linux, recomendo começar com estes: LinuxMint, Ubuntu, Kubuntu.. etc.. . Usar o Debian sem saber como instalar diretamente dos fontes e resolver problemas de versões lhe dará um caminho mais árduo para fazer alguns recursos funcionarem. E neste caso, indico que use o fórum para resolver problemas de software.
Não posso dar todas as respostas que você precisa para ajustar seu Debian. Procure no fórum, ou abra uma ajuda lá, para instalar estes softwares de forma mais nova. E ai teste este recurso.
Realmente não uso Debian, somente para servidores. Uso LinuxMint que possui já recursos mais recentes.
[16] Comentário enviado por jbkira em 31/12/2013 - 14:27h
Gente eu tive problemas aqui
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
wget: URL em falta
Utilização: wget [OPÇÃO]... [ENDEREÇO]...
[17] Comentário enviado por adrianoh2 em 31/12/2013 - 14:44h
Cara... vc tem o Chromium Instalado? Verificou se ele está habilitado para todos os usuários...? Teu problema é com o Chromium :]
Além disso, veja se a linha não foi foi quebrada, se ficou em duas linhas, ele não vai funcionar. Verifique se está tudo realmente na mesma linha. O wget não consegue executar o comando em linhas quebradas.
[18] Comentário enviado por jbkira em 02/01/2014 - 15:37h
uma prof me ajudou a resolver ^_^
#------------------------- tradutor.sh ---------------------------------------
#Reeditado
#!/bin/bash
#Original de:
#Kris Occhipinti
#http://FilmsByKris.com
#Released under the GPLv3
#Adaptado por:
#Adriano Hedler
#26 de Março 2012
#Limpa a tela
clear
#Configuração:
#Determina a língua para tradução final
#no caso, alemão
lng="de"
#Grava temporariamente em um arquivo,
#Especifica um tempo de silencio para iniciar,
#E um tempo de silencio para parar.
rec -r 16000 -t alsa default /tmp/recording.flac silence 1 0.1 5% 5 1.0 5%