As primeiras linhas deste texto não foram digitadas no teclado, mas ditadas no microfone e transcritas para um documento do Google por meio da ferramenta Voice Typing. Além dele, o Microsoft Word usa o reconhecimento de fala do Cortana para entender de que forma o usuário fala e, consequentemente, converter a voz em texto.
Quem já testou aplicações semelhantes anteriormente, mas não encontrou resultados satisfatórios, pode tentar outra vez: a taxa de erros em programas de reconhecimento de voz está cada vez menor. Escritores avaliam que, com alguma prática, conseguem multiplicar o volume de palavras e frases em seus rascunhos graças a estas ferramentas.
Está com vontade de experimentar? Conheça algumas sugestões para testar sua fala como ferramenta de texto.
Por mais que os sistemas se aprimorem, é preciso ajudá-los a funcionar bem. A ferramenta do Google Docs, por exemplo, exige um navegador com boa conexão à internet para funcionar bem. Além disso, é preciso garantir um local com pouco ruído.
Além disso, o uso do microfone embutido do computador também pode contribuir para erros de entendimento. Prefira algum equipamento que reduza o som ambiente e ajude a tornar sua voz mais limpa. Estas escolhas também podem auxiliá-lo a concentrar-se enquanto fala, sem distrações.
Abra o software de reconhecimento desejado e experimente ditar mensagens pessoais, como emails, textos mais curtos, postagens pessoais em redes sociais etc. Separe um tempo para planejar textos com importância menor ou mesmo rascunhos. Lembre-se de que, caso nunca tenha experimentado esses softwares, os testes vão apontar os obstáculos, acelerando sua curva de aprendizagem.
Outro processo que toma tempo de qualquer redator é o processo de decupagem, que é a transcrição das falas de uma gravação. Este é outro recurso que programas de reconhecimento podem facilitar. Em vez de usar apenas o teclado, é possível ouvir o áudio com seu fone e, enquanto isso, repetir as frases, com seu tom de voz, no microfone.
Por que usar sua própria dicção em uma decupagem de entrevista em vez de simplesmente plugar o áudio original no software? Uma razão óbvia: esses sistemas, baseados em inteligência artificial, vão aprendendo com sua própria voz a minimizar erros. Por conta disso, seja em uma transcrição ou com seu próprio texto, procure manter um tom consistente de velocidade e volume.
Além disso, esses mecanismos traduzem frases inteiras com mais facilidade, dentro de contextos. Prefira enunciá-las dessa forma em vez de ditar palavra por palavra. Até por isso, vale treinar pausas entre frases no lugar de interrompê-las entre palavras. É uma habilidade que pode ser útil, inclusive, para quem deseja falar em público.
Transcrever um áudio é diferente de ditar seu próprio texto. O exercício consiste em pensar antes o que vai dizer. Procure partir de um esboço estruturado, como um roteiro em forma de listas. Para muitos, a vantagem nesse processo é a chance de sair diante da tela por alguns instantes: levante-se, saia com o gravador ligado e faça seu brainstorming.
Seja qual for seu objetivo, não pense que vai ter um texto final assim que terminar de falar. Considere necessários um tempo extra de edição e formatação de texto. Durante o processo, observe a tela enquanto fala e não pare diante de erros. Mantenha um fluxo constante. Inclua algum sinônimo ou sinalize correções para a edição futura.
Não espere 100% de precisão de um software, por mais que ele possa melhorar com o tempo. Com sua mente, o raciocínio é igual. Ainda que esses recursos pareçam melhores para alguns em relação a outros, testá-los e, ao mesmo tempo, pensar “não estou acostumado a ditar” não vai ajudar a desenvolver uma habilidade útil.
Falar e digitar envolvem caminhos neurais distintos. Uma das maiores dificuldades de quem está aprendendo a escrever é não redigir como se fala, especialmente para os mais prolixos. Para praticar programas de transcrição de voz, a habilidade é inversa: é preciso treinar a falar como se escreve. Sua mente vai agradecer caso decida treiná-la.
Por trás deste artigo, cujo enfoque é essencialmente prático, há um ponto importante. Hoje é possível discutir formas de aproveitar ferramentas de ditado graças a evolução desse recurso. Softwares do gênero avançam no mesmo ritmo em que aplicações baseadas em comando de voz. Estamos falando dos assistentes virtuais como Siri, da Apple; Alexa, da Apple e o próprio Google. Certamente esses recursos podem abrir caminhos ainda desconhecidos para produtores de conteúdos: a conversão de voz para texto é só o começo.