Não tenho tempo para ouvir todos os áudios do meu grupo do WhatsApp; então, uso o Gemini para transcrevê-los para mim
A transcrição do WhatsApp é boa, mas falha miseravelmente se você falar rápido, não vocalizar ou se houver ruído: a IA do Google é muito melhor
Minha relação com áudios do WhatsApp é turbulenta, uma relação de amor e ódio: gosto de fazê-los, mas recebê-los (e ouvi-los) é mais difícil para mim. Considero-os o formato ideal para me expressar, para pessoas sem conhecimento técnico se comunicarem por meio de um aplicativo de mensagens e, em geral, para fornecer aquela camada extra de voz em tópicos mais delicados. É claro que todos esses motivos maravilhosos que explicam sua existência também são sua maior desvantagem: ficamos presos aos áudios do WhatsApp com frequência.
Considerando esse e o fato de que, às vezes, simplesmente não conseguimos ouvir um áudio, a chegada da transcrição de áudio do WhatsApp foi uma bênção para mim: poder ler a mensagem de uma só vez, evitando ter que ouvi-la, e também ter o texto ali, porque às vezes é difícil encontrar onde alguém disse algo específico.
Porém, apesar da bênção da transcrição de áudio do WhatsApp, a dura realidade é: se houver muito ruído de fundo, você pronunciar mal e/ou falar rápido, a transcrição será inútil, pois estará cheia de lacunas que tornarão a leitura praticamente impossível. E entendê-la, menos ainda: a transcrição automática do WhatsApp é decente, mas com o Gemini é muito melhor, então por que não passar o áudio do WhatsApp pela IA do Google?
O Gemini é infalível com o áudio do WhatsApp (ou Telegram)
Vamos deixar isso claro: este é um truque que eu só uso ocasionalmente, principalmente quando o áudio é extremamente longo e não tenho tempo (ou não estou com ...
Matérias relacionadas
GitHub aposta na IA e transforma desenvolvedores em "builders": o que muda no Brasil e no mundo