A transcrição já foi um processo manual e tedioso. Médicos, jornalistas e vários profissionais gravavam suas anotações e conversas em fitas dictaphone ásperas e depois se sentavam na frente de seus computadores para digitá-las.
Avance para 2020, e há uma variedade de serviços que você pode usar para transformar uma gravação de áudio em texto na tela do computador. No entanto, uma questão permanece: eles estão seguros? Afinal, você pode estar carregando gravações de voz de conversas confidenciais e correios de voz privados.
Vamos dar uma olhada nesses serviços e como você pode proteger suas informações.
Índice
Como funcionam os serviços de transcrição de áudio
Os serviços de transcrição de áudio tendem a se enquadrar em três campos. O primeiro é inteiramente controlado por computador e usa modelos de aprendizado de máquina e IA existentes para processar a conversa. O segundo é o mais caro porque as pessoas fazem o trabalho pesado. O terceiro é uma combinação de processamento de computador e humanos.
Provavelmente, você está mais familiarizado com a primeira categoria. Os serviços de transcrição de voz – como os oferecidos pelo Google, Apple e Otter.ai – convertem as ondas analógicas que sua voz cria em uma representação digital. Em seguida, ele os divide em pequenos (às vezes, um milésimo de segundo) segmentos e os associa a “fonemas” conhecidos ou elementos de uma língua.
Esses algoritmos, então, tentam examiná-los dentro do contexto de outros fonemas e colocá-los em modelos estatísticos e de IA que acabam por produzir texto. Como esses serviços de transcrição são inteiramente controlados por computador, eles tendem a ser os mais baratos de operar. No entanto, a precisão nem sempre é precisa, principalmente quando se trata de extrair texto de ambientes barulhentos ou com várias pessoas.
A transcrição acionada por humanos envolve plataformas dedicadas, como Rev , que conectam os clientes a um conjunto de transcritores pré-aprovados. Você também pode contratar alguém de um mercado freelance, como Upwork ou Fiverr, para transcrever para você.
Finalmente, há a mistura dos dois. Para agilizar o processo de transcrição, alguns sites permitem que a IA faça o trabalho preliminar e, em seguida, alguém organiza a saída e corrige quaisquer erros.
Os serviços de transcrição estão se comportando mal
Nos últimos anos, muitos serviços de transcrição foram sujeitos a violações e escândalos.
Talvez o mais antigo (e, provavelmente, o mais chocante) fosse o SpinVox, que, nos anos 2000, oferecia um serviço que transformava correios de voz em mensagens SMS. Na época, isso foi considerado nada menos que um avanço tecnológico. A empresa atraiu rapidamente imprensa positiva, clientes e vastos fundos de financiamento.
O problema? Sem o conhecimento dos clientes, seus correios de voz foram processados por pessoas que trabalham em escritórios em lugares como Paquistão, Maurício e África do Sul . Uma fonte da empresa afirmou que apenas 2 por cento das mensagens de voz eram processadas por máquina e o restante por cerca de 10.000 trabalhadores explorados.
Quando os funcionários de um escritório da SpinVox no Paquistão não eram pagos, eles começaram a enviar mensagens diretamente aos clientes para protestar. Eventualmente, a verdade veio à tona e o SpinVox perdeu muito de seu valor. No final das contas, o restante da empresa foi vendido para a Nuance , um dos maiores fornecedores de reconhecimento de voz do mundo.
Mais recentemente, o jornalista de segurança cibernética Brian Krebs descobriu uma violação importante que ocorreu na MEDantex , um provedor de serviços de transcrição de voz para profissionais médicos com sede no Kansas. Previsivelmente, dados (alguns dos quais datados de 2007) contendo registros médicos confidenciais vazaram. O conteúdo pode ser baixado de um portal inseguro como arquivos do Microsoft Word.
Mesmo os serviços de transcrição digital não são seguros. Afinal, quando você usa um serviço inteiramente controlado por computador, a empresa pode usar contratados humanos para realizar o controle de qualidade.
Em 2019, o site de notícias belga, VRT NWS , descobriu que os contratantes do Google estavam ouvindo conversas entre indivíduos e seus assistentes inteligentes do Google Home. Um contratante até forneceu à VRT NWS acesso a conversas, muitas das quais de natureza profundamente sensível (e, em alguns casos, sexualmente íntima).
Amazon, Apple e Microsoft também estavam usando fornecedores dessa forma. Em outras palavras, alguém pode estar ouvindo gravações de voz de seu assistente virtual .
Os serviços de transcrição online são seguros?
A questão mais pertinente é se os serviços de transcrição online são seguros. Infelizmente, a resposta é um pouco complicada.
O espaço de transcrição de voz é, neste ponto, bastante maduro. Os maus atores mais notórios foram eliminados.
No entanto, quando você confia seus dados (neste caso, conversas privadas) a um terceiro, você confia neles para protegê-los. Isso é tão verdadeiro para serviços online quanto para transcritores humanos.
Em última análise, você precisa se perguntar duas coisas: você confia no serviço e o quão delicadas são suas conversas?
Quando você analisa um serviço de transcrição, sempre vale a pena fazer alguma pesquisa. A empresa tem boa reputação? Está bem estabelecido? Ele já foi sujeito a uma violação de dados no passado? Existe uma política de privacidade que especifica explicitamente como seus dados serão tratados e protegidos?
Como mencionamos anteriormente, os serviços baseados em IA frequentemente dependem de funcionários e contratados terceirizados para fazer verificações de controle de qualidade. Embora essas verificações representem uma fração de todas as transcrições, sempre há a chance de alguém ouvir sua conversa.
Em muitos casos, porém, isso não é um obstáculo. No entanto, se sua conversa for profundamente privada ou comercialmente sensível, você pode querer abrir um editor de texto e transcrever à moda antiga.