Os serviços de transcrição online são seguros e privados?

Um gravador de voz digital e uma caneta em cima de um bloco de notas.
MaximTrukhin / Shutterstock

A transcrição já foi um processo manual e tedioso. Médicos, jornalistas e vários profissionais gravavam suas anotações e conversas em fitas dictaphone ásperas e depois se sentavam na frente de seus computadores para digitá-las.

Avance para 2020, e há uma variedade de serviços que você pode usar para transformar uma gravação de áudio em texto na tela do computador. No entanto, uma questão permanece: eles estão seguros? Afinal, você pode estar carregando gravações de voz de conversas confidenciais e correios de voz privados.

Vamos dar uma olhada nesses serviços e como você pode proteger suas informações.

Como funcionam os serviços de transcrição de áudio

Os serviços de transcrição de áudio tendem a se enquadrar em três campos. O primeiro é inteiramente controlado por computador e usa modelos de aprendizado de máquina e IA existentes para processar a conversa. O segundo é o mais caro porque as pessoas fazem o trabalho pesado. O terceiro é uma combinação de processamento de computador e humanos.

Provavelmente, você está mais familiarizado com a primeira categoria. Os serviços de transcrição de voz – como os oferecidos pelo Google, Apple e Otter.ai – convertem as ondas analógicas que sua voz cria em uma representação digital. Em seguida, ele os divide em pequenos (às vezes, um milésimo de segundo) segmentos e os associa a “fonemas” conhecidos ou elementos de uma língua.

Esses algoritmos, então, tentam examiná-los dentro do contexto de outros fonemas e colocá-los em modelos estatísticos e de IA que acabam por produzir texto. Como esses serviços de transcrição são inteiramente controlados por computador, eles tendem a ser os mais baratos de operar. No entanto, a precisão nem sempre é precisa, principalmente quando se trata de extrair texto de ambientes barulhentos ou com várias pessoas.

Recomendado:  Tem Prime? Experimente o Luna Game Streaming da Amazon gratuitamente

A transcrição acionada por humanos envolve plataformas dedicadas, como Rev , que conectam os clientes a um conjunto de transcritores pré-aprovados. Você também pode contratar alguém de um mercado freelance, como Upwork  ou  Fiverr,  para transcrever para você.

Finalmente, há a mistura dos dois. Para agilizar o processo de transcrição, alguns sites permitem que a IA faça o trabalho preliminar e, em seguida, alguém organiza a saída e corrige quaisquer erros.

Os serviços de transcrição estão se comportando mal

Um dedo tocando um alto-falante Amazon Echo.
r.classen / Shutterstock

Nos últimos anos, muitos serviços de transcrição foram sujeitos a violações e escândalos.

Talvez o mais antigo (e, provavelmente, o mais chocante) fosse o SpinVox, que, nos anos 2000, oferecia um serviço que transformava correios de voz em mensagens SMS. Na época, isso foi considerado nada menos que um avanço tecnológico. A empresa atraiu rapidamente imprensa positiva, clientes e vastos fundos de financiamento.

O problema? Sem o conhecimento dos clientes, seus correios de voz foram processados ​​por pessoas que trabalham em escritórios em lugares como Paquistão, Maurício e África do Sul . Uma fonte da empresa afirmou que apenas 2 por cento das mensagens de voz eram processadas por máquina e o restante por cerca de 10.000 trabalhadores explorados.

Quando os funcionários de um escritório da SpinVox no Paquistão não eram pagos, eles começaram a enviar mensagens diretamente aos clientes para protestar. Eventualmente, a verdade veio à tona e o SpinVox perdeu muito de seu valor. No final das contas, o restante da empresa foi vendido para a Nuance , um dos maiores fornecedores de reconhecimento de voz do mundo.

Mais recentemente, o jornalista de segurança cibernética Brian Krebs descobriu uma violação importante que ocorreu na MEDantex , um provedor de serviços de transcrição de voz para profissionais médicos com sede no Kansas. Previsivelmente, dados (alguns dos quais datados de 2007) contendo registros médicos confidenciais vazaram. O conteúdo pode ser baixado de um portal inseguro como arquivos do Microsoft Word.

Recomendado:  O Windows 11 está dizendo adeus aos antigos aplicativos ARM

Mesmo os serviços de transcrição digital não são seguros. Afinal, quando você usa um serviço inteiramente controlado por computador, a empresa pode usar contratados humanos para realizar o controle de qualidade.

Em 2019, o site de notícias belga,  VRT NWS , descobriu que os contratantes do Google estavam ouvindo conversas entre indivíduos e seus assistentes inteligentes do Google Home. Um contratante até forneceu à VRT NWS acesso a conversas, muitas das quais de natureza profundamente sensível (e, em alguns casos, sexualmente íntima).

Amazon, Apple e Microsoft também estavam usando fornecedores dessa forma. Em outras palavras,  alguém pode estar ouvindo gravações de voz de seu assistente virtual .

Os serviços de transcrição online são seguros?

Uma mulher usando fones de ouvido e digitando em um laptop.
ImageFlow / Shutterstock

A questão mais pertinente é se os serviços de transcrição online são seguros. Infelizmente, a resposta é um pouco complicada.

O espaço de transcrição de voz é, neste ponto, bastante maduro. Os maus atores mais notórios foram eliminados.

No entanto, quando você confia seus dados (neste caso, conversas privadas) a um terceiro, você confia neles para protegê-los. Isso é tão verdadeiro para serviços online quanto para transcritores humanos.

Em última análise, você precisa se perguntar duas coisas: você confia no serviço e o quão delicadas são suas conversas?

Quando você analisa um serviço de transcrição, sempre vale a pena fazer alguma pesquisa. A empresa tem boa reputação? Está bem estabelecido? Ele já foi sujeito a uma violação de dados no passado? Existe uma política de privacidade que especifica explicitamente como seus dados serão tratados e protegidos?

Como mencionamos anteriormente, os serviços baseados em IA frequentemente dependem de funcionários e contratados terceirizados para fazer verificações de controle de qualidade. Embora essas verificações representem uma fração de todas as transcrições, sempre há a chance de alguém ouvir sua conversa.

Recomendado:  Como treinar Alexa para reconhecer vozes diferentes (e fornecer respostas mais personalizadas)

Em muitos casos, porém, isso não é um obstáculo. No entanto, se sua conversa for profundamente privada ou comercialmente sensível, você pode querer abrir um editor de texto e transcrever à moda antiga.