Categories: Tecnologia

Como extrair imagens, texto e arquivos incorporados de documentos do Word, Excel e PowerPoint

Digamos que alguém enviou a você um documento do Word com muitas imagens e você deseja salvar essas imagens em seu disco rígido. Você pode extrair imagens de um documento do Microsoft Office com um truque simples.

Se você tem um arquivo Word (.docx), Excel (.xlsx) ou PowerPoint (.pptx) com imagens ou outros arquivos incorporados, você pode extraí-los (assim como o texto do documento), sem ter que salvar cada um separadamente . E o melhor de tudo, você não precisa de nenhum software extra. Os formatos de arquivo baseados em XML do Office – docx, xlsx e pptx – são, na verdade, arquivos compactados que podem ser abertos como qualquer arquivo .zip normal com o Windows. A partir daí, você pode extrair imagens, texto e outros arquivos incorporados. Você pode usar o suporte .zip integrado do Windows ou um aplicativo como o 7-Zip,  se preferir.

Se você precisar extrair arquivos de um documento antigo do Office – como um arquivo .doc, .xls ou .ppt – você pode fazer isso com um pequeno software gratuito. Detalharemos esse processo no final deste guia.

Como extrair o conteúdo de um arquivo do Office mais recente (.docx, .xlsx ou .pptx)

Para acessar o conteúdo interno de um documento do Office baseado em XML, abra o File Explorer (ou Windows Explorer no Windows 7), navegue até o arquivo do qual deseja extrair o conteúdo e selecione o arquivo.

Pressione “F2” para renomear o arquivo e altere a extensão (.docx, .xlsx ou .pptx) para “.zip”. Deixe a parte principal do nome do arquivo sozinha. Pressione “Enter” quando terminar.

A caixa de diálogo a seguir exibe um aviso sobre a alteração da extensão do nome do arquivo. Clique em “Sim”.

O Windows reconhece automaticamente o arquivo como um arquivo compactado. Para extrair o conteúdo do arquivo, clique com o botão direito do mouse no arquivo e selecione “Extrair tudo” no menu pop-up.

Na caixa de diálogo “Selecionar um destino e extrair arquivos”, o caminho onde o conteúdo do arquivo .zip será extraído é exibido na caixa de edição “Os arquivos serão extraídos para esta pasta”. Por padrão, uma pasta com o mesmo nome do arquivo (sem a extensão do arquivo) é criada na mesma pasta do arquivo .zip. Para extrair os arquivos para uma pasta diferente, clique em “Procurar”.

Navegue até onde deseja que o conteúdo do arquivo .zip seja extraído, clicando em “Nova pasta” para criar uma nova pasta, se necessário. Clique em “Selecionar pasta”.

Para abrir uma janela do Explorador de Arquivos (ou Windows Explorer) com a pasta que contém os arquivos extraídos exibidos depois de extraídos, marque a caixa de seleção “Mostrar arquivos extraídos ao concluir” para que haja uma marca de seleção na caixa. Clique em “Extrair”.

Como acessar as imagens extraídas

Incluído no conteúdo extraído está uma pasta chamada “palavra”, se o seu arquivo original for um documento do Word (ou “xl” para um documento Excel ou “ppt” para um documento PowerPoint). Clique duas vezes na pasta “palavra” para abri-la.

Clique duas vezes na pasta “mídia”.

Todas as imagens do arquivo original estão na pasta “mídia”. Os arquivos extraídos são as imagens originais usadas pelo documento. Dentro do documento, pode haver redimensionamento ou outras propriedades definidas, mas os arquivos extraídos são as imagens brutas sem essas propriedades aplicadas.

Como acessar o texto extraído

Se você não tem o Office instalado no seu PC e precisa extrair o texto de um arquivo Word (ou Excel ou PowerPoint), você pode acessar o texto extraído no arquivo “document.xml” na pasta “word” .

Você pode abrir esse arquivo em um editor de texto, como Notepad ou WordPad, mas é mais fácil de ler em um editor XML especial, como o programa gratuito XML Notepad . Todo o texto do arquivo está disponível em blocos de texto simples, independentemente do estilo e / ou formatação aplicado no próprio documento. Claro, se você vai baixar um software gratuito para ver este texto, você também pode baixar o LibreOffice , que pode ler documentos do Microsoft Office.

Como extrair objetos OLE incorporados ou arquivos anexados

Para acessar arquivos embutidos em um documento do Word quando você não tem acesso ao Word, primeiro abra o arquivo do Word no WordPad (que vem embutido no Windows). Você pode notar que alguns dos ícones de arquivo incorporados não são exibidos, mas ainda estão lá. Alguns dos arquivos incorporados podem ter nomes de arquivos parciais. O WordPad não oferece suporte a todos os recursos do Word, portanto, algum conteúdo pode ser exibido incorretamente. Mas você deve conseguir acessar os arquivos.

Se clicarmos com o botão direito em um dos arquivos incorporados em nosso arquivo de exemplo do Word, uma das opções será “Abrir objeto PDF”. Isso abre o arquivo PDF no programa leitor de PDF padrão em seu PC. A partir daí, você pode salvar o arquivo PDF em seu disco rígido.

Se o WordPad não tiver uma opção para abrir seu arquivo, anote o tipo de arquivo aqui. Por exemplo, nosso segundo arquivo neste documento é um arquivo .mp3.

Em seguida, volte para a pasta “Arquivos do [Documento]” e clique duas vezes na pasta “embeddings” dentro da pasta “word”.

Infelizmente, os tipos de arquivo não são preservados nos nomes dos arquivos. Todos eles têm uma extensão de arquivo “.bin”. Se você souber quais tipos de arquivos estão incorporados no arquivo, provavelmente poderá deduzir qual arquivo é qual pelo tamanho do arquivo. Em nosso exemplo, tínhamos um arquivo PDF e um arquivo MP3 embutidos em nosso documento. Como o arquivo MP3 é provavelmente maior do que o arquivo PDF, podemos descobrir qual é qual arquivo observando os tamanhos dos arquivos e, em seguida, renomeá-los usando as extensões corretas. Abaixo, estamos renomeando o arquivo MP3.

Observe que nem todos os arquivos serão necessariamente abertos usando este processo – por exemplo, nosso arquivo PDF foi aberto corretamente no WordPad, mas não conseguimos abri-lo renomeando seu arquivo .bin.

Depois de extrair o conteúdo do arquivo compactado, você pode reverter a extensão do arquivo original para .docx, .xlsx ou .pptx. O arquivo permanecerá intacto e pode ser aberto normalmente no programa correspondente.

Como extrair imagens de documentos antigos do Office (.doc, .xls ou .ppt)

Se você precisar extrair imagens de um documento do Office 2003 (ou anterior), existe uma ferramenta gratuita chamada Office Image Extraction Wizard  que facilita essa tarefa. Este programa também permite que você extraia imagens de vários documentos (do mesmo tipo ou de tipos diferentes) de uma vez. Baixe o programa e instale-o (também há uma versão portátil disponível se você preferir não instalá-lo).

Execute o programa e a tela de boas-vindas será exibida. Clique em “Next”.

Primeiro, precisamos selecionar o arquivo do qual você deseja extrair as imagens. Na tela de Entrada e Saída, clique no botão “Navegar” (ícone da pasta) à direita da caixa de edição do Documento.

Navegue até a pasta que contém o documento desejado, selecione-o e clique em “Abrir”.

A pasta que contém o arquivo selecionado torna-se automaticamente a pasta de saída. Para criar uma subpasta dentro dessa pasta com o mesmo nome do arquivo selecionado, clique na caixa de seleção “Criar uma pasta aqui” para que haja uma marca de seleção na caixa. Em seguida, clique em “Avançar”.

Na tela Pronto para iniciar, clique em “Iniciar” para começar a extrair as imagens.

A tela a seguir é exibida durante o processo de extração.

Na tela Concluída, clique em “Clique aqui para abrir a pasta de destino” para visualizar os arquivos de imagem resultantes.

Como optamos por criar uma subpasta, obtemos uma pasta contendo os arquivos de imagem extraídos do arquivo.

Você verá todas as imagens como arquivos numerados.

Você também pode extrair imagens de vários arquivos de uma vez. Para fazer isso, na tela de entrada e saída, clique na caixa de seleção “Modo em lote” para que haja uma marca de seleção na caixa.

A tela Batch Input & Output é exibida. Clique em “Adicionar arquivos”.

Na caixa de diálogo Abrir, navegue até a pasta que contém qualquer um dos arquivos dos quais deseja extrair imagens, selecione os arquivos usando a tecla “Shift” ou “Ctrl” para selecionar vários arquivos e clique em “Abrir”.

Você pode adicionar arquivos de outra pasta clicando em “Adicionar Arquivos” novamente, navegando até a pasta na caixa de diálogo Abrir, selecionando os arquivos desejados e clicando em “Abrir”.

Depois de adicionar todos os arquivos dos quais deseja extrair imagens, você pode optar por criar uma pasta separada para cada documento dentro da mesma pasta de cada documento no qual os arquivos de imagem serão salvos clicando no botão “Criar uma pasta para cada documento ”para que haja uma marca de seleção na caixa.

Você também pode especificar a pasta de saída para ser “igual à pasta de entrada de cada arquivo” ou inserir ou selecionar uma pasta personalizada usando a caixa de edição e o botão “Procurar” abaixo dessa opção. Clique em “Avançar” depois de selecionar as opções desejadas.

Clique em “Iniciar” na tela Pronto para iniciar.

A tela a seguir é exibida mostrando o progresso da extração.

O número de imagens extraídas é exibido na tela Concluída. Clique em “Fechar” para fechar o Office Image Extraction Wizard.

Se você optar por criar uma pasta separada para cada documento, verá pastas com os mesmos nomes dos arquivos que contêm as imagens, seja qual for a (s) pasta (s) de saída especificada (s).

Novamente, obtemos todas as imagens como arquivos numerados para cada documento.

Agora você pode renomear as imagens, movê-las e usá-las em seus próprios documentos. Apenas certifique-se de que você tem os direitos de usá-los legalmente.

maisroot

Recent Posts

O novo aplicativo “PC Manager” da Microsoft se parece muito com o CCleaner

Muitos aplicativos de limpeza estão disponíveis para Windows ao longo dos anos, mas hoje em…

12 meses ago

Como reiniciar um PS4

Seu PlayStation 4 está congelado? Seus jogos favoritos continuam travando? Reiniciar seu PS4 pode resolver…

12 meses ago

Veja por que as reticências são tão assustadoras ao enviar mensagens de texto…

A popularidade das mensagens de texto significou aprender uma forma totalmente nova de comunicação. Você…

12 meses ago

O telescópio James Webb acaba de capturar os “Pilares da Criação”

A foto dos "Pilares da Criação" tirada pelo Telescópio Espacial Hubble é uma das fotos…

12 meses ago

Você poderá baixar o Proton Drive mais cedo do que pensa

O Proton Drive saiu de seu estágio beta há algumas semanas, mas o aplicativo real…

12 meses ago

Como aumentar o zoom no Photoshop

Para ver suas fotos mais de perto ou para uma edição precisa , você pode…

12 meses ago