Como extrair imagens, texto e arquivos incorporados de documentos do Word, Excel e PowerPoint

00_lead_image_extract_images_from_word_file

Digamos que alguém enviou a você um documento do Word com muitas imagens e você deseja salvar essas imagens em seu disco rígido. Você pode extrair imagens de um documento do Microsoft Office com um truque simples.

Se você tem um arquivo Word (.docx), Excel (.xlsx) ou PowerPoint (.pptx) com imagens ou outros arquivos incorporados, você pode extraí-los (assim como o texto do documento), sem ter que salvar cada um separadamente . E o melhor de tudo, você não precisa de nenhum software extra. Os formatos de arquivo baseados em XML do Office – docx, xlsx e pptx – são, na verdade, arquivos compactados que podem ser abertos como qualquer arquivo .zip normal com o Windows. A partir daí, você pode extrair imagens, texto e outros arquivos incorporados. Você pode usar o suporte .zip integrado do Windows ou um aplicativo como o 7-Zip,  se preferir.

Se você precisar extrair arquivos de um documento antigo do Office – como um arquivo .doc, .xls ou .ppt – você pode fazer isso com um pequeno software gratuito. Detalharemos esse processo no final deste guia.

Como extrair o conteúdo de um arquivo do Office mais recente (.docx, .xlsx ou .pptx)

Para acessar o conteúdo interno de um documento do Office baseado em XML, abra o File Explorer (ou Windows Explorer no Windows 7), navegue até o arquivo do qual deseja extrair o conteúdo e selecione o arquivo.

01_pressing_f2_to_rename_file

Pressione “F2” para renomear o arquivo e altere a extensão (.docx, .xlsx ou .pptx) para “.zip”. Deixe a parte principal do nome do arquivo sozinha. Pressione “Enter” quando terminar.

02_changing_extension_to_zip

A caixa de diálogo a seguir exibe um aviso sobre a alteração da extensão do nome do arquivo. Clique em “Sim”.

02a_rename_confirmation

O Windows reconhece automaticamente o arquivo como um arquivo compactado. Para extrair o conteúdo do arquivo, clique com o botão direito do mouse no arquivo e selecione “Extrair tudo” no menu pop-up.

03_selecting_extract_all

Na caixa de diálogo “Selecionar um destino e extrair arquivos”, o caminho onde o conteúdo do arquivo .zip será extraído é exibido na caixa de edição “Os arquivos serão extraídos para esta pasta”. Por padrão, uma pasta com o mesmo nome do arquivo (sem a extensão do arquivo) é criada na mesma pasta do arquivo .zip. Para extrair os arquivos para uma pasta diferente, clique em “Procurar”.

Recomendado:  Quais arquivos você deve fazer backup no seu PC com Windows?

04_clicking_browse

Navegue até onde deseja que o conteúdo do arquivo .zip seja extraído, clicando em “Nova pasta” para criar uma nova pasta, se necessário. Clique em “Selecionar pasta”.

05_creating_new_folder_and_selecting_it

Para abrir uma janela do Explorador de Arquivos (ou Windows Explorer) com a pasta que contém os arquivos extraídos exibidos depois de extraídos, marque a caixa de seleção “Mostrar arquivos extraídos ao concluir” para que haja uma marca de seleção na caixa. Clique em “Extrair”.

06_clicking_extract

Como acessar as imagens extraídas

Incluído no conteúdo extraído está uma pasta chamada “palavra”, se o seu arquivo original for um documento do Word (ou “xl” para um documento Excel ou “ppt” para um documento PowerPoint). Clique duas vezes na pasta “palavra” para abri-la.

07_opening_word_folder

Clique duas vezes na pasta “mídia”.

08_opening_media_folder

Todas as imagens do arquivo original estão na pasta “mídia”. Os arquivos extraídos são as imagens originais usadas pelo documento. Dentro do documento, pode haver redimensionamento ou outras propriedades definidas, mas os arquivos extraídos são as imagens brutas sem essas propriedades aplicadas.

09_images_from_file

Como acessar o texto extraído

Se você não tem o Office instalado no seu PC e precisa extrair o texto de um arquivo Word (ou Excel ou PowerPoint), você pode acessar o texto extraído no arquivo “document.xml” na pasta “word” .

10_document_xml_file

Você pode abrir esse arquivo em um editor de texto, como Notepad ou WordPad, mas é mais fácil de ler em um editor XML especial, como o programa gratuito XML Notepad . Todo o texto do arquivo está disponível em blocos de texto simples, independentemente do estilo e / ou formatação aplicado no próprio documento. Claro, se você vai baixar um software gratuito para ver este texto, você também pode baixar o LibreOffice , que pode ler documentos do Microsoft Office.

11_document_xml_file_open_in_xml_notepad

Como extrair objetos OLE incorporados ou arquivos anexados

Para acessar arquivos embutidos em um documento do Word quando você não tem acesso ao Word, primeiro abra o arquivo do Word no WordPad (que vem embutido no Windows). Você pode notar que alguns dos ícones de arquivo incorporados não são exibidos, mas ainda estão lá. Alguns dos arquivos incorporados podem ter nomes de arquivos parciais. O WordPad não oferece suporte a todos os recursos do Word, portanto, algum conteúdo pode ser exibido incorretamente. Mas você deve conseguir acessar os arquivos.

Recomendado:  As casas inteligentes valem o investimento?

Se clicarmos com o botão direito em um dos arquivos incorporados em nosso arquivo de exemplo do Word, uma das opções será “Abrir objeto PDF”. Isso abre o arquivo PDF no programa leitor de PDF padrão em seu PC. A partir daí, você pode salvar o arquivo PDF em seu disco rígido.

11a_opening_pdf_file

Se o WordPad não tiver uma opção para abrir seu arquivo, anote o tipo de arquivo aqui. Por exemplo, nosso segundo arquivo neste documento é um arquivo .mp3.

Em seguida, volte para a pasta “Arquivos do [Documento]” e clique duas vezes na pasta “embeddings” dentro da pasta “word”.

12_embeddings_folder

Infelizmente, os tipos de arquivo não são preservados nos nomes dos arquivos. Todos eles têm uma extensão de arquivo “.bin”. Se você souber quais tipos de arquivos estão incorporados no arquivo, provavelmente poderá deduzir qual arquivo é qual pelo tamanho do arquivo. Em nosso exemplo, tínhamos um arquivo PDF e um arquivo MP3 embutidos em nosso documento. Como o arquivo MP3 é provavelmente maior do que o arquivo PDF, podemos descobrir qual é qual arquivo observando os tamanhos dos arquivos e, em seguida, renomeá-los usando as extensões corretas. Abaixo, estamos renomeando o arquivo MP3.

13_extracted_embedded_files

Observe que nem todos os arquivos serão necessariamente abertos usando este processo – por exemplo, nosso arquivo PDF foi aberto corretamente no WordPad, mas não conseguimos abri-lo renomeando seu arquivo .bin.

Depois de extrair o conteúdo do arquivo compactado, você pode reverter a extensão do arquivo original para .docx, .xlsx ou .pptx. O arquivo permanecerá intacto e pode ser aberto normalmente no programa correspondente.

Como extrair imagens de documentos antigos do Office (.doc, .xls ou .ppt)

Se você precisar extrair imagens de um documento do Office 2003 (ou anterior), existe uma ferramenta gratuita chamada Office Image Extraction Wizard  que facilita essa tarefa. Este programa também permite que você extraia imagens de vários documentos (do mesmo tipo ou de tipos diferentes) de uma vez. Baixe o programa e instale-o (também há uma versão portátil disponível se você preferir não instalá-lo).

Execute o programa e a tela de boas-vindas será exibida. Clique em “Next”.

14_welcome_screen

Primeiro, precisamos selecionar o arquivo do qual você deseja extrair as imagens. Na tela de Entrada e Saída, clique no botão “Navegar” (ícone da pasta) à direita da caixa de edição do Documento.

15_clicking_browse_for_document

Navegue até a pasta que contém o documento desejado, selecione-o e clique em “Abrir”.

Recomendado:  Ubuntu 16.04 torna o Ubuntu emocionante novamente

16_opening_word_file

A pasta que contém o arquivo selecionado torna-se automaticamente a pasta de saída. Para criar uma subpasta dentro dessa pasta com o mesmo nome do arquivo selecionado, clique na caixa de seleção “Criar uma pasta aqui” para que haja uma marca de seleção na caixa. Em seguida, clique em “Avançar”.

17_clicking_next

Na tela Pronto para iniciar, clique em “Iniciar” para começar a extrair as imagens.

18_ready_to_start

A tela a seguir é exibida durante o processo de extração.

19_processing_please_wait

Na tela Concluída, clique em “Clique aqui para abrir a pasta de destino” para visualizar os arquivos de imagem resultantes.

20_opening_destination_folder

Como optamos por criar uma subpasta, obtemos uma pasta contendo os arquivos de imagem extraídos do arquivo.

21_opening_subfolder

Você verá todas as imagens como arquivos numerados.

22_images_from_older_word_file

Você também pode extrair imagens de vários arquivos de uma vez. Para fazer isso, na tela de entrada e saída, clique na caixa de seleção “Modo em lote” para que haja uma marca de seleção na caixa.

23_clicking_batch_mode

A tela Batch Input & Output é exibida. Clique em “Adicionar arquivos”.

24_clicking_add_files

Na caixa de diálogo Abrir, navegue até a pasta que contém qualquer um dos arquivos dos quais deseja extrair imagens, selecione os arquivos usando a tecla “Shift” ou “Ctrl” para selecionar vários arquivos e clique em “Abrir”.

Você pode adicionar arquivos de outra pasta clicando em “Adicionar Arquivos” novamente, navegando até a pasta na caixa de diálogo Abrir, selecionando os arquivos desejados e clicando em “Abrir”.

25_opening_files

Depois de adicionar todos os arquivos dos quais deseja extrair imagens, você pode optar por criar uma pasta separada para cada documento dentro da mesma pasta de cada documento no qual os arquivos de imagem serão salvos clicando no botão “Criar uma pasta para cada documento ”para que haja uma marca de seleção na caixa.

26_clicking_next_on_batch_mode

Você também pode especificar a pasta de saída para ser “igual à pasta de entrada de cada arquivo” ou inserir ou selecionar uma pasta personalizada usando a caixa de edição e o botão “Procurar” abaixo dessa opção. Clique em “Avançar” depois de selecionar as opções desejadas.

26a_specifying_output_folder

Clique em “Iniciar” na tela Pronto para iniciar.

27_ready_to_start_for_batch_mode

A tela a seguir é exibida mostrando o progresso da extração.

28_processing_screen

O número de imagens extraídas é exibido na tela Concluída. Clique em “Fechar” para fechar o Office Image Extraction Wizard.

29_closing_wizard

Se você optar por criar uma pasta separada para cada documento, verá pastas com os mesmos nomes dos arquivos que contêm as imagens, seja qual for a (s) pasta (s) de saída especificada (s).

30_folders_containing_images

Novamente, obtemos todas as imagens como arquivos numerados para cada documento.

31_images_from_one_file

Agora você pode renomear as imagens, movê-las e usá-las em seus próprios documentos. Apenas certifique-se de que você tem os direitos de usá-los legalmente.