Comment extraire des images, du texte et des fichiers incorporés à partir de documents Word, Excel et PowerPoint

Supposons que quelqu’un vous ait envoyé un document Word avec beaucoup d’images et que vous souhaitiez que vous enregistriez ces images sur votre disque dur. Vous pouvez extraire des images d’un document Microsoft Office avec une astuce simple.

Si vous avez un fichier Word (.docx), Excel (.xlsx) ou PowerPoint (.pptx) avec des images ou d’autres fichiers incorporés, vous pouvez les extraire (ainsi que le texte du document), sans avoir à les enregistrer séparément . Et le meilleur de tous, vous n’avez besoin d’aucun logiciel supplémentaire. Les formats de fichier Office XML (docx, xlsx et pptx) sont en fait des archives compressées que vous pouvez ouvrir comme n’importe quel fichier .zip normal avec Windows. À partir de là, vous pouvez extraire des images, du texte et d’autres fichiers intégrés. Vous pouvez utiliser la prise en charge .zip intégrée de Windows, ou une application comme 7-Zip si vous préférez.

Si vous avez besoin d’extraire des fichiers d’un ancien document bureautique, comme un fichier .doc, .xls ou .ppt, vous pouvez le faire avec un petit logiciel gratuit. Nous détaillerons ce processus à la fin de ce guide.

Comment extraire le contenu d’un fichier Office plus récent (.docx, .xlsx ou .pptx)

Pour accéder au contenu interne d’un document Office basé sur XML, ouvrez l’Explorateur de fichiers (ou l’Explorateur Windows dans Windows 7), accédez au fichier à partir duquel vous souhaitez extraire le contenu et sélectionnez le fichier.

Appuyez sur «F2» pour renommer le fichier et changer l’extension (.docx, .xlsx ou .pptx) en «.zip». Laissez la partie principale du nom de fichier seule. Appuyez sur “Entrée” lorsque vous avez terminé.

La boîte de dialogue suivante s’affiche pour vous avertir de la modification de l’extension de nom de fichier. Cliquez sur «Oui».

Windows reconnaît automatiquement le fichier en tant que fichier compressé. Pour extraire le contenu du fichier, cliquez avec le bouton droit sur le fichier et sélectionnez «Extraire tout» dans le menu contextuel.

Dans la boîte de dialogue «Sélectionner une destination et extraire les fichiers», le chemin où le contenu du fichier .zip sera extrait s’affiche dans la boîte d’édition «Les fichiers seront extraits dans ce dossier». Par défaut, un dossier portant le même nom que le nom du fichier (sans l’extension de fichier) est créé dans le même dossier que le fichier .zip. Pour extraire les fichiers dans un autre dossier, cliquez sur «Parcourir».

Accédez à l’endroit où vous souhaitez extraire le contenu du fichier .zip, en cliquant sur «Nouveau dossier» pour créer un nouveau dossier, si nécessaire. Cliquez sur «Sélectionner un dossier».

Pour ouvrir une fenêtre de l’Explorateur de fichiers (ou de l’Explorateur Windows) avec le dossier contenant les fichiers extraits affichés une fois qu’ils sont extraits, cochez la case «Afficher les fichiers extraits une fois terminés» afin qu’il y ait une coche dans la case. Cliquez sur «Extraire».

Comment accéder aux images extraites

Le contenu extrait comprend un dossier nommé «mot», si votre fichier d’origine est un document Word (ou «xl» pour un document Excel ou «ppt» pour un document PowerPoint). Double-cliquez sur le dossier «mot» pour l’ouvrir.

Double-cliquez sur le dossier «media».

Toutes les images du fichier original se trouvent dans le dossier «media». Les fichiers extraits sont les images originales utilisées par le document. À l’intérieur du document, il peut y avoir un redimensionnement ou d’autres propriétés définies, mais les fichiers extraits sont les images brutes sans ces propriétés appliquées.

En relation :  Comment supprimer vos données vocales Amazon Echo

Comment accéder au texte extrait

Si Office n’est pas installé sur votre PC et que vous devez extraire du texte d’un fichier Word (ou Excel ou PowerPoint), vous pouvez accéder au texte extrait dans le fichier «document.xml» dans le dossier «word» .

Vous pouvez ouvrir ce fichier dans un éditeur de texte, tel que le Bloc-notes ou WordPad, mais il est plus facile à lire dans un éditeur XML spécial, tel que le programme gratuit, Bloc-notes XML. Tout le texte du fichier est disponible en morceaux de texte brut quel que soit le style et / ou la mise en forme appliqués dans le document lui-même. Bien sûr, si vous souhaitez télécharger un logiciel gratuit pour afficher ce texte, vous pouvez également télécharger LibreOffice, qui peut lire les documents Microsoft Office.

Comment extraire des objets OLE incorporés ou des fichiers attachés

Pour accéder aux fichiers incorporés dans un document Word lorsque vous n’avez pas accès à Word, ouvrez d’abord le fichier Word dans WordPad (qui est intégré à Windows). Vous remarquerez peut-être que certaines des icônes de fichiers incorporées ne s’affichent pas, mais elles sont toujours là. Certains des fichiers incorporés peuvent avoir des noms de fichiers partiels. WordPad ne prend pas en charge toutes les fonctionnalités de Word, il se peut donc que certains contenus ne s’affichent pas correctement. Mais vous devriez pouvoir accéder aux fichiers.

Si nous cliquons avec le bouton droit sur l’un des fichiers incorporés dans notre exemple de fichier Word, l’une des options est «Ouvrir un objet PDF». Cela ouvre le fichier PDF dans le programme de lecture PDF par défaut sur votre PC. De là, vous pouvez enregistrer le fichier PDF sur votre disque dur.

Si WordPad n’a pas d’option pour ouvrir votre fichier, notez son type de fichier ici. Par exemple, notre deuxième fichier dans ce document est un fichier .mp3.

Ensuite, revenez à votre “Fichiers de [Document]»Et double-cliquez sur le dossier« embeddings »dans le dossier« word ».

Malheureusement, les types de fichiers ne sont pas conservés dans les noms de fichiers. Ils ont tous une extension de fichier «.bin» à la place. Si vous savez quels types de fichiers sont incorporés dans le fichier, vous pouvez probablement déduire quel fichier est lequel par la taille du fichier. Dans notre exemple, nous avions un fichier PDF et un fichier MP3 incorporés dans notre document. Étant donné que le fichier MP3 est probablement plus volumineux que le fichier PDF, nous pouvons déterminer quel fichier est lequel en regardant la taille des fichiers, puis les renommer en utilisant les extensions appropriées. Ci-dessous, nous renommons le fichier MP3.

13_extracts_embedded_files

Notez que tous les fichiers ne s’ouvriront pas nécessairement en utilisant ce processus – par exemple, notre fichier PDF s’est ouvert correctement à partir de WordPad, mais nous n’avons pas pu le faire ouvrir en renommant son fichier .bin.

Une fois que vous avez extrait le contenu du fichier compressé, vous pouvez rétablir l’extension du fichier d’origine en .docx, .xlsx ou .pptx. Le fichier restera intact et pourra être ouvert normalement dans le programme correspondant.

Comment extraire des images de documents Office plus anciens (.doc, .xls ou .ppt)

Si vous devez extraire des images d’un document Office 2003 (ou antérieur), il existe un outil gratuit appelé Assistant d’extraction d’images Office cela rend cette tâche facile. Ce programme vous permet également d’extraire des images de plusieurs documents (de types identiques ou différents) à la fois. Téléchargez le programme et installez-le (une version portable est également disponible si vous préférez ne pas l’installer).

En relation :  Vous avez un problème Wi-Fi avec Windows 10? Voici comment y remédier

Exécutez le programme et l’écran de bienvenue s’affiche. Cliquez sur Suivant”.

Tout d’abord, nous devons sélectionner le fichier à partir duquel vous souhaitez extraire les images. Sur l’écran Entrée et sortie, cliquez sur le bouton «Parcourir» (icône de dossier) à droite de la zone d’édition de document.

Accédez au dossier contenant le document souhaité, sélectionnez-le et cliquez sur «Ouvrir».

Le dossier qui contient le fichier sélectionné devient automatiquement le dossier de sortie. Pour créer un sous-dossier dans ce dossier nommé de la même manière que le fichier sélectionné, cliquez sur la case à cocher «Créer un dossier ici» afin qu’il y ait une coche dans la case. Ensuite, cliquez sur «Suivant».

Sur l’écran Prêt à démarrer, cliquez sur «Démarrer» pour commencer l’extraction des images.

L’écran suivant s’affiche pendant le processus d’extraction.

Sur l’écran Terminé, cliquez sur «Cliquez ici pour ouvrir le dossier de destination» pour afficher les fichiers d’image résultants.

Parce que nous avons choisi de créer un sous-dossier, nous obtenons un dossier contenant les fichiers image extraits du fichier.

Vous verrez toutes les images sous forme de fichiers numérotés.

Vous pouvez également extraire des images de plusieurs fichiers à la fois. Pour ce faire, sur l’écran Entrée et sortie, cliquez sur la case à cocher «Mode par lots» afin qu’il y ait une coche dans la case.

L’écran Entrée et sortie par lots s’affiche. Cliquez sur «Ajouter des fichiers».

Dans la boîte de dialogue Ouvrir, accédez au dossier contenant l’un des fichiers dont vous souhaitez extraire les images, sélectionnez les fichiers à l’aide de la touche «Maj» ou «Ctrl» pour sélectionner plusieurs fichiers, puis cliquez sur «Ouvrir».

Vous pouvez ajouter des fichiers à partir d’un autre dossier en cliquant à nouveau sur «Ajouter des fichiers», en naviguant jusqu’au dossier dans la boîte de dialogue Ouvrir, en sélectionnant les fichiers souhaités et en cliquant sur «Ouvrir».

Une fois que vous avez ajouté tous les fichiers à partir desquels vous souhaitez extraire des images, vous pouvez choisir de créer un dossier distinct pour chaque document dans le même dossier que chaque document dans lequel les fichiers image seront enregistrés en cliquant sur le bouton «Créer un dossier pour la case à cocher de chaque document »afin qu’il y ait une coche dans la case.

26_clic_next_on_batch_mode

Vous pouvez également spécifier que le dossier de sortie est «Identique au dossier d’entrée de chaque fichier» ou entrer ou sélectionner un dossier personnalisé à l’aide de la zone d’édition et du bouton «Parcourir» sous cette option. Cliquez sur «Suivant» une fois que vous avez sélectionné les options souhaitées.

26a_specifying_output_folder

Cliquez sur «Démarrer» sur l’écran Prêt à démarrer.

L’écran suivant s’affiche, indiquant la progression de l’extraction.

Le nombre d’images extraites s’affiche sur l’écran Terminé. Cliquez sur «Fermer» pour fermer l’assistant d’extraction d’image Office.

Si vous choisissez de créer un dossier séparé pour chaque document, vous verrez des dossiers portant les mêmes noms que les fichiers contenant les images, quel que soit le ou les dossiers de sortie que vous avez spécifiés.

Encore une fois, nous obtenons toutes les images sous forme de fichiers numérotés pour chaque document.

Vous pouvez désormais renommer les images, les déplacer et les utiliser dans vos propres documents. Assurez-vous simplement que vous avez le droit de les utiliser légalement.

Moyens Staff
Moyens I/O Staff vous a motivé, donner des conseils sur la technologie, le développement personnel, le style de vie et des stratégies qui vous aider.