Pourquoi les fichiers PDF générés par Microsoft Word sont-ils si volumineux?

Lorsque vos documents sont principalement de nature textuelle, il semblerait que les tailles de fichier pour les versions .docx et .pdf devraient être assez similaires lors de l’enregistrement, mais ce n’est pas toujours le cas. Le post de questions-réponses des super-utilisateurs d’aujourd’hui a la réponse aux questions d’un lecteur curieux sur la grande différence de taille de fichier.

La session de questions et réponses d’aujourd’hui nous est offerte par SuperUser, une subdivision de Stack Exchange, un regroupement communautaire de sites Web de questions-réponses.

Gants de boxe clip-art avec l’aimable autorisation de Clker.com.

La question

Le lecteur SuperUser Borek veut savoir pourquoi les fichiers PDF générés par Microsoft Word sont si volumineux:

J’ai créé un simple document Microsoft Word ne contenant que cette phrase, rien d’autre:

  • Ceci est un petit document.

Ensuite, j’ai enregistré le document sous forme de fichiers .docx et .pdf. Voici les tailles de fichier:

  • .docx: 12 Ko
  • .pdf: 89 Ko

La différence entre les deux fichiers est énorme (techniquement) et cela me dérange vraiment lorsque les documents qui sont principalement de nature textuelle ne font que des dizaines de Ko au format .docx, mais sont des centaines de Ko lorsqu’ils sont convertis en fichiers PDF. Qu’y a-t-il de si inefficace dans le format PDF? Est-ce juste Microsoft Word utilisant un algorithme de sortie terrible?

À propos, les paramètres de sortie PDF de mon installation Microsoft Office sont définis pour créer les plus petits fichiers possibles:

Pourquoi les fichiers PDF générés par Microsoft Word sont-ils si volumineux?

La réponse

Rene, contributeur SuperUser, a la réponse pour nous:

Si vous ouvrez le fichier PDF dans Notepad ++, vous trouverez:

Et cet objet est référencé ici à la fin dans l’instruction / FontFile2:

Les polices utilisées par un document Microsoft Word sont intégrées dans des fichiers PDF de manière à ce qu’elles soient autonomes. j’ai utilisé ce diaporama d’Adobe pour déchiffrer les instructions PDF.

Si vous souhaitez empêcher l’intégration de polices dans un fichier PDF, assurez-vous que vos documents Microsoft Word utilisent l’une des 14 polices de caractères standard disponibles dans les visionneuses PDF (Source: Wikipédia).

  • Times New Roman> Times (v3) (en italique normal, italique, gras et gras italique)
  • Courier New> Courier (en oblique régulier, oblique, gras et gras)
  • Arial> Helvetica (v3) (en oblique régulier, oblique, gras et gras)
  • Symbole> Symbole
  • Wingdings> Dingbats Zapf

Avez-vous quelque chose à ajouter à l’explication? Sonnez dans les commentaires. Vous voulez lire plus de réponses d’autres utilisateurs de Stack Exchange férus de technologie? Consultez le fil de discussion complet ici.

En relation :  5 façons de planifier automatiquement votre journée
Moyens Staff
Moyens I/O Staff vous a motivé, donner des conseils sur la technologie, le développement personnel, le style de vie et des stratégies qui vous aider.