Exercices sur le codage des caractères

Voici quelques exercices qui te permettront de te familiariser avec les différentes normes d'encodage des caractères.

  • Pratique

Unicode, UTF-8 et les octets

Ici, nous allons vérifier combien d'octets sont nécessaires pour encoder certains caractères.

Caract.    Octets
a      =   ________     
é      =   ________     
.      =   ________     
~      =   ________     
À      =   ________     
€      =   ________     
É      =   ________     
,      =   ________     
?      =   ________     
@      =   ________     

  • Ouvre un Bloc-Note
  • Enregistre le fichier vide sur ton bureau
  • Pour chaque caractère:
    • écris le caractère
    • sauvegarde le fichier (ctrl-s)
    • vérifie la taille du fichier dans l'explorateur de fichiers
    • note la réponse
    • vide le fichier

Lire comme l'ordinateur

Même si au bout du compte, les caractères sont stockés sous forme binaire, l'ordinateur a plutôt tendance à travailler avec des octets. Dans cet exercice nous allons inspecter nos fichiers et les visualiser comme la machine. Nous allons constater que l'ordinateur travaille en hexadécimal!

  • Créer un nouveau fichier .txt dans VSCode. Copie-colle ce contenu: Espion.

  • Installe le pluging "Hex Viewer" de Microsoft dans Visual Studio Code.

  • Click-droit sur le fichier et sélectionne "Ouvrir Avec..." ( 🇬🇧 Open with) et choisi 'Hex Viewer'

  • A gauche: le code Hexadécimal, à droite: le caractère équivalent. Vérifie la correspondance dans la table ASCII (voir liens). Que constates-tu?

Les retours à la ligne

  • Crée un nouveau fichier texte "retour.txt" sur ton bureau
  • Insère 1 passage à la ligne (appuie 1x sur la touche entrée)
  • Enregistre le fichier
  • Vérifie la taille du fichier dans l'explorateur de fichiers? Quelle est sa taille en octets?
  • Ouvre ton fichier avec l'éditeur hexadécimal. Que constates-tu? Comment un retour à la ligne est-il encodé sous Windows?

Écrire comme l'ordinateur

Toujours dans VSCode, tu peux modifier la partie "Hexadécimal". Bien sûr, tu ne peux y écrire que de l'hexadécimal. A l'aide de l'éditeur hexadécimal, décode le mot qui se cache derrière ce code: 53 65 63 72 65 74 (remplace les octets du mot 'Espion' créé précédemment). ** Quel est le mot secret? ** 😉

Et en binaire ?

A l'aide de la table ASCII, écris le mot "lune" en binaire. Le résultat sera une suite de 4x7 bits. Par exemple "Bonjour" s'écrit 1000010 1101111 1101110 1101010 1101111 1110101 1110010 en binaire. Ecris le résultat sur une feuille de papier ou dans un fichier.

Et les émojis ?

  • Crée un nouveau fichier "emoji.txt" sur ton bureau.
  • Ecris 1 émoji au choix (on fait les paris? 😉)
  • Enregistre le fichier
  • Ouvre le fichier avec l'éditeur hexa de VSCode. Quelles sont les valeurs hexa utilisées pour encoder ton émoji?
  • Maintenant, fais pareil avec l'émoji licorne 🦄. Quelles sont les valeurs hexa utilisées pour encoder l'émoji licorne?

Pour aller plus loin