Théorie des langages : Introduction à Lex (Flex) et Bison (Yacc)

Nous avons tout d'abord vu comment réaliser un microprocesseur élémentaire. Ensuite, nous lui avons fait exécuter quelques instructions simplement par l'ouverture ou la fermeture de circuits. Par après nous avons vu qu'il était possible de réaliser un langage machine, et nous avons vu un interpréteur de langage machine.

Enfin, nous avons vu une introduction aux langages de programmation, et les phases de la compilation.

Nous pouvons à présent mettre en pratique ces différentes notions, et réaliser notre propre compilateur. Pour les exemples qui vont suivre, le compilateur prendra en entrée du code LSD [Langage Simple et Didactique] pour une P-machine. La version utilisée est LSD010. Il s'agit d'un langage proche du C (bien que très simplifié), et comporte comme types scalaires des entiers et des booléens.

Lexique

L'analyse lexicale est la partie la plus facile à vérifier. Nous devons isoler les différents jetons, les symboles terminaux du code.

Comment allons-nous procéder ? Nous allons décrire dans un fichier quelles sont les suites de caractères que nous considérons comme étant des symboles terminaux. Ces suites de caractères ne sont pas toujours identiques pour un même symbole terminal, et nous avons la possibilité de définir quelles sont les expressions qui correspondent à ce symbole en utilisant les expressions rationnelles2.

Nous utiliserons Lex5 pour écrire notre spécification lexicale.

A chaque fois qu'un symbole terminal sera rencontré lors de l'analyse, nous sauverons ce dernier dans une table des symboles. Nous devrons aussi mémoriser d'autres informations, comme le type (dans le cas de notre langage simple, des entiers ou des booléens), l'endroit où se trouve cette variable en mémoire, etc.

Contents Haut

Syntaxe

Nous utiliserons Bison ou YACC [“Yet Another Compiler Compiler”6] pour construire notre arbre syntaxique abstrait.

Comme l'arbre syntaxique abstrait mérite un peu plus d'explications, une page lui est consacrée plus loin.

Syntaxe et sémantique

Pour plus d'informations sur les différences entre la syntaxe et la sémantique, vous pouvez consulter la page d'introduction aux algorithmes.

Contents Haut

Remarque : Ordre des pages et ordre des commandes

Nous verrons d'abord l'analyse lexicale avant l'analyse syntaxique. Cependant, comme nous utiliserons Lex et YACC, nous devrons veiller à introduire la commande yacc avant celle de lex.

Ordre de compilation...

Le fichier lex.yy est compilé avec la sortie de YACC. Comme nous déclarons généralement nos constantes dans le fichier YACC, nous devons traiter ce dernier avant le fichier Lex.

Code source du compilateur LSD010

Vous pouvez explorer et consulter la totalité du code source de l'exemple du compilateur LSD010 à cette adresse : https://www.gaudry.be/en/langages-lsd10-source.html

Contents Haut

English translation

You have asked to visit this site in English. For now, only the interface is translated, but not all the content yet.

If you want to help me in translations, your contribution is welcome. All you need to do is register on the site, and send me a message asking me to add you to the group of translators, which will give you the opportunity to translate the pages you want. A link at the bottom of each translated page indicates that you are the translator, and has a link to your profile.

Thank you in advance.

Document created the 29/01/2010, last modified the 28/10/2018
Source of the printed document:https://www.gaudry.be/en/langages-lex-yacc-intro.html

The infobrol is a personal site whose content is my sole responsibility. The text is available under CreativeCommons license (BY-NC-SA). More info on the terms of use and the author.

Notes

  1.  LSD : Langage Simple et Didactique Il existe une un certain nombre d'interprétations de l'acronyme LSD (Langage Symbolique Didactique, Langage Sans Difficulté, Langage Simple et Didactique), et vous pouvez aussi consulter le document en référenceref 2.

  2.  Expressions rationnelles : Le terme « expressions régulières » est souvent employé comme traduction textuelle de l'anglais “regular expressions”, mais nous devrions bien employer « expressions rationnelles ».

  3. a,b Gnu's Not Unix : corresponds to « GNU n'est pas UNIX » en français

  4. a,b GNU : “Gnu's Not Unix” (en français, « GNU n'est pas UNIX ») Groupement de logiciels libres. Il s'agit d'un acronyme récursif, car nous retrouvons l'acronyme dans sa propre définition.

  5.  Lex : Nous emploierons le terme Lex pour désigner l'outil d'analyse lexicale, mais il peut s'agir de Flex, son équivalant GNU

  6. a,b,c,d,e Yet Another Compiler Compiler : corresponds to « Encore un autre compilateur de compilateur » en français

  7. a,b,c,d YACC : “Yet Another Compiler Compiler” (en français, « Encore un autre compilateur de compilateur ») Nous emploierons le terme Yacc, mais il peut s'agir de Bison, son équivalant GNU

  8. a,b LSD010 : Langage Simple et Didactique Il existe une un certain nombre d'interprétations de l'acronyme LSD (Langage Symbolique Didactique, Langage Sans Difficulté, Langage Simple et Didactique). LSD010 est la version 2010 de la suite LSD80, LSD_02, LSD03, LSD04, LSD05, LSD06, LSD07, LSD08, et LSD09.

Contents Haut

References

  1. book Language of the document:fr IHDCB332 - Théorie des langages : Syntaxe et sémantique : PY Schobbens, Syntaxe et sémantique (January 2010)
  2. View the nbsp;document Language of the document:fr LSD : Yves Noyelle, La Saga du LSE et de sa famille (LSD/LSG/LST) (version 28/01/10)

These references and links indicate documents consulted during the writing of this page, or which may provide additional information, but the authors of these sources can not be held responsible for the content of this page.
The author This site is solely responsible for the way in which the various concepts, and the freedoms that are taken with the reference works, are presented here. Remember that you must cross multiple source information to reduce the risk of errors.

Contents Haut