Théorie des langages : Introduction à Lex (Flex) et Bison (Yacc)

Sommaire du document

Nous avons tout d'abord vu comment réaliser un microprocesseur élémentaire. Ensuite, nous lui avons fait exécuter quelques instructions simplement par l'ouverture ou la fermeture de circuits. Par après nous avons vu qu'il était possible de réaliser un langage machine, et nous avons vu un interpréteur de langage machine.

Enfin, nous avons vu une introduction aux langages de programmation, et les phases de la compilation.

Nous pouvons à présent mettre en pratique ces différentes notions, et réaliser notre propre compilateur. Pour les exemples qui vont suivre, le compilateur prendra en entrée du code LSD [Langage Simple et Didactique] pour une P-machine. La version utilisée est LSD010. Il s'agit d'un langage proche du C (bien que très simplifié), et comporte comme types scalaires des entiers et des booléens.

Lexique

L'analyse lexicale est la partie la plus facile à vérifier. Nous devons isoler les différents jetons, les symboles terminaux du code.

Comment allons-nous procéder ? Nous allons décrire dans un fichier quelles sont les suites de caractères que nous considérons comme étant des symboles terminaux. Ces suites de caractères ne sont pas toujours identiques pour un même symbole terminal, et nous avons la possibilité de définir quelles sont les expressions qui correspondent à ce symbole en utilisant les expressions rationnelles[2].

Nous utiliserons Lex[5] pour écrire notre spécification lexicale.

A chaque fois qu'un symbole terminal sera rencontré lors de l'analyse, nous sauverons ce dernier dans une table des symboles. Nous devrons aussi mémoriser d'autres informations, comme le type (dans le cas de notre langage simple, des entiers ou des booléens), l'endroit où se trouve cette variable en mémoire, etc.

 

Syntaxe

Nous utiliserons Bison ou YACC [“Yet Another Compiler Compiler”[6]] pour construire notre arbre syntaxique abstrait.

Comme l'arbre syntaxique abstrait mérite un peu plus d'explications, une page lui est consacrée plus loin.

Syntaxe et sémantique

Pour plus d'informations sur les différences entre la syntaxe et la sémantique, vous pouvez consulter la page d'introduction aux algorithmes.

 

Remarque : Ordre des pages et ordre des commandes

Nous verrons d'abord l'analyse lexicale avant l'analyse syntaxique. Cependant, comme nous utiliserons Lex et YACC, nous devrons veiller à introduire la commande yacc avant celle de lex.

Ordre de compilation...

Le fichier lex.yy est compilé avec la sortie de YACC. Comme nous déclarons généralement nos constantes dans le fichier YACC, nous devons traiter ce dernier avant le fichier Lex.

Code source du compilateur LSD010

Vous pouvez explorer et consulter la totalité du code source de l'exemple du compilateur LSD010 à cette adresse : https://www.gaudry.be/langages-lsd10-source.html

 

Réseaux sociaux

Vous pouvez modifier vos préférences dans votre profil pour ne plus afficher les interactions avec les réseaux sociaux sur ces pages.

 

Notes

  1.  LSD : Langage Simple et Didactique Il existe une un certain nombre d'interprétations de l'acronyme LSD (Langage Symbolique Didactique, Langage Sans Difficulté, Langage Simple et Didactique), et vous pouvez aussi consulter le document en référence[ref 2].

  2.  Expressions rationnelles : Le terme « expressions régulières » est souvent employé comme traduction textuelle de l'anglais “regular expressions”, mais nous devrions bien employer « expressions rationnelles ».

  3. a,b Gnu's Not Unix : correspond à « GNU n'est pas UNIX” en français

  4. a,b GNU : “Gnu's Not Unix” (en français, « GNU n'est pas UNIX ») Groupement de logiciels libres. Il s'agit d'un acronyme récursif, car nous retrouvons l'acronyme dans sa propre définition.

  5.  Lex : Nous emploierons le terme Lex pour désigner l'outil d'analyse lexicale, mais il peut s'agir de Flex, son équivalant GNU

  6. a,b,c,d,e Yet Another Compiler Compiler : correspond à « Encore un autre compilateur de compilateur” en français

  7. a,b,c,d YACC : “Yet Another Compiler Compiler” (en français, « Encore un autre compilateur de compilateur ») Nous emploierons le terme Yacc, mais il peut s'agir de Bison, son équivalant GNU

  8. a,b LSD010 : Langage Simple et Didactique Il existe une un certain nombre d'interprétations de l'acronyme LSD (Langage Symbolique Didactique, Langage Sans Difficulté, Langage Simple et Didactique). LSD010 est la version 2010 de la suite LSD80, LSD_02, LSD03, LSD04, LSD05, LSD06, LSD07, LSD08, et LSD09.

 

Références

  1. livre Langue du document: fr IHDCB332 - Théorie des langages : Syntaxe et sémantique : PY Schobbens, Syntaxe et sémantique (Janvier 2010)
  2. Consulter le document html Langue du document: fr LSD : Yves Noyelle, La Saga du LSE et de sa famille (LSD/LSG/LST) (version 28/01/10)

Ces références et liens indiquent des documents consultés lors de la rédaction de cette page, ou qui peuvent apporter un complément d'information, mais les auteurs de ces sources ne peuvent être tenus responsables du contenu de cette page.
L'auteur de ce site est seul responsable de la manière dont sont présentés ici les différents concepts, et des libertés qui sont prises avec les ouvrages de référence. N'oubliez pas que vous devez croiser les informations de sources multiples afin de diminuer les risques d'erreurs.

 

Astuce pour imprimer les couleurs des cellules de tableaux : http://www.gaudry.be/ast-rf-450.html
Aucun commentaire pour cette page

© Ce document issu de l′infobrol est enregistré sous le certificat Cyber PrInterDeposit Digital Numbertection. Enregistrement IDDN n° 5329-10132
Document créé le 29/01/10 03:44, dernière modification le Vendredi 17 Juin 2011, 12:12
Source du document imprimé : http:///www.gaudry.be/langages-lex-yacc-intro.html
St.Gaudry©07.01.02
Outils (masquer)
||
Recherche (afficher)
Recherche :

Utilisateur (masquer)
Apparence (afficher)
Stats (afficher)
15838 documents
455 astuces.
550 niouzes.
3107 definitions.
447 membres.
8121 messages.

Document genere en :
0,10 seconde

Mises à jour :
Mises à jour du site
Citation (masquer)
Je n’ai pas échoué. J’ai simplement trouvé 10.000 solutions qui ne fonctionnent pas.

Thomas Edison
 
l'infobrol
Nous sommes le Mercredi 24 Mai 2017, 00:21, toutes les heures sont au format GMT+1.00 Heure, heure d'été (+1)