Les données d'entraînement ne peuvent pas être de n'importe quelle forme. En particulier, une ponctuation ne peut suivre un délimiteur. Il faut une phase de validation des données:
- pas de délimiteur en fin d'exemple
- pas de délimiteur devant une ponctuation
Pour le deuxième point £([^A-Za-zẽ]) devrait permettre d'identifier les problèmes.