
Comme un certain nombre de vieux messieurs, j’avoue une passion particulière pour les aventures de Sherlock Holmes, dont je relis régulièrement les œuvres canoniques, les apocryphes et les continuateurs, sans parler-même de pèlerinages réguliers dans l’Oberland bernois ou de stations mélancoliques en haut des chutes de Reichenbach.
Mais si on peut lire les œuvres de Conan Doyle, on ne saurait s’entretenir avec le Dr Watson ou avec Irène Adler directement par le biais d’un chatbot.
Jusqu’à ce jour en tout cas, où la page linkedin de l’excellent Ethan Molick nous révèle l’existence de Mr Chatterbox (https://www.linkedin.com/posts/emollick_want-to-talk-to-the-past-here-is-an-llm-ugcPost-7443850893076123648-oven?utm_source=share&utm_medium=member_desktop&rcm=ACoAAAX2b5oB2W8RFgEb7aoRz8wscswBHlxf0Mg).
M. Chatterbox est un modèle de langage entièrement entraîné sur un corpus de plus de 28 000 textes britanniques de l’époque victorienne publiés entre 1837 et 1899, tirés d’un ensemble de données mis à disposition par la British Library. Il ne s’agit pas d’une IA moderne qui prendrait un accent : son vocabulaire, ses idées et sa vision du monde sont exclusivement issus de la littérature du XIXe siècle.
Selon son texte de présentation, il excellerait donc dans les discussions sur la vie, la littérature, la science, la philosophie, les mœurs victoriennes et les grandes questions de l’époque. Interrogez-le sur les chemins de fer, le Crystal Palace, les théories de M. Darwin ou la conduite qu’un gentleman se doit d’adopter.
Dans le cadre d’un exercice de modélisation linguistique historique, M. Chatterbox peut exprimer des opinions typiques de l’époque victorienne. Comme il s’agit d’un modèle de langage, il restituera ainsi l’opinio communis de l’époque, ce qui nous fera immanquablement penser au Dr Watson, à ses balourdises et à ses lieux communs. Pour dialoguer avec Irène Adler, voire avec Sherlock lui-même, il faudra donc trouver autre chose…
Me Charrerbox est accessible ici en version Beta : https://huggingface.co/spaces/tventurella/mr_chatterbox
Me Philippe Ehrenström, avocat, LLM, CAS en Droit et Intelligence artificielle, CAS en protection des données – Entreprise et administration