PAGE ACCUEIL

Teipot

 
25 Mars 2015

Teipot

Teipot est une librairie logiciel libre de moteur de recherche en ligne, utilisé pour tous les corpus OBVIL. Elle peut fonctionner sur un serveur web mutualisé (PHP) sans extensions exotiques ou dépendances à un service dans un autre langage. Ce développement spécifique OBVIL répond au cahier des charges suivant, en ordre de priorité :

  • dimensionné pour plusieurs milliers de livres
  • contrôle total sur la qualité et la structure de l’édition
  • gestion de plusieurs corpus indépendants
  • possibilité d’indexation hors ligne sans peser sur le serveur public
  • faible empreinte mémoire et réponse rapide
  • installation facile et pas d’administration

La recherche plein texte sur plus de 100 livres est un problème récurrent dans les humanités numériques. Ce n’est pas un besoin industriel satisfait par de gros projets libres, les logiciels académiques existants soutiennent rarement ces quantités, d’autres reposent sur des langages ou des composants logiciels fragiles, qui craignent les mises à jour système. Ce cahier des charges technologiques contraignant limite les fonctionnalités implémentées, on trouvera surtout de la concordance plein texte, et des facettes (dates, et bientôt, auteur, type de texte, indexation sujet). L’architecture technologique semble cependant assez robuste pour ajouter de nouvelles fonctionnalités, et notamment, l’indexation et la recherche lemmatisée.