oeuvres/teinte

将文本从和转换为:TEI,DOCX,HTML,EPUB,MD。

0.1 2022-12-10 00:51 UTC

This package is auto-updated.

Last update: 2024-09-15 00:39:30 UTC


README

Teinte_php是一个用PHP转换和发布文本的开源库。它作为composer包oeuvres/teinte提供。核心是一个嵌入的XSLT-1.0转换包teinte_xsl。枢纽格式是TEI的一个子集,这是一个专门用于所有文本形式的学术XML模式,不仅限于博客文章,还包括:小说、戏剧、信件…Teinte suite 已开发超过15年,主要由Frédéric Glorieux在不同学术机构下完成。

Teinte xsl

使用Teinte的一些项目

Denis de Rougemont(1906–1985)的完整作品

由Nicolas Stenger(日内瓦大学)领导的《eRougemont》项目,包括30多本书和1000篇文章的完整作品的数字化、出版和挖掘。使用了Teinte将OCR获取的文件从DOCX转换为TEI。编辑团队接受了TEI的培训。网络出版是从XML主文件到HTML,用于大学的CMS(Concrete 5)。

ObTIC转换器

ObTIC,即“文本、思想和语料库观察站”,是索邦大学的实验室,专注于文本。使用Teinte转换来自不同来源和目的地的文本。他们的支持使得在线转换界面变得友好。

Galenus verbatim,Galen(129–216)的完整作品

由Nathalie Rousseau(索邦大学)领导的《Galenus verbatim》项目是一个电子版,具有词源化的搜索引擎,用于约100本“书”,或14,000页的Pergamon的Galen的完整作品。《Teinte》用于开源的希腊作品,从Epidoc TEI转换为HTML,以及现代拉丁语的数字版新编辑,从OCR、docx到TEI(和HTML)。他们的支持使得开发一个专注于文本出版的PHP框架成为可能,具有路由、日志记录,特别是,转换。

eBalzac,Honoré de Balzac(1799–1850)的完整作品

eBalzac 《eBalzac》项目;由安德烈亚·德尔·隆戈(里尔大学)、皮埃尔·格拉德斯(索邦大学)和让-加布里埃尔·加纳西亚(索邦大学)指导;是根据《费尔涅校订》版本(作者最后一次校订)出版的巴尔扎克作品的开源新版本。Teinte被用来将编辑的DOCX文件转换为TEI格式,并为出版(HTML)和研究(TXT)生成不同格式。他们对质量的要求非常高,代码质量也很不错。