La digitalización del patrimonio documental constituye uno de los mayores desafíos actuales dentro de la preservación histórica. Millones de documentos manuscritos permanecen almacenados en archivos de todo el mundo sin estar disponibles en formato digital debido a la dificultad que supone transcribir textos escritos a mano hace siglos.
El R.O.A.D. Barbados Historic Handwriting Challenge, organizado por Zindi, propone desarrollar un modelo de Inteligencia Artificial capaz de reconocer automáticamente escritura manuscrita histórica procedente de los archivos nacionales de Barbados. El objetivo es convertir imágenes de documentos históricos en texto digital, facilitando su conservación, búsqueda y estudio por parte de investigadores, historiadores y la sociedad en general.
Estado del proyecto
Última actualización: 26 de junio de 2026
🚧 Proyecto en desarrollo
Objetivo del proyecto
El objetivo consiste en desarrollar un sistema de Handwritten Text Recognition (HTR) capaz de transcribir correctamente palabras manuscritas presentes en documentos históricos de los siglos XVIII y XIX.
Cada muestra del conjunto de datos contiene una imagen recortada con una o varias palabras escritas a mano. El modelo deberá aprender a interpretar distintos estilos de escritura antigua, tinta degradada, documentos deteriorados y otras imperfecciones propias del paso del tiempo.
El resultado esperado es una transcripción textual lo más fiel posible al contenido original.
El reto
Este proyecto presenta numerosas dificultades que lo diferencian de un problema clásico de OCR:
- Escritura manuscrita muy variable.
- Caligrafía de los siglos XVIII y XIX.
- Documentos con tinta desvanecida.
- Papel deteriorado.
- Manchas y ruido visual.
- Espaciado irregular entre caracteres y palabras.
- Diferentes tamaños y estilos de escritura.
Todo ello convierte este desafío en un problema avanzado de visión por computador y reconocimiento de texto.
Dataset
El conjunto de datos está compuesto por aproximadamente 6.000 imágenes obtenidas a partir de documentos históricos reales conservados en los archivos nacionales de Barbados. Cada imagen contiene una línea manuscrita con una o varias palabras.
Los documentos originales incluyen:
- Escrituras de propiedad.
- Testamentos.
- Inventarios.
- Registros legales.
- Documentación administrativa histórica.
Por razones de licencia, el conjunto de datos únicamente puede utilizarse durante la competición y no puede redistribuirse ni emplearse para otros fines.
Tecnologías previstas
Durante el desarrollo del proyecto se evaluarán distintas técnicas empleadas habitualmente en reconocimiento de texto manuscrito, entre ellas:
- Python
- PyTorch
- OpenCV
- Transformers
- Vision Transformers (ViT)
- Modelos CNN + BiLSTM + CTC
- TrOCR
- Donut
- Técnicas de Data Augmentation
- Beam Search Decoding
La selección definitiva dependerá de los resultados obtenidos durante la fase experimental.
Métrica de evaluación
La competición utiliza una evaluación combinada basada en dos métricas:
- Character Error Rate (CER), que mide los errores a nivel de carácter.
- Word Error Rate (WER), que mide los errores a nivel de palabra.
La puntuación final corresponde a la media ponderada entre ambas métricas, otorgando el mismo peso a cada una.
Este sistema permite evaluar tanto la precisión ortográfica como la calidad global de la transcripción.
Estado del proyecto
Actualmente el proyecto se encuentra en fase de preparación.
Las siguientes etapas previstas serán:
- Exploración del dataset.
- Análisis de las imágenes.
- Preprocesamiento.
- Construcción del primer modelo base.
- Optimización y experimentación con arquitecturas HTR.
- Evaluación y envío de resultados a la competición.
- Documentación completa del desarrollo.
Una vez comience oficialmente la competición, esta página irá incorporando todas las fases del proyecto, desde el análisis exploratorio hasta la construcción del modelo final y las conclusiones obtenidas.
Próximamente
Próximamente se publicarán:
- Exploración del dataset.
- Análisis de calidad de las imágenes.
- Preprocesamiento para reconocimiento de escritura.
- Modelos base de Handwritten Text Recognition.
- Entrenamiento y validación.
- Comparativa entre arquitecturas.
- Resultados y conclusiones finales.
