Proyecto candidato

anyformat

Transforma documentos complejos y no estructurados en datos fiables, verificables y accionables mediante IA avanzada.

Datos del proyecto

anyformat transforma documentos complejos y no estructurados en datos fiables, verificables y accionables mediante IA avanzada. Permite a organizaciones públicas y privadas automatizar flujos documentales críticos con altos niveles de precisión, trazabilidad y privacidad.

Autoría

Anyformat SL

Categoría

Gobernanza y participación

Localización

Madrid

Tecnologías clave

Machine learning
Deep learning
Procesamiento del lenguaje natural (NLP)
Visión artificial
Generative AI (texto, imagen, voz o código)

Nivel de madurez tecnológica

TRL 9 — Sistema probado en entorno operativo real

Beneficiarios

Directos:

– Equipos legales, administrativos, compliance y operaciones.

– Organismos públicos que manejan grandes volúmenes de documentación.

– Empresas que necesitan datos fiables para análisis, auditorías o decisiones.

Indirectos:

– Ciudadanía que depende de trámites más rápidos y libres de errores.

– Profesionales liberados de tareas repetitivas, permitiendo trabajo de mayor valor.

– Entornos donde la agilidad documental impacta servicios esenciales (justicia, educación, sanidad, servicios sociales).

Indicadores o KPI de impacto

Valores aproximados basados en clientes y pilotos actuales:

– Más de 15 millones de páginas procesadas en escenarios reales y preproducción.

– Reducción de hasta el 90% en tiempos de procesamiento documental.

– Ahorro operativo medio hasta el 70% para equipos legales y administrativos.

– Tasa de precisión superior al 95% en flujos estructurados.

– Cero incidentes de fuga de datos, gracias a arquitectura privacy-first y despliegues controlados.

– Tiempos de puesta en marcha 10x inferiores respecto a soluciones tradicionales de OCR.

Capacidad tecnológica del proyecto

anyformat combina:

– Computación en contenedores altamente optimizados.

– Frameworks como PyTorch, Transformers, LangGraph y motores multimodales.

– Modelos LLM generalistas y modelos especializados en documentos.

– Pipelines de OCR, visión, NLP, layout analysis y generative reasoning.

– Integraciones API-first, SDKs y una interfaz de orquestación no-code.

– Observabilidad end-to-end con trazabilidad completa, métricas y auditoría.

Sostenibilidad, huella ambiental y licencia social

– Arquitectura optimizada para reducir cómputo, reutilizar inferencias y minimizar cargas.

– Posibilidad de despliegues locales que disminuyen transferencia de datos y energía cloud.

– Mecanismos para reducir sesgo algorítmico en clasificación y extracción.

– Transparencia y explicabilidad para reforzar la confianza de usuarios finales y organismos reguladores.