Proyecto candidato

anyformat 

Transforma documentos complejos y no estructurados en datos fiables, verificables y accionables mediante IA avanzada.

Datos del proyecto

anyformat transforma documentos complejos y no estructurados en datos fiables, verificables y accionables mediante IA avanzada. Permite a organizaciones públicas y privadas automatizar flujos documentales críticos con altos niveles de precisión, trazabilidad y privacidad. 

Autoría 

Anyformat SL 

Categoría 

Gobernanza y participación 

Localización 

Madrid 

Tecnologías clave 

Machine learning 
Deep learning 
Procesamiento del lenguaje natural (NLP) 
Visión artificial 
Generative AI (texto, imagen, voz o código) 

Nivel de madurez tecnológica 

TRL 9 — Sistema probado en entorno operativo real 

Beneficiarios 

Directos: 

– Equipos legales, administrativos, compliance y operaciones. 

– Organismos públicos que manejan grandes volúmenes de documentación. 

– Empresas que necesitan datos fiables para análisis, auditorías o decisiones. 

Indirectos: 

– Ciudadanía que depende de trámites más rápidos y libres de errores. 

– Profesionales liberados de tareas repetitivas, permitiendo trabajo de mayor valor. 

– Entornos donde la agilidad documental impacta servicios esenciales (justicia, educación, sanidad, servicios sociales). 

Indicadores o KPI de impacto 

Valores aproximados basados en clientes y pilotos actuales: 

– Más de 15 millones de páginas procesadas en escenarios reales y preproducción. 

– Reducción de hasta el 90% en tiempos de procesamiento documental. 

– Ahorro operativo medio hasta el 70% para equipos legales y administrativos. 

– Tasa de precisión superior al 95% en flujos estructurados. 

– Cero incidentes de fuga de datos, gracias a arquitectura privacy-first y despliegues controlados. 

– Tiempos de puesta en marcha 10x inferiores respecto a soluciones tradicionales de OCR. 

Capacidad tecnológica del proyecto 

anyformat combina: 

– Computación en contenedores altamente optimizados. 

– Frameworks como PyTorch, Transformers, LangGraph y motores multimodales. 

– Modelos LLM generalistas y modelos especializados en documentos. 

– Pipelines de OCR, visión, NLP, layout analysis y generative reasoning. 

– Integraciones API-first, SDKs y una interfaz de orquestación no-code. 

– Observabilidad end-to-end con trazabilidad completa, métricas y auditoría. 

Sostenibilidad, huella ambiental y licencia social 

– Arquitectura optimizada para reducir cómputo, reutilizar inferencias y minimizar cargas. 

– Posibilidad de despliegues locales que disminuyen transferencia de datos y energía cloud. 

– Mecanismos para reducir sesgo algorítmico en clasificación y extracción. 

– Transparencia y explicabilidad para reforzar la confianza de usuarios finales y organismos reguladores.