Herramienta de Python de microsoft/markitdown para convertir archivos y documentos de oficina a Markdown.

La biblioteca MarkItDown es una herramienta de utilidad para convertir varios archivos a Markdown (por ejemplo, para indexación, análisis de texto, etc.) Actualmente admite: PDF (.pdf) PowerPoint (.pptx) Word (.docx) Excel (.xlsx) Imágenes (metadatos EXIF y OCR) Audio (metadatos EXIF y transcripción de voz) HTML (manejo especial de Wikipedia, etc.) Varios otros formatos basados en … Read more