ابزار markitdown؛ همه چیز را به فرمت markdown تبدیل کن!
مایکروسافت یک کتابخونه به نام MarkItDown را به صورت متنباز بیرون داده که باهاش میتونید فایلهایی با فرمتهای زیر را به فرمت markdown (مثل فایلهای readme گیت) تبدیل کنید.
فایل ورد فارسی رو هم خوب پشتیبانی میکنه
• PDF
• PowerPoint
• Word
• Excel
• Images (EXIF metadata and OCR)
• Audio (EXIF metadata and speech transcription)
• HTML
• Text-based formats (CSV, JSON, XML)
• ZIP files (iterates over contents)
https://github.com/microsoft/markitdown/tree/main
🙏Thanks to: @nlp_stuff
مایکروسافت یک کتابخونه به نام MarkItDown را به صورت متنباز بیرون داده که باهاش میتونید فایلهایی با فرمتهای زیر را به فرمت markdown (مثل فایلهای readme گیت) تبدیل کنید.
فایل ورد فارسی رو هم خوب پشتیبانی میکنه
• PowerPoint
• Word
• Excel
• Images (EXIF metadata and OCR)
• Audio (EXIF metadata and speech transcription)
• HTML
• Text-based formats (CSV, JSON, XML)
• ZIP files (iterates over contents)
https://github.com/microsoft/markitdown/tree/main
🙏Thanks to: @nlp_stuff