لایبرری اپن سورس، استخراج هر گونه داده از فایل های PDF استفاده کرد.
https://github.com/opendatalab/PDF-Extract-Kit
https://github.com/DS4SD/docling
https://github.com/opendatalab/PDF-Extract-Kit
https://github.com/DS4SD/docling