微软发布了一个文档转Markdown的利器:MarkItDown

Python3.8

Python3.8

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

目录

什么是 Markdown?

便捷高效

多文档格式支持

开放源码

使用教程


 

图片

微软近期开源了一个叫 MarkItDown 的文档转换工具,可以将各种文件轻松转换为Markdown格式,今天就来给大家介绍一下!

什么是 Markdown?

图片

Markdown 是一种轻量级标记语言,由 John Gruber 和 Aaron Swartz 在 2004 年共同创建。它以其简洁的语法和易读性而闻名,非常适合用于编写结构化的文档。Markdown 文件通常以 .md 或 .markdown 为扩展名,可以在各种平台和设备上轻松编辑和预览。目前Markdown 是自媒体创作者和程序员使用最广泛的文档语言。

软件:Typora 非常全面使用教程,程序员写文档必备工具

MarkItDown 的主要功能

图片

MarkItDown 是微软近期开源的一款专门用于将各种文件转换为 Markdown 格式的工具。

MarkItDown 支持转换的格式

  • PDF:支持将 PDF 文件中的文本内容提取并转换为 Markdown 格式。

  • PPT:将 PowerPoint 演示文稿中的文本和图像内容转换为 Markdown。

  • Word:将 Word 文档中的内容转换为 Markdown,保留基本的格式和结构。

  • Excel

  • 图像(EXIF 元数据和 OCR 光学字符识别)

  • 音频(EXIF 元数据和语音转文字)

  • HTML:将 HTML 文件中的内容转换为 Markdown,保留基本的格式和结构。

  • CSV、JSON、XML:将 CSV、JSON 和 XML 文件中的数据转换为 Markdown 格式,便于进一步处理和分析。

  • ZIP 文件(迭代处理压缩包内的文件)

MarkItDown 的优势

便捷高效

图片

MarkItDown 提供了一种简单易用的界面,用户只需上传文件即可自动完成转换过程。无需复杂的设置和配置,大大节省了用户的时间和精力。

多文档格式支持

MarkItDown 支持十几种常见文件格式。无论是文档、表格、图像还是音频文件,MarkItDown 都能实现转换。

开放源码

MarkItDown 是一款开源工具,用户可以根据需要进行定制和扩展,满足个性化的需求。

官网

使用教程

这里给大家简单说一下如何本地使用MarkItDown。这里以Win10电脑为例。

因为MarkItDown基于Python环境开发,所以需要安装Python并且配置环境变量。

Python下载官网:https://www.python.org/downloads/

图片

然后点击Windows进入下载界面

图片

然后下载安装包,版本我这边下载的是3.12.8.

下载后正常安装python,默认勾选配置环境变量即可。安装步骤非常简单,直接一步步操作就行了,这里就不多说了。

安装python并且配置环境变量ok后可以使用cmd命令检查是否安装成功。

运行cmd命令窗口,输入

python

回车,正确安装python如下图:

图片

然后安装依赖包,输入如下命令:

pip install markitdown

安装效果如下图:

图片

安装完成后就可以使用命令行进行测试了。

这里找一个text.xlsx文件,文件效果如下图:

图片

markitdown test.xlsx > test.md

执行命令后如下图:

图片

转换成功后打开转换后的效果如下图:

图片

目前测试过程中发现几个不足之处:

  • 带有图片的文档转换,图片转换总是失败

  • pdf针对编码有问题,容易出现转换报错的情况

图片

估计后续还要不少问题等待修复和优化,毕竟刚开源不久,等待后续更好用的版本发布吧。

总结

以上是微软发布MarkItDown工具的介绍,大家如果在配置当中有啥问题欢迎评论区沟通交流!

微软发布了一个文档转Markdown的利器:MarkItDown

您可能感兴趣的与本文相关的镜像

Python3.8

Python3.8

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

IT技术分享社区

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值