MarkItDown:一款好用的将文件和办公文档转换为Markdown的AI工具!

MarkItDown是什么?

MarkItDown是一款由微软支持的能够将多种文件格式(比如 PDF、Word、Excel、PowerPoint、图像、音频、网页等)转换为 Markdown 格式的开源工具。它还特别针对LLM的应用进行了优化,使输出的内容不仅适合人工阅读,也是 LLM 的理想输入格式。

MarkItDown MCP:将网页链接、本地文件以及数据转换为Markdown格式.jpg

MarkItDown功能特点

  • 多格式支持:支持转换 PDF、Word、Excel、ppt、图片(含 OCR 识别)、音频(语音转文字)、HTML、网页(如 YouTube 链接)等格式为结构化 Markdown。并且保留标题层级、表格结构等核心内容,适合 ai 理解与分析。

  • MCP 协议集成:作为 MCP 服务器,允许 AI 工具(如 Claude Desktop)通过标准协议调用文件转换功能,无需编程即可实现“语音指令转文件处理”。例如,用户说“将这份 PDF 转成 Markdown”,AI 可自动调用 MarkItDown 完成转换。

MarkItDown应用场景

  • 学术研究:快速转换论文、文献为 Markdown,便于文本分析。

  • 办公自动化:将会议录音、PPT 等转为结构化笔记。

  • AI 工作流:结合 LLM 实现“语音指令→文件处理→内容总结”全链路自动化。

MarkItDown如何安装使用?

1. 安装与启动

  • 命令行模式:

pip install markitdown-mcp
markitdown-mcp  # 启动 STDIO 模式
markitdown-mcp --sse --host 127.0.0.1 --port 3001  # 启动 SSE 服务[2,4,5](@ref)
  • Docker 部署:

docker build -t markitdown-mcp:latest .
docker run -it --rm markitdown-mcp:latest  # 默认 STDIO 模式
docker run -it --rm -v /本地目录:/workdir markitdown-mcp:latest  # 挂载本地文件[4,5](@ref)

2. 与 Claude Desktop 配置

在 claude_desktop_config.json 中添加以下配置,启用 MarkItDown MCP 服务:

{
"mcpServers": {
"markitdown": {
"command": "docker",
"args": ["run", "--rm", "-i", "-v", "/本地目录:/workdir", "markitdown-mcp:latest"]
}
}
}

配置后,Claude 可直接调用文件转换功能。

3. Python API 调用

from markitdown import MarkItDown
md = MarkItDown(enable_plugins=True)
result = md.convert("input.pdf")  # 转换为 Markdown 文本
print(result.text_content)

支持通过 llm_client 参数接入 LLM 模型(如 GPT-4o)优化输出。

github:https://github.com/microsoft/markitdown/tree/main/packages/markitdown-mcp

收藏

相关文章

最新工具
Aice PS
Aice PS

网页版AI照片编辑器,利用Google aistudio的的先进...

FlightRadar24
FlightRadar24

一个实时航班追踪工具。它把谷歌地图、航空信息,还有 ADS-B、...

VeeSpark
VeeSpark

一个能做AI内容生成的平台,主要帮人通过文字或图片快速做出视频和...

Hitem3D AI
Hitem3D AI

Math Magic公司开发的工具,用他们自研的高精度AI模型S...

Tools.Dverso.io
Tools.Dverso.io

一个带洗衣游戏感的在线抠图工具,是个能去掉图片背景的网站,它的特...

Neural4D
Neural4D

一个专注3D动态场景生成与交互的创新平台,核心是用人工智能技术把...

Emergent.sh
Emergent.sh

一个只需一句话就可生成APP应用的开发平台,覆盖从需求规划到最终...

可行旅记
可行旅记

一个AI旅游助手,功能有自动生成旅行计划、查景点/美食/酒店等信...

ASCII2D
ASCII2D

一个专注二次元的在线以图搜图网站,能帮二次元爱好者找图片、查来源...

UXbot
UXbot

一个 主打“想象,即设计”的AI产品设计工具,可帮用户快速把产品...