跳转到主要内容
SoMark MCP Server 是一个基于 Model Context Protocol (MCP) 的服务器,让任何支持 MCP 的 AI 客户端(Claude Desktop、VS Code、Cursor 等)都能直接调用 SoMark 的文档解析能力,无需编写代码。

快速开始

第一步:获取 API Key

前往 somark.tech/workbench/apikey 获取你的 API Key。

第二步:配置 MCP 客户端

将以下配置添加到你的 MCP 客户端配置文件中:
{
  "mcpServers": {
    "somark": {
      "command": "npx",
      "args": ["-y", "github:SoMarkAI/somark_mcp"],
      "env": {
        "SOMARK_API_KEY": "your-api-key-here"
      }
    }
  }
}
配置文件路径:
  • macOS:~/Library/Application Support/Claude/claude_desktop_config.json
  • Windows:%APPDATA%\Claude\claude_desktop_config.json
在 VS Code 设置中找到 MCP 配置项,或编辑 .vscode/mcp.json
在 Cursor 设置中搜索 MCP,将配置添加至对应的 JSON 配置文件。

第三步:开始使用

配置完成后,直接向 AI 助手发送指令即可:
“帮我解析这个 PDF” “提取合同中的关键条款” “把这张图片里的内容转成 Markdown”

可用工具

MCP Server 提供以下三个工具:

check_api_key

检查 SoMark API Key 是否已配置并可用。无需参数。

set_api_key

在运行时设置或更新 API Key,适用于未通过环境变量配置的场景。
参数类型必填说明
api_keystring你的 SoMark API Key

extract_document

解析 PDF 或图片文件,输出 Markdown 或 JSON 格式。
参数类型必填默认值说明
file_pathstring文件的绝对路径
output_format"markdown" | "json""markdown"输出格式
extract_imagesbooleanfalse是否提取文档中的图片
languagestring自动检测语言代码,如 zhenja
调用示例:
// 将 PDF 解析为 Markdown
{
  "file_path": "/path/to/document.pdf",
  "output_format": "markdown"
}

// 将图片解析为 JSON 并提取图片
{
  "file_path": "/path/to/image.png",
  "output_format": "json",
  "extract_images": true,
  "language": "zh"
}

支持的文件格式

文档: pdf doc docx ppt pptx 图片: png jpg jpeg bmp tiff jp2 dib ppm pgm pbm gif heic heif webp xpm tga dds xbm

常见问题

问题解决方案
”API key not configured”检查 MCP 配置中的 env.SOMARK_API_KEY,或使用 set_api_key 工具手动设置
连接失败确认 API Key 有效,且 somark.tech 可正常访问
不支持的文件格式参考上方支持的文件格式列表