让你省去手动翻页查找的麻烦,无论本地还是网络PDF都能轻松读取!

帮你把Excel、PDF、PPT、Word等文件快速转换成Markdown格式

拆分PDF文件为多个独立的PDF文件。支持两种拆分模式。 拆分模式说明: 1. pages模式(每页一个文件): - 默认拆分所有页,每页生成一个独立PDF文件 - 如果指定ranges参数,则只拆分指定范围内的页面,每页仍然生成独立文件 - 示例:ranges=["1-5"] → 生成5个文件(第1页.pdf, 第2页.pdf, ..., 第5页.pdf) - 示例:ranges=["1-3", "7-10"] → 生成7个文件(第1、2、3、7、8、9、10页各一个) 2. ranges模式(按范围合并): - 必须指定ranges参数 - 每个范围表达式生成一个PDF文件,包含该范围内的所有页面 - 示例:ranges=["1-5"] → 生成1个文件(包含第1-5页) - 示例:ranges=["1-3", "7-10"] → 生成2个文件(一个包含第1-3页,另一个包含第7-10页) Args: input_path: 输入PDF文件路径 output_dir: 输出目录路径 split_mode: 拆分模式,可选值: - "pages": 每页一个文件模式 - "ranges": 按范围合并模式(默认) ranges: 页面范围列表,格式示例: - ["1-5"]: 第1页到第5页 - ["1", "3", "5"]: 第1、3、5页 - ["1-3", "7-10"]: 第1-3页和第7-10页 - None: 仅在pages模式下,表示拆分所有页 prefix: 输出文件名前缀,默认使用输入文件名 Returns: 拆分结果的详细信息,包括生成的文件列表、总页数等 示例: # 拆分所有页,每页一个文件 split_pdf_file("document.pdf", "./output", split_mode="pages") # 只拆分第1-5页,每页一个文件(生成5个PDF) split_pdf_file("document.pdf", "./output", split_mode="pages", ranges=["1-5"]) # 拆分成2个文件:一个包含第1-5页,另一个包含第10-15页 split_pdf_file("document.pdf", "./output", split_mode="ranges", ranges=["1-5", "10-15"])

裁剪图片。支持多种模式: 1) 相对裁剪(推荐): 使用top/bottom/left/right参数裁掉指定边缘,支持像素值或百分比(如'10%') 示例: {top:100, bottom:50} 裁掉上边100px和下边50px 2) 居中裁剪: 指定size自动居中 3) 智能裁剪: 保留重要内容区域 4) 手动裁剪: 指定起始坐标和尺寸 ⚠️ 重要规则: - 当用户说'裁掉上部分/下部分/左边/右边'但未指定具体数值时,你必须先询问用户要裁掉多少像素或百分比 - 不要猜测或使用默认值,必须获得用户明确的数值后才能调用此工具 - 询问示例: '请问要裁掉上边多少像素?或者百分比(如10%)?'