<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Document-Parsing on Liuji's Blog</title><link>https://liuji.cc/tags/document-parsing/</link><description>Recent content in Document-Parsing on Liuji's Blog</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sun, 21 Jun 2026 12:00:00 +0800</lastBuildDate><atom:link href="https://liuji.cc/tags/document-parsing/index.xml" rel="self" type="application/rss+xml"/><item><title>同样的答案，省 95% token：这个工具把喂给大模型的内容先"榨干"</title><link>https://liuji.cc/posts/2026-06-21-liteparse-v2/</link><pubDate>Sun, 21 Jun 2026 12:00:00 +0800</pubDate><guid>https://liuji.cc/posts/2026-06-21-liteparse-v2/</guid><description>PDF 格式天生不是给机器读的，它是给打印机读的。你的 AI 知识库每天生产垃圾，而你很可能根本不知道。liteparse 用 Rust 从空间维度重建文档解析，可能是 RAG 领域最被低估的开源突破。</description></item><item><title>企业花了几百万建 AI 知识库，结果 AI 在一本正经地胡说——根源在这里</title><link>https://liuji.cc/posts/2026-05-31-liteparse/</link><pubDate>Sun, 31 May 2026 12:00:00 +0800</pubDate><guid>https://liuji.cc/posts/2026-05-31-liteparse/</guid><description>PDF 格式天生不是给机器读的，它是给打印机读的。你的 AI 知识库每天生产垃圾，而你很可能根本不知道。liteparse 用 Rust 从空间维度重建文档解析，可能是 RAG 领域最被低估的开源突破。</description></item></channel></rss>