Binyang
前些天,尝试用 ollama + 本地 qwen3.5:4b 模型来翻译一本电子书PDF。翻译的时间不是问题,但是最后生成的排版效果不好。我想实现双语上下排版,模型先把PDF转换为markdown,然后再翻译,生成一份新的PDF。新PDF中的英文,中文排版,阅读起来很费劲,不舒服。
我去查了一下这个问题,发现PDF文字排版确实不好做。不同的书籍,不同的内容有自己合适的表现形式,PDF排版应该需要专门去调整和优化,这个成本太高了。
最后,我发现HTML是最合适的,排版很容易做到美观,而且我的目标只是翻译和阅读舒服。按照这个方案,之后找个时间,我再继续完善一下,用它来辅助自己阅读英文书。