初步实现了 PDF 文本查重和图像查重。